Protein

View in Explore

Genbank accession

AFC21413.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,81

Protein sequence

MFPIPSLFLLMAGGGTTPLPPGGVKKIAFSREQTSGVKRSMAILLTDGRLYTQGDNAWGECADGTTSPFYDHWKLAASNVADVFGVGKAFVVKYNSGGWQYAGDQGQFTGSTSNMMAWTSFPSSITGTVNLANLVSVVGGGGNTLWIMSNGTLYGSGPNANGCLGSGNSNPIPTPRTISTSCIRAFGLNACVTYLNNVGVPRVCGSTYGINGSFTPITSFASVTFPGATGTIYAKEWMCNEDNTIAIASAGASDTDHYLYTRGITTNNATYTKVSGFGPFTTFRVLDGGQSRFFIADDALYALGDSQRNLGLGDTTTSVTVPTVIPVPTGADWDLSKLTFVAEMKGDNMSQGATLGHWMVYDGNLFYTGSPKGFFGSTTIVGKFTNVPENSFEGIRADSITTGSIGVAIVGTTKQLTWSIDPPGAEIYDLQFSSSHPEFATIDANGLMTFVAEGGFDITMTAKTGTSATTLTDTSGGYVSTLGMATDSLSAMTVGETKQLVYTVTPAGVENLDGYSITFSSEDPAVATVSPTGLITAVADGGTRIHATAAVQTVTADDSSYLSVNAP

Physico‐chemical properties

protein length:	567 AA
molecular weight:	58976,14640 Da
isoelectric point:	4,64456
aromaticity:	0,09877
hydropathy:	0,03245

Domains

Domains [InterPro]

DC_0065
STR
1–534

DC_0065

IPR009091
STR
24–335

IPR009091 G3DSA:2.60.40.1080 IPR003343

IPR009091
STR
40–410

IPR009091 G3DSA:2.60.40.1080

IPR003343
STR
396–472

IPR003343 IPR008964

IPR003343
STR
409–472

IPR003343 IPR003343

IPR008964
RBD
409–469

IPR008964

AFC21413.1

1 567

Architecture

STR

STR 1-564 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0065	STR	DC_0065	1	534	Novel HMM	DC_0065	Central	Low	Positional only	140 proteins / 140 hits
IPR009091	STR	IPR009091	24	335	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
IPR009091	STR	IPR009091	40	410	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	395	474	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR003343	STR	DC_0008	396	472	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
IPR003343	STR	DC_0008	409	472	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
IPR008964	RBD	IPR008964	409	469	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
IPR003343	STR	DC_0008	479	559	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	479	564	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR008964	RBD	IPR008964	491	549	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
IPR003343	STR	DC_0008	492	551	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AFC21413.1

1 567

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	26	26	0,0005
Central domain	27	237	212	0,6097
C-terminal	238	567	329	0,1024

Note: Constraints were applied during segmentation.
Fixed 54 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-26

Central
27-237

C-terminal
238-567

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cronobacter phage vB_CsaM_GAP31 [NCBI]	1141135	Uroviricota > Caudoviricetes > Vequintavirinae > Seunavirus GAP31 >
Host	Cronobacter sakazakii [NCBI]	28141	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

AFC21413.1 [NCBI]

Genbank nucleotide accession

JN882284 [NCBI]

CDS location

range 126763 -> 128466
strand +

CDS

ATGTTTCCTATTCCAAGCCTGTTCCTGCTAATGGCAGGTGGTGGTACAACACCACTGCCTCCTGGCGGGGTGAAAAAGATCGCTTTCTCCAGAGAACAAACGTCTGGTGTAAAAAGATCTATGGCTATTCTTCTAACAGACGGAAGACTCTACACCCAAGGTGATAATGCCTGGGGTGAATGTGCAGATGGGACGACAAGCCCATTCTATGATCATTGGAAACTTGCTGCAAGCAATGTAGCAGATGTTTTCGGTGTTGGAAAGGCTTTTGTAGTAAAATACAATAGCGGGGGCTGGCAATACGCTGGTGACCAAGGCCAGTTCACAGGCTCAACGTCTAATATGATGGCATGGACAAGCTTCCCGTCTTCAATTACGGGCACTGTTAATCTGGCGAATCTTGTTAGTGTGGTTGGTGGGGGTGGTAATACCCTTTGGATCATGAGTAACGGAACCCTCTACGGGAGTGGTCCTAATGCAAACGGATGCCTTGGGTCGGGCAACTCAAACCCTATCCCAACACCACGCACAATCAGCACCTCTTGCATACGTGCTTTTGGTCTTAATGCTTGCGTAACCTACCTCAATAACGTAGGTGTTCCTCGTGTTTGCGGGTCTACTTACGGTATCAATGGCTCATTTACACCAATCACCAGTTTCGCAAGTGTAACATTCCCAGGGGCCACCGGAACAATCTATGCAAAAGAGTGGATGTGCAACGAAGACAACACGATTGCGATTGCCTCTGCTGGTGCGTCTGATACCGATCATTATCTGTATACTCGTGGCATCACAACAAACAACGCAACGTACACAAAAGTTAGCGGATTCGGTCCATTCACAACATTCCGTGTCCTGGATGGTGGTCAGTCGAGATTCTTTATTGCTGACGATGCTCTGTATGCGTTGGGGGATTCGCAGAGAAACCTCGGACTTGGAGACACCACCACTTCGGTTACAGTCCCTACTGTGATTCCTGTTCCTACTGGCGCAGATTGGGATCTTAGCAAGTTGACTTTTGTTGCCGAAATGAAGGGCGATAACATGTCTCAAGGCGCGACACTTGGACACTGGATGGTTTATGACGGTAACCTGTTCTATACGGGTAGTCCAAAAGGCTTCTTTGGCAGTACAACAATTGTAGGAAAATTCACAAACGTGCCAGAAAACTCCTTCGAAGGTATACGTGCCGACTCTATCACCACAGGGTCTATCGGCGTGGCGATTGTTGGTACTACTAAACAGCTTACGTGGTCTATCGACCCACCTGGTGCTGAAATCTATGACCTACAGTTTAGCTCAAGCCATCCAGAGTTTGCAACAATTGATGCGAATGGTCTTATGACCTTCGTTGCTGAGGGTGGTTTTGATATCACCATGACAGCGAAGACAGGGACAAGTGCAACAACCTTGACAGATACTTCAGGTGGTTATGTTTCAACACTTGGAATGGCTACTGATAGCCTTTCTGCGATGACTGTTGGTGAGACAAAACAGCTTGTTTATACGGTCACACCAGCGGGTGTTGAGAACTTGGATGGTTACTCGATCACCTTCTCCAGTGAAGATCCTGCGGTAGCAACCGTAAGCCCTACAGGACTGATTACCGCAGTTGCTGACGGAGGAACTCGTATCCACGCAACAGCAGCAGTTCAGACTGTAACAGCAGACGATAGCTCTTATCTGTCAGTGAACGCTCCATAA

Genome Context

Tertiary structure

PDB ID

eb6cdd7621d68104858388fc4a0a39d8454c046da2733bd57b7c3172b80d482d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8396

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence