Protein

View in Explore

Genbank accession

YP_009011741.1 [GenBank]

Protein name

tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,81

Evidence RBPdetect2

Probability 0,96

Evidence UniProt/TrEMBL

Probability 1,00

Protein sequence

MADLKLGTQIGGNLVWHQGILELNPVDDKLFYRDQEIMTTRGYQTMLGSIKFGTPNDVYDIESMSDGPGNVKRYLRKMRSGASSTIWHETINDRFYAISTGVTDTAPQFTLYNGDSATFQYPVYTNSPQSTLANSLARKDYVDAIDAKNVDKSGDVMDGILNFSGNNVNGINFNAYINTGVFAGNGDGASIDKANMQIRSWQGIGFSPTVIGDENRLVKAGENSIWFNLRNGDMTTVGNMYVGKNQQVYSPINKPAPGDLNAYNKQEIDEKHWIRVRDERTGMTQPGDHVAGVMAAYFTNLSDVTNNWVSGFTVKGWSDTYATWSIFAGSQADNDTNRLWFKHGRSTWLPSSRIYHELDKPTNNELNLVSRAGDTMTGNLTMSVGTSVGSSPLNCLYFDSSDGAGMNNANLRIKSWFGVGFGPTVDTGAVKNGQNSIWFNVRTGDMTTVGNMFVGGGSHQVYSPINKPNHNDVGATQRKSGNSDISADIKYTKICAMQANIGANGNSGSFILTGGNSIGWNTVPIYNISMNTRGYSGTGPHTDGMIRITLLEGPPQATFYAVTNGSHVELWMERPTYSGQMSISVLNDYGLAISMEDGVMPAGDKTRIDVSKVYTSKEKPTNNDLNLVSRAGDTMSGALTIKNAAPQMIFHESETDKKYMFVSDGTEVRLNEDKTDGRLIWQYQPAFDSIRLYKPEVGDDGMGTKATSLATKQYVDQKVGTAVQSVTATGAVKSTGGINPVISLTNATNASDGAMSASDKAKLDGIPSAAVNKTGDGMTGNLTFTNNSELVWSRNTDWAKIGFKNDSDADTDSYMWFETGDNKNEYFKFRMHNTTGPKHEVLDIKLEGSTFAHDVILAAREVGANELTFTNDPVEYKGNTGIERIIGGVFSQWYDDNLVFGHIRSGGKPSAGFGVRLNDKYIMRVSPTGAVSADSFLITGAQSSDASASTRKDYVDTKVAKAGDTMTGTLAIRKDSASSLCLNLSNETDGWTWINFGASNASGAKSCHVAWNTTAYDGANANAFHIRPAGDTAMSFSTTTVRSHKLLSAANNFTVIQTAPYMELHKPGAIAFSWNISADNRLMLSQTNGSGVAHQDILGINANNNTISINANPWSKTSSRAYASVYAQNAPLTVDFGAGPGTSDYYPIIKGSQVVTNQGYTTAATFGILRSGANRWGDASITVGNGESATGPIQYYLFGSDGTTTLPGKVVMKDHLSIQGVSPTILFQDQDHLSAFCHINSNLFYILRSSGANGTGWDGGPNGIHPMSLNLADGDVQFSRNGSFNDVQIRSDIRLKSNLIDIKGALDKVCSLTGKTFDKFGCDKREAGIIAQDLQKVLPEAVGSFKNTAGEEYLTVSNSGVNALLVEAIKELRAELNELKSKLN

Physico‐chemical properties

protein length:	1384 AA
molecular weight:	149507,53820 Da
isoelectric point:	5,79129
aromaticity:	0,08887
hydropathy:	-0,38447

Domains

Domains [InterPro]

DC_0505
ATT
1–352

DC_0505 DC_0361 DC_1293 DC_0933

IPR005601
STR
179–252

IPR005601 DC_0757 IPR030392

IPR030392
CHP
1291–1342

IPR030392 Coil

YP_009011741.1

1 1384

Architecture

ATT

STR

CHP

ATT 1-352 | STR 447-1084 | STR 1178-1371 | CHP 1372-1383 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0505	ATT	DC_0505	1	352	Novel HMM	DC_0505	N-terminal	Low	Positional only	41 proteins / 41 hits
IPR005601	STR	DC_0859	179	252	InterPro cluster	Tail fibre protein p36	Central	Low	Positional only	349 proteins / 351 hits
DC_0361	STR	DC_0361	447	682	Novel HMM	DC_0361	Central	Low	Positional only	7 proteins / 7 hits
DC_0757	STR	DC_0757	649	896	Novel HMM	DC_0757	Central	Low	Positional only	10 proteins / 10 hits
DC_1293	STR	DC_1293	848	1084	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
DC_0933	STR	DC_0933	1178	1371	Novel HMM	DC_0933	Central	Low	Positional only	31 proteins / 31 hits
IPR030392	CHP	DC_0088	1291	1383	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1291	1342	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1362	1382	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009011741.1

1 1384

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	161	161	0,1148
Central domain	162	360	200	0,3816
C-terminal	361	1384	1023	0,7686

Note: Constraints were applied during segmentation.
Fixed 160 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-161

Central
162-360

C-terminal
361-1384

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Aeromonas phage PX29 [NCBI]	926067	Uroviricota > Caudoviricetes > Pantevenvirales > Angelvirus > Angelvirus px29
Host	Aeromonas salmonicida [NCBI]	645	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Aeromonadales

Coding sequence (CDS)

Genbank protein accession

YP_009011741.1 [NCBI]

Genbank nucleotide accession

NC_023688.1 [NCBI]

CDS location

range 205148 -> 209302
strand +

CDS

ATGGCAGATTTAAAACTAGGTACGCAAATTGGCGGAAACTTAGTTTGGCATCAGGGGATTCTTGAACTGAATCCAGTTGATGATAAGCTATTTTATCGCGATCAAGAAATAATGACTACCAGAGGGTATCAGACTATGCTTGGTTCAATCAAGTTTGGTACTCCTAATGATGTCTATGACATCGAAAGCATGAGTGATGGTCCTGGTAACGTTAAGCGTTATTTGCGTAAAATGCGTTCCGGTGCATCATCTACAATTTGGCACGAAACTATCAATGATCGATTCTATGCAATCTCAACTGGTGTGACTGATACAGCACCACAATTTACATTGTATAATGGTGATAGTGCTACTTTTCAATATCCAGTTTACACAAATAGCCCACAATCTACATTAGCAAACAGTCTAGCTAGAAAGGATTACGTTGATGCGATAGACGCTAAAAATGTTGATAAATCCGGCGACGTTATGGATGGAATTTTAAACTTTTCTGGTAATAATGTTAATGGCATTAATTTCAATGCTTACATTAATACTGGTGTGTTTGCTGGTAATGGTGATGGCGCGTCTATTGACAAGGCAAACATGCAGATCAGATCGTGGCAAGGGATTGGATTTAGTCCTACTGTTATTGGTGATGAAAATAGACTGGTAAAGGCTGGAGAGAATAGTATTTGGTTTAACCTGCGCAATGGTGATATGACAACAGTTGGTAATATGTATGTTGGTAAAAATCAACAGGTATATAGTCCAATCAATAAACCAGCGCCTGGTGATTTGAATGCTTATAACAAGCAGGAAATTGATGAAAAGCATTGGATTAGAGTTAGAGATGAACGAACCGGAATGACTCAACCAGGTGATCATGTCGCTGGTGTAATGGCTGCTTATTTCACTAATCTTAGTGATGTCACTAATAACTGGGTTTCTGGATTTACGGTTAAAGGTTGGTCGGATACATACGCGACTTGGTCGATATTTGCTGGATCACAGGCAGACAATGACACAAATCGTTTGTGGTTTAAACATGGTAGATCTACATGGTTGCCGAGTTCGCGCATTTATCATGAACTAGATAAGCCAACAAATAACGAGTTGAACTTGGTATCAAGAGCTGGTGATACTATGACCGGTAATTTAACAATGTCAGTTGGGACTAGCGTTGGGTCATCGCCATTGAATTGTCTTTATTTTGATTCATCTGACGGTGCTGGGATGAACAACGCAAACTTACGAATCAAATCATGGTTTGGTGTTGGGTTTGGTCCGACAGTTGATACCGGCGCAGTAAAGAACGGTCAAAACAGTATTTGGTTTAACGTTCGTACTGGTGATATGACAACAGTTGGTAATATGTTTGTTGGTGGTGGCAGTCATCAAGTATATAGTCCAATTAATAAACCGAACCACAATGACGTCGGCGCGACACAACGCAAGAGTGGCAATAGTGATATTAGCGCAGATATAAAATACACAAAAATTTGTGCGATGCAAGCCAACATTGGCGCTAACGGTAATAGTGGTAGTTTCATTCTGACTGGTGGTAATAGTATCGGTTGGAACACTGTCCCAATATATAACATTTCGATGAATACTAGAGGGTATTCCGGTACTGGTCCTCATACGGATGGTATGATTCGTATTACTTTGTTGGAAGGGCCACCCCAAGCTACTTTCTACGCAGTCACGAATGGATCACACGTTGAGTTGTGGATGGAACGTCCGACATATAGCGGACAAATGTCTATCAGCGTTCTAAATGACTATGGTTTAGCGATAAGCATGGAAGATGGCGTTATGCCTGCTGGTGATAAAACTAGGATCGATGTATCCAAAGTTTATACCTCAAAAGAGAAACCAACCAATAATGATCTGAACTTGGTTTCAAGAGCAGGCGATACTATGTCTGGTGCATTGACTATTAAAAACGCCGCACCACAGATGATTTTTCATGAGAGTGAAACCGATAAGAAATATATGTTTGTTTCTGATGGTACAGAAGTCCGTCTAAATGAAGATAAAACTGATGGAAGACTTATTTGGCAATATCAACCGGCATTTGATTCAATTAGATTATACAAGCCAGAGGTTGGCGATGATGGCATGGGCACAAAAGCAACGTCGCTCGCAACCAAACAGTATGTGGATCAAAAAGTTGGTACTGCTGTTCAGTCTGTAACTGCTACTGGTGCAGTTAAGAGCACAGGTGGTATTAACCCAGTTATCAGTCTGACTAATGCTACCAATGCGAGCGATGGTGCTATGAGTGCATCTGATAAAGCTAAATTGGATGGCATCCCGAGTGCTGCTGTCAATAAGACTGGCGATGGTATGACTGGTAACTTGACATTCACTAATAATAGTGAATTGGTGTGGAGTCGAAATACAGACTGGGCAAAGATTGGATTCAAGAACGACTCGGACGCAGATACCGATAGCTATATGTGGTTTGAGACTGGTGATAATAAGAACGAGTATTTTAAGTTTAGGATGCACAACACAACTGGACCAAAACACGAAGTTCTGGATATCAAACTGGAAGGATCAACATTCGCACACGATGTTATTCTTGCTGCAAGAGAAGTTGGAGCAAACGAGCTTACATTTACCAATGATCCAGTTGAGTATAAAGGAAACACAGGAATAGAACGTATTATTGGTGGAGTATTCTCTCAGTGGTATGATGATAATCTTGTTTTCGGACACATTAGATCCGGTGGTAAACCTTCCGCGGGATTTGGAGTTAGACTGAATGACAAGTACATTATGCGAGTTTCTCCTACTGGAGCAGTTTCTGCCGATTCGTTCTTGATTACTGGTGCTCAATCCAGTGACGCAAGCGCAAGCACAAGAAAGGACTATGTTGATACCAAAGTAGCCAAAGCTGGAGATACAATGACAGGTACTCTCGCAATCAGAAAAGATAGTGCTAGTTCACTGTGTTTGAATCTATCAAATGAAACGGATGGATGGACTTGGATTAACTTTGGTGCTAGTAATGCGTCTGGCGCAAAATCCTGTCATGTTGCGTGGAATACAACTGCTTATGATGGAGCTAACGCAAATGCGTTTCACATTAGACCTGCCGGCGATACGGCGATGTCATTCAGCACAACTACAGTTAGATCGCATAAATTGCTATCCGCTGCAAATAACTTTACCGTTATTCAAACTGCACCATACATGGAACTTCATAAGCCCGGTGCAATTGCGTTTAGTTGGAACATTTCGGCCGATAATAGACTGATGTTGAGTCAAACAAACGGCAGCGGCGTTGCACATCAAGACATTCTTGGTATAAATGCCAACAATAATACAATTAGTATTAATGCAAACCCATGGTCAAAAACCAGTAGTCGTGCATATGCAAGTGTTTATGCACAGAATGCTCCATTAACAGTTGATTTTGGAGCTGGCCCAGGTACATCCGATTATTACCCAATAATCAAAGGATCACAAGTAGTAACGAACCAGGGATATACCACGGCAGCGACGTTTGGTATTCTTAGATCCGGAGCTAATAGATGGGGTGATGCATCAATCACAGTTGGCAACGGTGAGAGTGCGACTGGTCCAATACAATACTATTTGTTTGGTAGCGATGGGACAACGACACTTCCTGGTAAGGTTGTTATGAAAGATCATCTTTCTATTCAGGGAGTCAGTCCTACCATTTTGTTCCAAGATCAGGATCATCTTTCTGCTTTCTGTCACATAAACAGTAATTTGTTTTACATTTTGAGATCTTCGGGTGCCAACGGAACTGGTTGGGACGGCGGTCCAAATGGCATTCACCCAATGTCATTGAACTTGGCAGACGGTGATGTTCAATTTAGCCGAAACGGTAGCTTTAACGATGTTCAGATTCGTTCTGATATTAGATTGAAATCAAACTTAATCGATATCAAAGGCGCACTAGACAAAGTTTGTAGTCTAACTGGTAAAACATTTGATAAGTTTGGTTGTGATAAGCGTGAAGCTGGTATTATTGCGCAAGATCTACAGAAAGTATTACCAGAAGCTGTTGGTAGCTTTAAAAATACAGCCGGCGAAGAGTATCTAACTGTTTCTAACTCTGGCGTTAACGCGCTGTTGGTAGAAGCAATCAAAGAACTTAGAGCCGAGTTGAACGAACTTAAATCAAAACTTAACTAA

Genome Context

Tertiary structure

PDB ID

65b5d140bc9109f2330609aff0890e51db5d25fa664a101bcaa09166abfbe0b9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5124

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence