Protein

View in Explore

Genbank accession

XRA40385.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,84

Evidence RBPdetect2

Probability 0,74

Protein sequence

MADIKVVRIESLPATTAVTEDDYLVVQQPDLTRRVKIGDVVHIDGTVSHVISFKEGGKLNGPMDFAYFEEEDLYLRWKGEFPHTVPALSSPYADGGITDAAWMVYTDPSLREELESTIGASMIMTAEGQSVQDVMDVTVQTANDAKALAQRVDFGTVHTVGDVIHLVNFVGPAVIEEGRTTNYPSEAAGEKFLNGVVSRRDTTTVDGIFRGATSGAMYTIAVTNGVATTKRIALRDEFKRLEANNPTRTVIRAGDDLNTAGYLQLDATGRWGMWNQQTASWQPLAIEQGGTGARDAAGVRINIGAFYKQRAALEANFNINNLTGNQDGIYYQPMTANATEANGYPAGSGAGHLIVWQNNANGGTGCRQEYYPFSNVDVWYLRTYQANTNQWTAWQPMVRPRNDDTFRSHIGLGKNNSPAFGNLYLAQYSGDVKNASGILHGDKYDADGVLEHGYRIYSEVRNDNKAWLTIHLHKGAKGSETHRYLGFREDGVLDCPKYMQVGDLTGQLTNWGLGEWIRSSGAERGFWGSKKAAKMVVWDGGMDESGNGTLEWGVYNNRKAKWEPLPHAAGGTGVTTLAEAQNLFKVPAAAGVKDFLTLPRTAGMEDGKYYPIIVRTDPYYAPTTGTDITLVTRSSSGGDPMNCSTLQCHYRTGGWTDRGDSFYGVVNFYQNEKALLGMVAPTRGKQEYVAFYAEARAFPVSVYASRNVVEVFTREQDYQVGPVTDNQDGVKFVAPLQSADLNLAVLGDNITNTRPIVDFKGTSGFYTGGGTQWHYIGTAERYAVMSKMNMPKVELWADGIDYLCYGSPRKALFSNAGFQCASDGTEDLTNGTFTSKCGNGAGLKGQAEFRSTPEAGQVIVRDVVGTAHRFYNFNKDGTFSAPGGFVCHTGGDWNNQFGPNNPSKIMAGNVNGPEGSMVVGGLSVAFSGNYAFQMAGRLDQLYTRSIEGGNHRAWNKVIQHRGQGLGVNDLNDYKGDREGFYHQEANAQATPDRNYPCSRAGTLIVYRNYANVPESCVQEYISYLGEKFLRYGTTIGSVFTWGPWQQLGGKGITLKTAGSNLDPEFMIHTGGGTDVTNTSNMPSNTGRMYYWGNGADRKNVLEFQINDNATSASWVWHCGAKTDEAKSRYLAVNGVVECTAVSQSSDRDLKDNIEVIPNALEAIRKMKGYTYTLKENGMPHAGVIAQEVMEALPEAVGSFVKRKEVPGPTQDGIPLMTEERFYNVDYAAVTGLLVQVCREQDDRITSLEEQVKKLTEVVTELQGKLK

Physico‐chemical properties

protein length:	1266 AA
molecular weight:	138629,02910 Da
isoelectric point:	5,58627
aromaticity:	0,10111
hydropathy:	-0,42836

Domains

Domains [InterPro]

DC_1918
ATT
1–443

DC_1918 DC_1330

G3DSA:2.10.10.80
ATT
47–117

G3DSA:2.10.10.80 cd19958 cd19958 IPR030392

IPR040775
RBD
50–103

IPR040775 IPR030392 Coil

XRA40385.1

1 1266

Architecture

ATT

STR

ATT 1-443 | STR 561-1266

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1918	ATT	DC_1918	1	443	Novel HMM	DC_1918	N-terminal	Low	Positional only	107 proteins / 107 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	47	117	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR040775	RBD	DC_0821	50	103	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
cd19958	STR	DC_0464	310	395	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_1330	STR	DC_1330	561	1266	Novel HMM	DC_1330	Central	Low	Positional only	62 proteins / 62 hits
cd19958	STR	DC_0464	961	1047	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
IPR030392	CHP	DC_0088	1145	1251	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1145	1196	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1237	1264	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XRA40385.1

1 1266

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	236	236	0,9513
Central domain	237	435	200	0,1933
C-terminal	436	1266	830	0,7631

Note: Constraints were applied during segmentation.
Fixed 15 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-236

Central
237-435

C-terminal
436-1266

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage EPFV3-03/2025 [NCBI]	3413927	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XRA40385.1 [NCBI]

Genbank nucleotide accession

PV435126.1 [NCBI]

CDS location

range 4030 -> 7830
strand +

CDS

ATGGCTGATATTAAAGTTGTCAGAATTGAATCTCTTCCTGCCACTACTGCAGTGACAGAGGATGATTACCTGGTTGTTCAACAACCAGACCTGACCCGTCGTGTAAAAATTGGCGATGTTGTCCATATAGATGGGACTGTTTCTCATGTAATCTCCTTTAAGGAAGGTGGTAAGTTAAACGGCCCAATGGATTTTGCCTACTTCGAAGAGGAAGACCTCTACCTGCGTTGGAAAGGCGAATTTCCACACACTGTTCCTGCACTATCTTCACCATACGCTGATGGTGGGATTACCGATGCTGCATGGATGGTATATACAGACCCTTCCTTGAGAGAGGAGCTGGAGTCTACCATTGGCGCATCTATGATCATGACAGCCGAAGGGCAGTCTGTACAGGATGTAATGGATGTTACTGTTCAGACAGCCAACGATGCCAAAGCACTTGCACAGCGGGTAGATTTTGGTACAGTGCATACTGTAGGTGATGTTATTCACCTTGTCAACTTTGTTGGTCCTGCAGTTATTGAAGAGGGAAGAACTACTAACTACCCTTCTGAAGCAGCTGGTGAAAAATTTCTGAACGGTGTGGTATCTCGTCGTGATACTACAACTGTTGATGGTATTTTCCGTGGCGCTACCTCCGGAGCCATGTATACCATTGCAGTAACCAATGGTGTGGCAACAACAAAAAGAATAGCACTTCGTGATGAATTTAAGCGCCTGGAGGCAAACAACCCAACAAGAACAGTTATCCGTGCCGGGGATGATTTAAACACGGCGGGGTACTTGCAGCTTGATGCAACAGGCCGTTGGGGTATGTGGAACCAGCAAACAGCTTCGTGGCAACCTCTTGCTATAGAGCAAGGCGGTACAGGAGCCAGAGATGCCGCTGGAGTCCGTATCAATATCGGTGCTTTCTATAAGCAACGTGCAGCCCTTGAGGCAAATTTCAATATCAATAACTTGACTGGTAATCAGGACGGCATATACTATCAACCGATGACTGCTAATGCAACTGAGGCAAATGGTTATCCTGCAGGTTCTGGTGCTGGTCACTTGATTGTTTGGCAGAACAATGCTAACGGTGGCACAGGCTGTCGTCAGGAATACTATCCATTCTCTAACGTGGATGTTTGGTATTTGAGAACCTATCAGGCCAACACAAACCAATGGACTGCATGGCAGCCGATGGTCAGACCTCGGAATGATGACACCTTCAGATCTCATATCGGCCTTGGTAAAAACAACTCCCCTGCTTTCGGGAACCTTTACTTAGCTCAATACTCAGGAGATGTTAAAAATGCTTCAGGTATTCTCCATGGAGATAAATATGACGCTGATGGTGTTCTTGAGCACGGTTATAGGATCTACTCAGAAGTAAGAAACGACAATAAGGCTTGGTTAACAATCCACCTTCACAAAGGCGCAAAAGGATCTGAAACTCATAGGTATTTAGGCTTCCGTGAGGATGGGGTATTAGACTGTCCTAAATACATGCAGGTTGGGGATCTTACTGGTCAGCTGACAAACTGGGGACTTGGAGAATGGATTCGTAGTTCAGGGGCAGAAAGAGGGTTCTGGGGTTCCAAGAAAGCTGCTAAGATGGTCGTCTGGGATGGAGGGATGGATGAGTCCGGTAACGGCACTTTGGAATGGGGTGTTTATAACAACCGGAAGGCCAAGTGGGAACCTTTACCTCACGCCGCAGGTGGTACTGGGGTTACAACTTTAGCAGAGGCTCAGAATCTGTTCAAAGTTCCTGCGGCTGCAGGTGTAAAAGATTTCTTAACACTGCCAAGAACCGCAGGGATGGAAGATGGGAAATATTACCCAATCATCGTTAGGACAGATCCGTACTATGCTCCGACCACAGGGACAGATATCACCCTAGTTACCAGATCGTCATCTGGCGGTGACCCTATGAACTGTTCTACACTACAGTGCCACTATAGGACTGGCGGTTGGACAGATAGAGGAGACTCTTTCTACGGGGTAGTAAATTTCTACCAAAATGAAAAAGCACTTCTTGGAATGGTTGCTCCAACAAGGGGTAAACAAGAGTATGTTGCTTTCTATGCAGAGGCGCGCGCTTTCCCTGTCAGCGTATACGCAAGTAGAAATGTTGTCGAAGTGTTTACCAGAGAACAAGATTACCAAGTCGGCCCTGTAACAGATAATCAGGATGGTGTTAAGTTTGTTGCACCTCTCCAGTCAGCTGACTTGAATCTTGCTGTTCTTGGAGATAACATTACTAACACCAGGCCTATTGTTGACTTCAAAGGCACCTCTGGGTTCTACACTGGTGGCGGCACACAGTGGCACTATATAGGCACTGCTGAACGCTATGCTGTGATGAGCAAAATGAATATGCCAAAAGTCGAGCTGTGGGCAGACGGTATTGACTATTTGTGCTACGGCAGTCCTAGAAAGGCATTATTCTCTAACGCTGGATTCCAGTGTGCATCGGACGGAACAGAGGATCTAACTAACGGCACGTTTACCTCTAAATGCGGTAATGGCGCTGGCCTTAAAGGCCAAGCAGAGTTCAGGTCTACTCCAGAAGCTGGTCAAGTTATTGTTCGAGATGTTGTGGGAACAGCTCATAGATTCTACAACTTCAACAAAGATGGTACTTTCTCAGCCCCAGGTGGTTTTGTATGCCATACTGGTGGAGACTGGAACAACCAGTTCGGGCCCAATAACCCGTCAAAAATAATGGCTGGCAACGTCAACGGACCAGAAGGTTCGATGGTTGTTGGTGGACTGTCTGTGGCTTTTTCTGGGAACTATGCTTTCCAAATGGCTGGTCGCCTTGATCAGTTATACACCAGGTCTATCGAGGGTGGTAACCATAGAGCGTGGAACAAGGTCATACAACACAGAGGGCAAGGTCTGGGGGTTAATGACCTTAACGACTATAAAGGGGATAGGGAAGGTTTTTATCATCAGGAGGCCAATGCTCAAGCCACACCTGATAGAAACTACCCATGCTCCCGAGCAGGTACGCTTATAGTGTATAGGAACTACGCCAATGTTCCAGAGAGTTGCGTACAGGAGTATATATCATATCTTGGGGAAAAATTCCTGCGTTATGGAACAACAATAGGTAGTGTTTTCACATGGGGACCTTGGCAGCAGCTTGGTGGTAAGGGAATTACTCTTAAAACCGCAGGCTCCAATCTTGACCCGGAGTTCATGATACATACAGGTGGCGGGACTGATGTTACCAACACTTCCAACATGCCTTCTAATACAGGCAGGATGTACTACTGGGGTAATGGCGCAGACAGGAAGAACGTGCTTGAGTTCCAGATAAACGACAACGCTACATCTGCCAGTTGGGTATGGCATTGTGGTGCTAAGACAGATGAGGCCAAGTCAAGGTACCTTGCTGTCAACGGCGTAGTAGAGTGCACCGCTGTCAGCCAGAGCTCTGACCGTGACCTGAAGGATAACATAGAGGTTATTCCTAACGCGCTGGAAGCTATCCGTAAGATGAAGGGCTATACCTACACTCTAAAAGAGAATGGTATGCCTCACGCGGGGGTAATTGCTCAAGAGGTCATGGAAGCATTACCTGAAGCTGTTGGCTCTTTCGTGAAAAGGAAAGAGGTTCCTGGTCCTACTCAAGATGGTATTCCTCTGATGACCGAGGAAAGATTCTATAATGTTGACTATGCGGCTGTAACAGGATTGCTTGTTCAGGTTTGCAGAGAACAAGATGATAGAATAACCTCCCTTGAGGAACAGGTTAAAAAACTAACAGAGGTTGTTACCGAGTTACAAGGAAAATTGAAGTAA

Genome Context

Tertiary structure

PDB ID

8d6fdee340676deb5a9dca72f5abe0aeefb167382e86025d28e1394b6d73133e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5487

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence