Protein

View in Explore

Genbank accession

WWV91976.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,84

Evidence RBPdetect2

Probability 0,96

Protein sequence

MWYKTGTVTYKAGSALITGKNTLWADDKMGITPGDLVLISIADDNVMMAEIKTVNSNTEIELRTAFNKDSVTDTEYAIINTLNETIADFAKRISAAIAYFNKQAEGIQDLESRVQVALKQYYSKAEADGRYYTKAQSDNGYAAKISVYTKGESDSKYIPKGGNLQLTGNKVLDLGVGSGDIYLKNGATNKYLQLKDDGRLTYSDQDVYHTGRKPSLDELNAASQDIGKRYVIDTRGLNKDWFYPIQFNLDQTWNSTRLSIKSTARGGTDPFNQNSFIGFVQASGWSDTPQVVSGVLSVYDYNERTLGGIFAGSRDFYGFVVYVRGDNVYHIESQTPPILHKAQVSLGTAPNAAVFPVGPVTTPTNANLLVDLKTSTDSYICNRSITSSGNANIKDIVNVGNRIQLESKANNTLQLAIGDNDSGFGFRADGAVNLWSNSAVKGYFDPNKFVYYGVASTHADSFRAVYGNKGFIFRQDGANMYFLLSHTDGGWGGWTGHRPITINMTDGATSFGCPTHLNGATYYNSTQYWKRINGAGREANLRLWGSGARETVLEWGWEGLPYGMYLERNTGLANNQSKLSVNGQITGQVVNASDERLKHSVTKVDNALETVEKLNGYTFMYNGSDVPSAGVIAQELLGVYDNAVFVGNNPNDEEDEEDYYTVDYNQLHALHIEAIKELSAQNRQLKADNETLRTTLELLQSNVKGLIDERVQVLEMKLDALYNDKMNGVSTEAPPINNEETP

Physico‐chemical properties

protein length:	742 AA
molecular weight:	81764,77140 Da
isoelectric point:	5,16362
aromaticity:	0,10108
hydropathy:	-0,45229

Domains

Domains [InterPro]

DC_0589
STR
16–725

DC_0589

IPR048390
ATT
454–502

IPR048390 IPR030392 Coil

IPR030392
CHP
593–689

IPR030392

WWV91976.1

1 742

Architecture

STR

ATT

STR

STR 16-453 | ATT 454-502 | STR 503-725 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0589	STR	DC_0589	16	725	Novel HMM	DC_0589	Central	Low	Positional only	3 proteins / 3 hits
IPR048390	ATT	DC_0836	454	502	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
IPR030392	CHP	DC_0088	593	644	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	593	689	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	675	709	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WWV91976.1

1 742

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	211	211	0,8288
Central domain	212	410	200	0,5527
C-terminal	411	742	331	0,8758

Note: Constraints were applied during segmentation.
Fixed 3 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-211

Central
212-410

C-terminal
411-742

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage PJNS034 [NCBI]	3126091	No lineage information
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WWV91976.1 [NCBI]

Genbank nucleotide accession

PP391266.1 [NCBI]

CDS location

range 21928 -> 24156
strand -

CDS

ATGTGGTATAAAACTGGTACGGTAACGTACAAGGCAGGTTCAGCCTTAATCACTGGTAAAAATACCTTGTGGGCTGATGATAAGATGGGAATCACTCCGGGTGACTTGGTGTTGATTTCTATTGCTGACGATAATGTCATGATGGCAGAGATTAAGACTGTCAACTCCAACACAGAGATTGAACTTCGTACCGCTTTCAACAAAGACAGTGTGACTGATACGGAGTATGCAATTATCAACACACTGAATGAAACAATTGCTGACTTTGCTAAACGTATCTCAGCAGCTATTGCATATTTCAACAAGCAAGCGGAAGGGATTCAAGACCTAGAATCACGAGTACAGGTAGCTCTCAAACAATACTATTCAAAAGCAGAAGCTGATGGTCGATACTACACTAAAGCTCAGTCAGATAATGGATATGCGGCTAAGATTAGTGTTTATACCAAAGGTGAATCTGACAGTAAGTACATCCCGAAGGGTGGGAACCTACAACTAACTGGTAATAAAGTTCTTGACCTTGGCGTTGGTTCTGGTGACATTTATCTGAAGAATGGTGCAACCAATAAGTACCTTCAACTAAAAGATGATGGGCGCCTTACTTACAGTGACCAAGATGTGTACCATACAGGCCGTAAACCTTCTCTTGATGAATTGAATGCTGCTTCTCAGGACATTGGTAAACGGTATGTAATTGATACCCGTGGATTGAATAAAGACTGGTTCTATCCAATCCAGTTTAACCTTGACCAAACTTGGAACTCTACTCGACTGAGTATCAAATCTACAGCTCGTGGCGGTACTGACCCCTTCAACCAGAACTCATTTATTGGTTTTGTACAAGCATCTGGTTGGTCTGATACACCTCAAGTAGTTTCCGGTGTTTTGTCAGTCTACGATTATAATGAACGTACACTTGGTGGCATTTTCGCTGGTAGCAGGGATTTTTACGGTTTTGTAGTTTATGTCCGTGGAGATAATGTATACCACATTGAGTCTCAGACTCCACCAATTCTGCATAAAGCTCAAGTATCGTTGGGAACTGCCCCTAATGCTGCTGTATTTCCTGTCGGCCCTGTAACAACTCCAACCAATGCCAACTTGTTAGTTGACCTGAAGACTTCTACAGATAGTTACATCTGCAACCGTAGCATTACATCTTCAGGTAATGCAAACATCAAGGACATTGTGAATGTTGGGAATCGAATCCAACTTGAGAGCAAAGCTAACAACACCTTACAGTTAGCTATTGGCGATAATGACTCAGGTTTTGGCTTCCGAGCAGATGGTGCAGTAAACCTCTGGTCAAACAGTGCAGTTAAAGGTTACTTCGACCCTAACAAGTTTGTGTATTACGGTGTAGCTTCGACCCATGCTGACTCATTCCGAGCTGTCTACGGTAACAAAGGTTTCATATTCCGTCAGGATGGTGCAAACATGTACTTCCTGTTATCTCATACAGATGGCGGCTGGGGAGGCTGGACAGGGCATCGTCCTATCACTATCAATATGACCGACGGTGCTACCTCTTTTGGTTGTCCTACGCATTTGAATGGTGCAACTTACTACAACTCTACTCAATACTGGAAACGTATTAATGGTGCTGGTCGTGAGGCTAACCTTCGTTTGTGGGGCTCTGGTGCTCGTGAGACTGTTCTGGAATGGGGTTGGGAAGGTCTTCCCTACGGCATGTATCTGGAGCGTAATACAGGTCTGGCAAATAACCAATCTAAGTTATCTGTGAATGGTCAGATTACTGGTCAGGTTGTTAATGCCTCGGATGAACGTCTCAAACACAGTGTTACAAAGGTTGATAATGCCTTGGAAACTGTAGAGAAGCTGAATGGTTATACGTTCATGTATAACGGTTCCGATGTACCAAGTGCAGGCGTTATTGCTCAGGAATTGCTTGGAGTATATGACAATGCCGTCTTCGTTGGGAACAATCCAAATGACGAAGAGGATGAAGAGGACTATTACACTGTAGATTACAACCAGCTACATGCTTTGCACATCGAGGCTATCAAGGAACTTTCTGCTCAGAACCGACAACTCAAAGCCGACAATGAGACACTCAGGACGACCTTAGAGCTGTTACAGAGTAATGTGAAGGGGCTGATTGACGAACGAGTCCAAGTGCTTGAGATGAAGCTGGATGCGTTGTATAATGACAAGATGAATGGAGTCTCTACGGAGGCTCCTCCTATCAACAACGAGGAGACTCCATAA

Genome Context

Tertiary structure

PDB ID

8ae89fb93f2fff9cca994c28b03b912edcd68418849af7884da41c5723255e1a

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6464

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence