Genbank accession
XHY54301.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence GenBank
Probability 1,00
TF
Evidence RBPdetect2
Probability 0,95
Protein sequence
MYSIKTDLDITGAGTVGKDLLVKGNAVFNNNLTVNGTVTFANATFTAIESSTANITSTLDVGGKATLSGGLGVDGNTTIGSAVVGSDTATINSNATFNGTVSVGSDFTQTAGTTTLQATKVKNLEVAETTAFKGNITADVGTTAAFDKITANTAEITNVSTTDISSTGTATFKDVTISGTLGGEFNLSDLNAVTLNVTGASNQQGAVTFGANVTGINSTATFKDIRIGSNSESQTFRLSFPYTAPGKRPTVILQNEIQSELMSPANLTVLTSASFGNASLSSYGITGNGLNKLDYLTVSGNNTQSPDTPLLEVQKGKTKVADFEVTGTATIPNIESTGTANFNNINISGVLGGTFQLDDINAVTLNVTGATSLVGGVTLGSNITGYNSTATFKAISLGQNSQDAAVKLGFGYTAPGQRPTVILPNEVQSEVVSPSTLNVLKTATFGNASLSSYGITGNGLNKLDYLTVSGNETQAPDTPLLEVQKGKTKVADFEVTGTATIPNIESTGTANFNNINISGVLGGTFQLDDINAASLNVTGATSLVGGVTLGSNITGYNSTASFKAISLGQSSQDSAVKLGFGYTAPSQRPTVILPNEVQSELVSPSTLNVLKTATFGNAALSTYGITGNGLNKLDYLTITGNATQDPSTPFLQVGGKAILNDVDFTGTVTGLTVDVSGQDLTPNSVVAATNIKGATLESTGNTTVGAKLTVTGDIAGTTATLSGALSAGSVSSGSITGTTSVSAPTISASTEVTAPTITASGTVSGQTINGTNISATTLTAPTISGNTNFTENVDITGNLTVTGTVTPGTIDLSTTDVSAKSITTTAGANIGGDLVVQGSFDLSAADINVKSLTSSGIVKSNDLVNANVLPVLNSTTITATTVNADDITVTGSANLGTIYSSSSVLVGSTLTVTGETTTASLVTPTISNASGVTISNNTNVTGDLTVTGAVIPGSIDLATTDVNAKSITTTAGATIGGNLTVNGTVDLTTADVTVKSLTSTGAIVSNESTISSVLPKLQSTDATIATLGSTTANITNLNVTGASTVADVTSSGKVKAVSVETPTISNVDGVSISNNTSITGDLTVSGTVTPGAIDLSTTDVSAKSITTTAGANIGGDLVVSGTVDLSGADVSVKSLTSTGIITVSSAEGINVLPKVQSTEVTVSALNATNAVVSGDVSAATASISGAITGGSATLSGVGTALNVTNNATVGGVLTVGSITSAAENVSITKNTAITGNLAVSGTLTAGVIDLSTTDVSVKTLTSLGDATVQGNLTVDGSIDLSSANIVGVTLESTGSTTVGTDLILTTGNITGSPSISGNLGVTGTTTLTGATTVSNTLSTGGKLTVNTGGIQVVDGGIQVDAGTITAPSANISGDSTLNSATVTTTLGVTGAASMNGGLTASTLDVTGDSTVQKLTVKGAFIPEGGLDLSGADLNVNSVTAATTLSVTGASTLTGGVSTSTVTASGKVTAQELSTGTLAVTTNGTVGGTLDVTGKATVGSLDSGAISATSGTFSTTLGVTGAATFGNNVNITGTLTPGALDLSSTDVDANSLSVATTLHSNGNATIGGTLGVTGAATAPSIALNGEGTALAVTNNATIGGTLGVTGKATVGSLDSGAVSATSGTFSTTIDVTGAATFGNNVNITGTLTPGALDLASTDVVANSLSVATTLHSDGNATIGGTLGVTGAATAPSIALNGEGTALAVTNNATIGGTLGVTGAATLGSLTTSGAVKTGSNVIIGTKIGEQPETVQIFPNTYIAGSLRVDGGINADIDVSGQTIEPYAVVAADTISAAGNITSGAELISKSATIGDVGSQNNNLTINGNVVNNGNFTVTGVLNATLNQANSDVAVKSLTATNSVAAGTSITAGTSITATGLLKGNTLEVTTTGSFGGAVTMSSGANITGTVGITSGNLTVGGDISATGTATLAATSVTTITTSGAATLASASVTGAATIGGTLTVTGLMTANGSVVLGDAAADTLTVNATSSFKENAVFDKDVTVTGQLTTTNADLTTTTVTTKKYDVIPNQVTSSVIAPTGTWTPDGTSNVYFITLDQDTTLAPITGLIGGGKASSVYIYVKQDTTGNRNFTTDGTYAVVDGTLNKTAGSVTIYQVIYDGVSPVADMFIAQRTA
Physico‐chemical
properties
protein length:2129 AA
molecular weight: 208682,72560 Da
isoelectric point:4,16837
aromaticity:0,03100
hydropathy:0,21954

Domains

Domains [InterPro]
DC_0092
STR
307–501
XHY54301.1
1 2129
Architecture
STR
STR
STR
RBD
STR 118-1034 | STR 1061-1370 | STR 1439-1632 | RBD 1738-2129
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage JP4
[NCBI]
3349802 Viruses >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
XHY54301.1 [NCBI]
Genbank nucleotide accession
PQ330092.1 [NCBI]
CDS location
range 291232 -> 297621
strand -
CDS
ATGTACTCAATAAAAACTGACTTAGATATTACTGGTGCTGGTACGGTTGGTAAGGATCTTTTAGTCAAAGGAAATGCTGTTTTCAATAATAACCTAACTGTAAATGGTACTGTAACTTTTGCAAATGCAACTTTTACTGCCATTGAATCATCAACTGCCAACATTACATCTACTTTAGATGTTGGTGGCAAAGCAACACTTTCTGGTGGTCTTGGTGTTGATGGTAATACTACAATCGGTAGTGCAGTTGTCGGGTCTGATACAGCAACAATTAATTCAAACGCTACCTTTAACGGTACTGTATCAGTTGGTTCTGATTTTACACAAACTGCTGGTACAACCACTCTACAAGCAACTAAAGTTAAAAACTTAGAAGTTGCTGAAACAACAGCATTTAAAGGTAATATTACTGCTGATGTTGGTACTACTGCTGCATTTGATAAAATTACTGCTAATACCGCAGAAATTACTAATGTAAGTACAACCGATATTAGTAGTACTGGTACTGCTACATTTAAAGATGTGACAATTAGTGGTACACTTGGTGGTGAGTTTAATCTATCTGACTTAAATGCAGTAACATTGAACGTTACTGGTGCATCTAACCAACAAGGTGCAGTAACTTTCGGTGCTAACGTAACTGGTATTAACAGTACTGCTACTTTTAAAGACATTCGTATTGGTTCTAACTCTGAATCACAAACCTTCAGATTAAGCTTCCCTTACACTGCTCCAGGTAAACGTCCAACTGTAATTCTACAAAACGAAATTCAGTCCGAGTTAATGTCACCTGCAAACTTAACAGTTTTGACATCTGCTTCTTTTGGTAATGCGTCATTATCTTCTTATGGTATTACTGGTAATGGTCTAAACAAATTAGATTATCTAACAGTTTCTGGTAACAATACACAATCACCAGACACCCCACTATTAGAAGTTCAAAAAGGAAAAACCAAAGTTGCCGATTTTGAAGTTACAGGAACCGCAACTATACCAAATATTGAAAGTACTGGAACTGCTAATTTTAATAATATTAATATTTCTGGTGTTCTTGGTGGAACATTCCAACTAGATGATATTAATGCAGTAACATTGAACGTTACTGGGGCCACTTCGTTAGTTGGTGGTGTTACTCTTGGTTCTAATATTACTGGTTATAATAGTACTGCTACCTTTAAAGCTATTAGCTTAGGTCAAAATAGTCAAGATGCAGCAGTGAAACTAGGTTTTGGATATACTGCACCCGGTCAACGCCCAACAGTTATTCTACCTAATGAAGTTCAATCAGAAGTAGTTTCTCCTTCTACATTGAACGTTCTTAAAACTGCAACTTTTGGTAATGCGTCATTATCGTCTTATGGCATTACTGGTAATGGCCTAAACAAATTAGATTATCTAACAGTTTCTGGTAACGAAACACAAGCTCCAGATACACCACTATTAGAAGTTCAAAAAGGAAAAACCAAAGTTGCTGACTTTGAAGTCACCGGAACTGCAACTATACCAAATATTGAAAGTACTGGAACTGCTAATTTTAATAATATTAATATTTCTGGTGTTCTTGGTGGAACATTCCAATTAGACGATATTAATGCAGCATCTTTGAACGTTACTGGTGCAACTTCATTAGTTGGTGGTGTTACTCTTGGTTCTAATATTACTGGTTATAACAGTACTGCATCATTTAAAGCTATCAGCTTAGGCCAAAGTAGTCAAGATTCTGCTGTAAAACTTGGATTTGGATATACTGCACCAAGTCAACGTCCAACCGTGATTTTACCTAACGAAGTTCAATCAGAATTAGTTTCTCCTTCAACACTGAACGTTCTAAAAACGGCAACTTTTGGTAATGCTGCACTTTCTACGTATGGTATTACTGGTAATGGCCTAAACAAATTAGATTACCTAACCATTACAGGTAACGCAACACAAGACCCTAGTACACCATTCCTACAAGTTGGTGGTAAAGCAATTCTTAATGATGTCGATTTTACTGGCACCGTAACTGGGTTAACTGTTGATGTAAGTGGTCAGGATCTAACACCAAACTCAGTTGTTGCTGCGACAAATATTAAAGGTGCAACCCTTGAAAGTACTGGTAACACTACCGTGGGTGCTAAACTAACTGTTACTGGTGATATTGCTGGTACAACTGCAACTCTTTCTGGTGCATTATCCGCTGGTTCAGTAAGTTCTGGTTCTATTACTGGTACAACTTCTGTATCTGCACCAACAATTAGTGCATCTACTGAAGTAACGGCTCCTACTATCACTGCGAGTGGAACTGTAAGTGGACAAACAATTAACGGTACTAATATTAGTGCAACAACTCTGACTGCACCAACTATTAGTGGTAATACTAACTTCACAGAAAATGTTGATATTACTGGAAATCTAACAGTTACTGGTACAGTAACCCCAGGTACAATTGATTTGAGTACTACTGATGTTAGTGCGAAATCAATCACTACTACCGCTGGTGCAAATATTGGTGGAGATCTTGTGGTTCAAGGTTCTTTTGATTTATCAGCAGCAGACATTAACGTTAAATCACTAACTTCTTCTGGTATTGTTAAAAGTAATGACCTTGTTAATGCTAACGTACTTCCTGTACTTAATAGTACTACCATAACGGCAACTACTGTTAATGCTGATGATATAACTGTTACCGGATCTGCTAATTTGGGTACAATTTACTCAAGCTCATCTGTTCTAGTTGGGTCAACTTTAACTGTAACTGGTGAAACTACAACTGCATCGTTGGTTACCCCAACCATTTCAAATGCAAGTGGTGTCACTATTTCCAATAATACAAATGTAACTGGTGACCTAACCGTTACTGGTGCAGTTATTCCAGGCTCTATCGATCTAGCAACAACTGATGTTAATGCTAAATCCATTACTACTACTGCTGGTGCAACTATTGGTGGTAACCTAACTGTTAATGGTACAGTAGATCTTACTACTGCTGATGTTACTGTCAAATCTTTAACTAGTACTGGTGCAATTGTTAGTAATGAATCTACAATTAGTAGTGTTCTACCTAAACTTCAAAGTACTGATGCAACTATTGCAACCCTTGGTTCAACAACTGCAAATATTACTAATTTGAATGTTACTGGTGCATCTACCGTAGCTGACGTAACTTCTTCAGGTAAAGTTAAAGCAGTTTCTGTAGAAACCCCAACAATTAGTAACGTTGATGGTGTATCTATTTCCAATAATACATCTATTACTGGTGACCTAACAGTTTCTGGTACAGTAACACCAGGTGCAATTGATTTGAGCACAACTGATGTAAGTGCAAAATCCATTACTACTACCGCTGGAGCAAATATTGGTGGAGATCTTGTTGTTTCTGGTACAGTTGATTTAAGTGGTGCTGATGTATCTGTTAAATCTCTAACAAGTACTGGTATTATTACAGTTAGTAGTGCAGAAGGTATCAACGTTCTACCTAAAGTTCAAAGTACTGAAGTTACAGTGTCTGCTCTAAATGCAACAAATGCAGTAGTTTCTGGTGATGTTTCAGCAGCAACAGCTTCAATCTCAGGTGCAATTACTGGTGGGTCAGCAACACTATCTGGTGTTGGAACTGCTCTAAATGTAACTAATAACGCAACTGTTGGTGGTGTACTTACTGTTGGTTCTATTACTTCAGCGGCAGAAAATGTATCCATTACTAAAAATACCGCGATTACTGGTAATTTAGCAGTATCTGGAACACTAACTGCGGGTGTTATTGATCTTAGCACAACTGATGTGTCTGTGAAGACATTAACTTCTCTAGGTGATGCAACCGTTCAAGGTAACTTAACTGTTGATGGTTCTATTGACCTAAGTTCTGCAAACATCGTCGGTGTAACACTAGAAAGTACTGGCTCTACCACTGTAGGTACTGATTTGATTCTAACTACAGGTAACATTACAGGTAGTCCATCTATTTCTGGTAACTTGGGCGTTACTGGAACCACAACGTTAACTGGTGCAACTACAGTTTCAAACACATTGTCAACTGGTGGTAAACTAACAGTTAATACTGGTGGTATTCAAGTAGTTGATGGTGGTATTCAAGTTGATGCAGGAACTATTACCGCACCAAGTGCTAATATTTCTGGTGACTCTACCCTTAATAGTGCAACTGTAACTACTACCCTTGGTGTTACTGGTGCAGCTAGTATGAATGGTGGCCTTACAGCATCTACTCTAGATGTAACTGGTGACAGTACTGTACAAAAACTAACTGTTAAGGGTGCATTTATTCCTGAAGGTGGTTTGGACCTATCCGGTGCTGATCTTAACGTGAATAGCGTAACTGCTGCAACCACATTAAGTGTTACTGGTGCAAGTACTCTAACTGGTGGTGTTTCCACTTCAACTGTTACTGCATCCGGTAAGGTAACTGCACAAGAATTAAGTACTGGTACATTGGCAGTAACCACAAATGGAACAGTTGGTGGTACTTTAGATGTAACTGGAAAGGCAACAGTCGGTTCACTAGATTCAGGTGCAATATCTGCAACTTCTGGTACATTTAGTACTACACTAGGTGTAACAGGTGCAGCAACATTTGGTAACAATGTTAATATTACTGGCACGTTAACCCCAGGTGCATTGGATTTATCTAGTACTGATGTAGATGCTAACAGTCTTTCTGTTGCAACAACCCTACATTCAAACGGCAATGCAACAATCGGTGGTACACTAGGTGTAACTGGTGCAGCAACTGCTCCATCAATCGCTCTTAATGGTGAAGGAACTGCATTAGCAGTTACTAACAATGCAACAATTGGTGGTACACTAGGTGTAACTGGAAAGGCAACTGTCGGTTCACTAGATTCAGGTGCGGTATCTGCAACTTCTGGTACATTTAGTACTACAATAGATGTAACTGGTGCAGCAACCTTTGGTAATAATGTTAACATTACTGGTACATTAACGCCAGGTGCATTGGATTTAGCTAGTACTGATGTAGTTGCAAACAGTCTTTCTGTTGCAACCACACTACATTCAGATGGTAATGCAACAATTGGTGGTACACTAGGTGTAACTGGTGCAGCAACTGCTCCATCAATCGCTCTTAATGGTGAAGGAACTGCATTAGCAGTTACTAACAATGCAACAATTGGTGGTACACTAGGTGTAACTGGTGCAGCAACTTTAGGTTCACTAACAACTTCTGGTGCAGTGAAAACTGGTTCTAATGTTATTATTGGTACTAAGATCGGTGAACAACCAGAAACAGTTCAGATTTTCCCTAACACTTACATTGCTGGTTCCTTGCGTGTAGATGGTGGTATCAACGCTGATATTGATGTTAGTGGTCAAACAATCGAACCTTATGCAGTTGTTGCGGCTGACACTATTAGTGCAGCGGGTAATATTACTTCTGGTGCAGAGTTGATTTCTAAATCAGCAACTATTGGTGATGTTGGTTCACAAAACAACAACTTAACAATCAATGGTAACGTAGTTAACAACGGTAACTTTACAGTAACTGGTGTTCTAAACGCAACACTAAACCAAGCAAACTCTGATGTAGCTGTTAAATCATTAACTGCAACCAACAGTGTTGCTGCTGGTACTAGCATTACCGCAGGTACAAGTATTACTGCAACTGGTCTGCTAAAAGGGAACACCCTTGAAGTAACTACTACTGGTTCATTTGGTGGTGCAGTAACAATGTCAAGTGGTGCTAACATTACTGGAACCGTTGGGATTACTTCTGGTAACCTAACTGTTGGTGGTGATATTTCTGCAACAGGTACTGCAACCCTAGCAGCAACTTCAGTAACTACTATTACTACTTCTGGTGCAGCAACACTTGCTAGTGCATCTGTTACTGGAGCAGCAACAATCGGTGGTACTTTAACTGTTACTGGATTAATGACTGCAAATGGTAGTGTTGTTTTAGGTGACGCGGCTGCTGATACATTAACTGTCAATGCAACATCTTCTTTCAAAGAAAATGCAGTATTTGATAAAGATGTAACTGTAACTGGTCAATTAACAACTACTAATGCTGACTTGACTACTACAACAGTAACTACTAAAAAATATGATGTTATTCCTAATCAAGTAACTTCTTCTGTTATCGCACCAACTGGTACTTGGACCCCAGACGGTACTAGCAACGTATACTTTATCACTCTAGATCAAGATACAACTCTAGCACCAATCACTGGTCTAATCGGCGGTGGTAAAGCATCTTCAGTATACATTTATGTGAAACAAGATACAACAGGTAATAGAAACTTTACTACTGACGGTACTTATGCGGTTGTTGATGGAACTCTAAACAAAACTGCTGGTAGTGTGACCATTTACCAAGTCATTTATGACGGTGTGAGTCCAGTAGCAGATATGTTTATTGCACAACGTACAGCTTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
3fa929015450165ed6dfbf84ee2da523a5b470398a6f049a6d4c6509097479d2
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,4742
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Characterization of a novel jumbo phage JP4 with potential to control drug-resistant pathogenic Escherichia coli Zhang,K., Wei,X., He,B., Liao,J., Wang,J., Le,S. and Lu,S. 2025-11-25 GenBank