Genbank accession
WFG78407.1 [GenBank]
Protein name
long tail fiber protein distal subunit
RBP type
TSP
Evidence RBPdetect
Probability 0,90
Protein sequence
MATLKQIQFKRSKTAGQLPAASVLAEGELAINLKDKAIFTKDDSGNVIELGLKYGGTIDGSLTVNGNITGTLIGNSSTATKLQTPRKINGISFDGSKDITLTPSDINVNSTTFIKNNGELPVDANLDEYGPVEEYLGVWSKSTSTNAQPANKFPEENAVGVLEVFVAGQFAGTQRYTVRSGNVYVRSLSAKWNGVNGPWGVWRNVQASTRPLSQTIDLDSLGELEHCGLWRNSSSAIASFDRHYPEEGSAAQGFLEIFEGGLYTRTQRYTTRMGMVYTRCLAAAWDASAPKWEEWKQVGHGTPATFYDGDLNDFKTPGLYNILGTDAVINCPTGEGLPAVIVGLLEVKQRASGGAIFQKFTTAGTGETTRDRIFERAYTGGAWGAWNEVYTSYSLPITLGMGGIKAQLSELDWQTFDFVPGSMFSVPLNKIKNMPANMDWGTIDGNLVMFSVGPSEHTGTGRTVQVWRGTVSQTNYRYFVVRIAGNPGNRTNTCRRVVLEDGSHTWTAQQNFRGLLNITADINLGANKKISIAPGAYIQGPASGSGSNTYANQNTTIAPLYQAIDDSNKNQFAPIVKQKNTVTNITMASGMDIASSEYRIIAQGDLSATGTTANELATWRFLPSGRFMSQSRVYAGAAFLNTDGNIAGSIWKKYNDATNLDAALNTRVGKSGDIMTGRLTIQSPGDSIVLSAPASNSLHIRGDVDGTGNWYIGKGGDDNGLAFYSYATNAGVYITNAGDITLSPKGVEMAHVNNIRLYVHGERWTASQPGDWGNQWRVEAPIFVDHGYVGSDSYYPIIKGRSVVTNQGFVTAVDLGIRRVPNNWGQAIIRVGSAEASPAAGHPNAVFEFHYDGTFYSPGNGNFNDVYIRSDGRLKINKEELENGALEKVCRLKVYTYDKVKSIKDRSVIKREVGIIAQDLEKELPEAVSKVEVDGSDVLTISNSAVNALLIKAIQEMSEEIKELKTPFFTKIARKISNYFKF
Physico‐chemical
properties
protein length:982 AA
molecular weight: 106683,30700 Da
isoelectric point:6,64677
aromaticity:0,09470
hydropathy:-0,30387

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage vB_VIPECOOM03
[NCBI]
3034280 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
WFG78407.1 [NCBI]
Genbank nucleotide accession
OQ721911 [NCBI]
CDS location
range 155201 -> 158149
strand +
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACCGCAGGTCAACTTCCTGCTGCTTCAGTATTAGCCGAAGGTGAATTGGCTATTAATTTAAAAGATAAAGCAATTTTCACAAAAGATGATTCAGGCAATGTTATAGAATTAGGTTTAAAATATGGAGGAACAATTGATGGTTCTTTAACTGTTAATGGAAATATAACTGGAACTTTAATTGGAAATTCTAGCACAGCTACTAAATTGCAAACACCTAGGAAAATTAATGGTATATCCTTTGATGGGTCAAAAGATATCACGCTAACTCCATCTGACATAAATGTCAATAGCACAACGTTTATAAAAAATAACGGCGAATTACCGGTTGATGCTAATTTAGATGAGTATGGGCCTGTTGAAGAATATCTTGGGGTTTGGTCGAAATCTACTTCAACAAATGCGCAACCGGCAAATAAATTCCCAGAAGAAAATGCCGTAGGTGTACTAGAAGTATTTGTGGCCGGTCAATTTGCTGGTACTCAGAGATATACTGTAAGATCTGGTAACGTATATGTTCGATCTTTGTCTGCTAAATGGAACGGTGTTAACGGTCCGTGGGGAGTTTGGCGTAATGTTCAAGCGTCAACTCGTCCACTTTCACAAACGATTGACCTTGATAGCTTGGGAGAATTAGAACATTGCGGCTTATGGCGAAATAGTTCAAGTGCTATTGCATCATTTGATCGCCATTATCCAGAAGAAGGATCAGCCGCACAAGGATTTTTAGAAATATTTGAAGGTGGTTTATACACGAGAACGCAGCGATATACTACCCGCATGGGTATGGTTTATACTCGTTGTCTCGCTGCCGCATGGGATGCTAGCGCACCCAAGTGGGAGGAATGGAAGCAGGTTGGTCATGGCACACCAGCGACTTTTTATGATGGAGATCTGAATGATTTTAAAACTCCTGGGTTATATAATATTTTAGGCACTGATGCCGTTATTAATTGCCCTACAGGTGAAGGTTTACCAGCCGTTATTGTTGGTTTGCTAGAAGTTAAACAGCGTGCTTCTGGTGGTGCTATTTTCCAAAAATTTACTACTGCCGGAACGGGTGAAACTACTCGCGATCGTATTTTTGAGCGTGCATATACTGGTGGTGCGTGGGGTGCATGGAACGAAGTATATACATCTTATTCTCTGCCAATTACTTTGGGTATGGGTGGTATTAAAGCTCAATTATCGGAGTTAGATTGGCAAACCTTTGATTTTGTTCCTGGTAGTATGTTTAGCGTTCCTTTGAACAAAATAAAGAATATGCCAGCAAATATGGATTGGGGCACGATTGATGGAAACCTGGTTATGTTTTCCGTTGGTCCTAGCGAACATACTGGCACAGGACGTACTGTTCAGGTTTGGCGTGGTACTGTATCCCAGACAAACTACCGTTATTTTGTTGTGCGTATAGCTGGAAATCCAGGAAACAGGACTAACACTTGTCGCCGTGTTGTTCTTGAAGACGGATCACATACTTGGACTGCTCAACAAAACTTTAGGGGATTGCTAAATATCACCGCTGATATTAATCTTGGTGCTAATAAGAAAATTTCAATTGCTCCGGGAGCATATATTCAAGGCCCTGCTAGCGGTTCTGGTTCAAATACTTACGCAAATCAGAATACTACTATTGCGCCATTATATCAGGCCATTGACGATTCAAATAAAAACCAGTTTGCTCCTATTGTAAAACAGAAAAACACTGTAACAAATATTACTATGGCTTCTGGTATGGATATTGCTAGTTCAGAATATCGTATCATTGCTCAAGGTGATTTATCCGCTACTGGAACTACAGCTAATGAATTAGCTACATGGCGTTTCTTGCCGTCTGGCCGATTCATGTCACAAAGTCGAGTTTATGCTGGCGCAGCATTCTTGAACACTGATGGTAACATTGCTGGTTCAATCTGGAAGAAATACAACGATGCAACCAACTTAGACGCTGCTTTGAATACTCGCGTAGGTAAAAGCGGTGATATTATGACCGGACGCTTGACAATTCAAAGCCCAGGTGATTCTATTGTATTATCAGCACCTGCTAGTAATTCTTTGCATATTCGTGGTGACGTAGACGGGACTGGTAACTGGTATATTGGTAAGGGTGGTGATGATAATGGATTAGCGTTCTATAGTTATGCTACTAATGCTGGTGTATACATTACAAACGCAGGAGATATCACGCTAAGTCCAAAAGGCGTCGAAATGGCTCATGTCAATAACATTCGATTATATGTTCATGGTGAACGTTGGACCGCTAGTCAACCAGGTGATTGGGGCAACCAATGGCGAGTAGAAGCGCCAATATTCGTCGATCATGGTTATGTTGGATCAGATAGCTATTATCCAATTATTAAAGGAAGAAGTGTAGTCACCAATCAAGGGTTTGTAACTGCCGTCGATCTTGGTATTCGTCGTGTCCCTAATAATTGGGGACAAGCAATTATTCGTGTTGGATCTGCGGAGGCATCGCCAGCGGCTGGACACCCTAACGCGGTATTTGAATTTCATTACGACGGTACTTTCTATTCTCCTGGTAATGGTAACTTTAACGATGTGTATATTCGTTCCGATGGTCGACTTAAGATCAATAAAGAAGAGTTAGAAAACGGAGCACTTGAAAAAGTATGCCGACTGAAGGTTTATACATACGATAAGGTTAAGTCTATTAAAGATCGTAGTGTTATTAAACGTGAAGTTGGTATTATTGCTCAGGATCTTGAAAAAGAATTACCGGAAGCTGTGTCTAAAGTTGAAGTTGATGGATCTGATGTTCTGACAATTTCTAACTCCGCTGTGAATGCTCTTTTAATTAAGGCTATCCAAGAAATGAGCGAAGAAATTAAAGAATTAAAAACGCCTTTCTTCACTAAAATTGCTCGCAAAATTAGTAATTATTTTAAATTCTAA

Tertiary structure

PDB ID
0f2dd5efb26711a9685b4d5065ba44702b97c1c189e2ff58992cd92761109e2c
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,6650
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50