UniProt accession
A0AAE7VSK7 [UniProt]
Protein name
Lateral tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
TF
Evidence RBPdetect
Probability 0,66
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MAITKIILQQMVTMDQNSITASKYPKYTIVLGNTISSITAAELTSAIESSKASAAAAKTSETNAKQSELNAKGSENEAKISATSSQQSATQSASSATASANSAGAAKTSETNAKASETAAKTSETNAKASETAAKTSETHAKASETAAAASASAAKTSETNAAASASAAKTSETNANNSKTAAANSANAAKTSETNAKTSETNAAASATRAESVASGMRDSIGLGNSARDCPDISGNPSAYIGFMRIREGVPGWPSIANGEAYLTGVISVNDGSPSYTGIFHGWNTRSLYTYRWSSSLGPQWTRHARKDEVDRLVQGSGESAIWGAGRKQKLVLWDGGTGATMDWGVYDEAGAKWIPLGVGRGGTGATTAAGARTNLQLNRFQRSSDTRTIVCSTDVQADGCYLQVDAGGQWGAFNPKTGRWQPLAIAQGGTGGVTAEDARTNLGLGHSSSPTFGHLQLLTENDSTQASSGILSQFLRDTSGAQRARSRIYSEIRGDNKAWLTLHLQSDANTNKYAGLSIDGNFQINGNFIGNAISLSDVVTSKVNLQVNRFVQATGETDVVNHAGTAQIFITDNKNWGAYDTELRRHIALPITQGGTGGLSISEAKTNLQIPSVGAGDWMEIAAPAGVEAGKYYPIVINAQHAGLYLSGFFIDIQTRSSGGGDPMNCCTFNGFIRTGGWSDRKDAGYGYYNRYDSSERALKCILVSAKDSEDNIAVYVEGRAFPVKMRIPKFCTATAVASAHTHGQVTFAWGTPNPGPDSVGVRTLFDFSLNRVGFYQATTEGNYYIGNGERIVLSNGMNVGDELSLTAPKITFSGTVAAGNGFTADGTSVSNATFYSRYRVGNTVYGAEFLASENAAQVIVRDPADTSHQFFNFNLNGTFSPPNGLLTSTGTDWNGQKNTINKFYGIAGSDNAPENAIYGGIHVGFSGNYATQFAGRNSKFWVRSIEAGENKEWLKLITATLAPKIPTDARDGFISDASADTSWAPSNGGGFQSCYAENRIMQSWVDNVGRLYSRFLTTNQPTAPKTDVPWKSAAMLELDNRFTGNNTFLGNLESTRDITCARLFSKGALQTESGGIELYHSTPFIDFHFNKATSDYTARIINDAANQLTFDCQSVRTLHDFTAYGLVRGCNRDAFVAWPISDPSASNGQIRLAPKFQSRFNSVGSNASGAARMSMWFEEHVGSNHRGVVEVSGYGSSTQYWHFRNDGAIWSSVKGDVAWAGTSDLRYKDNVVDYDGLQSLENIKAMNLIKFTYKDDDRKRERRGVAAQQIMEIDPCYVKKSEGSYIDANGEQVNIEKLVLDTNPLLMDALCAIKVLSAQVGELKEENTALRAGTASREEQVTALESEVSDLKKQIADLTLVVNSLLANKAQ
Physico‐chemical
properties
protein length:1374 AA
molecular weight: 146662,34140 Da
isoelectric point:6,24049
aromaticity:0,08443
hydropathy:-0,37897

Domains

Domains [InterPro]
DC_0401
STR
134–589
IPR030392
CHP
1226–1330
A0AAE7VSK7
1 1374
Architecture
ATT
STR
ATT 2-169 | STR 170-1374
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage HildyBeyeler
[NCBI]
2852005 Uroviricota > Caudoviricetes > Demerecviridae > Tequintavirus > Tequintavirus hildybeyeler
Host Escherichia coli K-12
[NCBI]
83333 Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Escherichia

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QXV80034.1 [NCBI]
Genbank nucleotide accession
MZ501074 [NCBI]
CDS location
range 21590 -> 25714
strand +
CDS
ATGGCTATAACTAAAATAATTTTACAGCAAATGGTCACTATGGACCAGAATAGCATAACTGCTAGTAAGTATCCTAAGTATACTATAGTTCTGGGGAACACAATTAGCTCTATTACTGCTGCAGAACTAACCTCTGCTATAGAGTCTTCTAAAGCATCTGCAGCAGCAGCAAAAACCTCAGAAACTAATGCTAAGCAGTCAGAGTTAAATGCTAAAGGTTCTGAGAATGAGGCAAAAATTTCCGCAACATCTTCTCAACAATCTGCAACTCAGTCAGCTTCTTCTGCTACTGCTTCCGCTAACAGTGCTGGAGCTGCAAAAACTTCAGAAACCAATGCAAAAGCTAGTGAGACAGCTGCAAAAACTTCAGAAACCAATGCAAAAGCTAGTGAGACAGCTGCTAAAACTTCAGAAACCCATGCAAAAGCTAGTGAGACTGCTGCAGCTGCCTCAGCCTCCGCAGCAAAAACCTCAGAAACTAATGCTGCTGCATCTGCTTCTGCTGCTAAAACTTCAGAAACTAATGCTAATAATAGTAAAACTGCTGCTGCTAACAGTGCTAATGCTGCTAAAACCTCAGAAACTAATGCTAAAACATCAGAAACTAATGCGGCTGCTTCTGCCACAAGAGCTGAAAGTGTAGCTTCTGGTATGCGAGATTCTATAGGCCTGGGTAATTCAGCTCGTGATTGCCCAGATATTTCTGGTAATCCTTCTGCATACATTGGTTTTATGCGTATTCGTGAAGGTGTGCCTGGGTGGCCTTCTATTGCTAATGGGGAGGCGTATTTAACTGGTGTTATTTCTGTTAATGACGGTTCTCCTTCCTACACTGGTATTTTTCATGGGTGGAATACTAGGTCACTTTATACGTATAGATGGTCCTCAAGTCTAGGTCCACAATGGACACGTCATGCTAGAAAAGATGAAGTTGATCGCCTTGTGCAAGGTTCGGGAGAATCTGCTATATGGGGTGCAGGCCGTAAACAAAAACTTGTTCTATGGGATGGTGGCACAGGTGCAACAATGGATTGGGGTGTCTATGACGAAGCCGGAGCAAAGTGGATCCCACTGGGGGTTGGTAGAGGGGGTACTGGTGCTACTACAGCAGCAGGAGCACGCACTAATTTACAACTAAACCGCTTCCAACGTTCTAGTGATACAAGAACCATCGTTTGCTCAACAGATGTTCAGGCGGATGGCTGTTACTTACAGGTTGATGCTGGTGGTCAGTGGGGCGCATTTAACCCTAAAACTGGTAGATGGCAACCTCTCGCAATAGCTCAGGGGGGCACTGGAGGAGTTACCGCCGAGGACGCTCGTACAAATCTAGGACTAGGGCACAGCAGTTCTCCAACGTTTGGGCATTTACAGCTTCTTACTGAAAATGACTCTACACAAGCCTCTTCCGGAATACTTAGTCAGTTCCTACGAGATACTTCTGGAGCACAGAGAGCTCGTAGTAGGATTTACTCAGAAATACGTGGAGATAATAAAGCTTGGTTGACACTACACCTACAATCTGATGCTAATACTAATAAATATGCTGGCTTAAGTATTGACGGTAATTTCCAGATAAACGGTAACTTTATTGGTAATGCTATAAGTTTATCGGATGTAGTCACTTCTAAAGTAAATCTACAGGTAAATAGGTTCGTACAGGCTACAGGTGAAACAGATGTAGTAAACCATGCCGGTACAGCGCAAATTTTTATTACAGATAATAAAAATTGGGGGGCGTATGATACAGAATTAAGAAGACATATAGCTCTACCTATAACTCAGGGTGGTACTGGAGGCTTATCTATATCTGAGGCCAAAACAAATCTTCAGATACCTTCTGTAGGTGCTGGAGATTGGATGGAAATTGCAGCTCCTGCTGGTGTTGAAGCTGGGAAATATTACCCAATTGTAATTAACGCACAACATGCGGGTTTATATCTCTCTGGTTTCTTTATAGATATACAAACTAGAAGCTCCGGCGGGGGAGATCCTATGAACTGTTGTACGTTTAACGGGTTCATAAGAACAGGTGGTTGGTCGGATAGGAAAGACGCTGGCTATGGATACTATAACAGATATGATTCTAGTGAGCGTGCTTTAAAATGCATATTGGTATCCGCTAAGGATTCTGAAGACAATATAGCTGTATATGTAGAAGGTAGAGCATTCCCGGTGAAAATGCGCATACCTAAATTTTGCACAGCTACGGCGGTTGCTTCAGCTCATACGCATGGTCAAGTCACATTTGCCTGGGGTACACCCAATCCTGGTCCAGATTCAGTTGGGGTAAGGACTCTATTTGATTTCTCTTTAAATAGAGTTGGTTTCTACCAAGCAACAACAGAAGGAAACTATTACATAGGAAATGGTGAGCGTATAGTTCTTTCTAATGGTATGAATGTGGGGGATGAACTAAGCTTAACCGCACCTAAGATTACTTTTAGTGGTACAGTGGCAGCTGGTAATGGTTTTACTGCAGATGGTACATCTGTATCCAATGCTACTTTTTATAGTCGTTATCGTGTCGGGAATACTGTTTACGGTGCGGAGTTCCTGGCCAGTGAGAATGCAGCCCAAGTTATTGTCAGAGATCCGGCTGATACTAGCCATCAATTCTTTAACTTTAACCTCAACGGAACATTCAGTCCCCCAAATGGTTTATTGACTTCCACTGGTACGGACTGGAATGGGCAAAAGAATACTATCAATAAATTCTATGGGATTGCAGGAAGTGACAATGCTCCGGAAAATGCTATATATGGTGGTATCCATGTAGGGTTTAGCGGTAATTATGCTACCCAATTTGCTGGCCGTAACTCCAAGTTTTGGGTAAGAAGTATTGAAGCGGGAGAAAATAAAGAATGGTTAAAGCTTATTACTGCTACATTAGCTCCTAAAATTCCTACGGATGCACGGGATGGTTTCATCAGTGATGCTTCTGCGGATACCTCTTGGGCACCTAGCAACGGTGGTGGTTTTCAGTCTTGTTATGCCGAAAACCGCATTATGCAGAGCTGGGTTGATAATGTTGGAAGACTCTACAGTAGATTTCTAACAACTAATCAGCCTACAGCCCCAAAAACGGATGTTCCCTGGAAAAGTGCTGCGATGCTAGAGCTGGATAACCGCTTTACTGGTAATAATACTTTTCTTGGTAATCTTGAATCGACCAGGGATATAACTTGCGCAAGGTTGTTTAGTAAGGGGGCATTACAGACAGAAAGCGGAGGAATTGAGCTTTATCATTCCACACCATTTATTGACTTTCACTTTAATAAGGCAACAAGCGACTACACGGCAAGGATTATCAACGACGCTGCTAATCAGCTAACTTTTGATTGTCAAAGTGTGCGTACGTTGCATGACTTCACAGCGTATGGACTTGTAAGGGGTTGTAACCGTGATGCATTCGTTGCATGGCCCATTAGCGATCCGTCTGCCAGCAATGGTCAGATTAGGCTTGCGCCTAAGTTCCAATCTCGATTTAATAGCGTAGGATCGAACGCATCTGGAGCTGCAAGAATGTCTATGTGGTTTGAGGAGCATGTTGGCTCTAACCATCGTGGTGTTGTAGAAGTCAGCGGCTATGGCTCTTCGACTCAATACTGGCACTTTAGAAATGATGGTGCTATCTGGAGTTCCGTTAAGGGGGACGTTGCGTGGGCTGGAACTTCTGATTTACGTTACAAAGATAACGTGGTTGATTACGATGGCTTGCAGTCCTTAGAAAACATCAAGGCGATGAACTTGATCAAGTTTACTTACAAGGATGATGATCGCAAGCGTGAGCGTCGAGGTGTTGCAGCACAGCAAATCATGGAAATTGATCCTTGCTATGTCAAAAAGAGCGAAGGCTCTTACATTGACGCCAACGGTGAGCAAGTAAACATTGAAAAACTTGTGTTAGATACAAATCCGCTTTTGATGGATGCTCTTTGTGCAATCAAGGTGCTATCGGCCCAAGTAGGGGAGTTGAAAGAGGAAAATACTGCCTTACGTGCTGGCACCGCTAGCAGGGAGGAGCAAGTCACAGCCCTAGAATCAGAAGTATCTGATCTTAAAAAGCAAATTGCAGACCTAACGTTAGTGGTTAATTCTCTACTAGCAAATAAGGCACAGTAA

Genome Context

Genome Context

Gene Ontology

Description Category Evidence (source)
GO:0098015 virus tail Cellular Component IEA:UniProtKB-KW (UniProt)

Tertiary structure

PDB ID
e1b79777924c6baecdec3127bc85604bf2446065e054066794ae718c433f9e70
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5388
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50