Genbank accession
QUD16575.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MEVHNNFSPLAFRKKESKATYEKWYAFGKNYAIPASANTLTPFQFTELNIPVFDPNTIEVEVINEETGEAKKSGVYVSFDVMPEHGGVLYVSPGKNSFREALPQGTYRARFSIGDQVYISTPFCVIPGIETSSKYLLIEYWNDEKIAYPGGFITTGANNDFRYQMYVPATICKPKYEFEEELTKRAGYKFLELQTSTKVYAFTFVAPEFICDAMRLIRLSDYIRISHDGEYYNALNFEFDVDWQEQLYLAAVDCQFETDSIIQKLPSFNRRDKASFYNALLANIDTPIMFSPDTVGLYYKEYRETEPVVKGKLIRELSPIDLIDENTTIAVDLGTGEARKFNLYRMLQDYISKSHEDATNFLLHLRGGATFGDDISGSAAHINSAGDARFNDVDADAVSADAVDVGSWLSVGNTAFTVSKSGKTDTGEFTARGKAYLTEDVYTGGGTGTITKDGQLKYLSAIIQQFLSSPTFVSGFLGEGFKIWVENGNWHIECDNLTVRQTMNIFELLIQKIRSVNGALVVSQSNGKLSEVKEVGEQYKLTTGEEFPTFQEGDLVRCQTFAGYQGAGLTFDFTQFAKFDYSGGSFDSSLVDVTPDSISFNLNDTGNSGFAFYKMQPSSETPIEMPSFILILEGAYPGMMAVATGLDSNDSPVESAGVLLKNGENVIPAITLSQGIHNFAITVVGDSGHGTGKVTVKQKRADGSAPSNSFVKFYWVEVKSVDGTSFFVDKSEFNGVVPAVGDEVVQMGNTKNPERQALIYITAQESGHPYIEILNGVKTKSLSGTNRTRLGDLSNIQDSAFPEGQQPSGSGLYCDNAFLRGIFLLRNGKSVEDEVNQAKQDAANAATEAERAQQTAQEAKDRLNKWADDGFISPTEKPALIDEGKRIQAEFLQIKNNADKYGVSVTEYTKAYEDYLNELRYHSAQQPEDIAVRPELAKTQTIYYDRRNGALNAIANAAKDYVDEADKKLKEYLDTEITAIPGKIELAVRSLKTANYNLLANSNMVLNGNPYQLGVYRYETHLVVGKSYTLTVCYKCADSSSILAYNNAGGGHVAEFPKSDNETIVSVKISPFNEDLTYFEFYKLPQKETTQTYVKWAVITEGDIGVSNWIPSKSGMFSGGSNLVLNSGVCVDDYALFGLSKTYYELRGQDVVISFDYEYSNLVLGSNNRFGVETEVPLSTGGVQYFGAFLYVDSRSPSSGKGRYSYALKVSDNVVDNGLKHIQAHVQVGSGTVVKIYNFQIEKGNTPTGWKPAPEDILNDSKKYTDTQILAVDGKIELTVKTKVENLGIGANNLFSYTSSDLNNLGDSYVAVEKINDIHGFKVTGENHGRNTVRIPNIIPPIPGKYTVSGWIKGSQSTTPGITIDVCDSDSYRVLATPDNNWSYFKHTFDVSKNTEDQKDIYNFVDLGDISWAYIWVKDFKVESGEIATAWSPNIQDGVYRSAEYTNQQISVVEGKITTTVEKLTEVDGKVTGLASRVEQTEKSITSVVGDINVLNSTTNRHITKQIDLTGWDNNKFFPLVIDIPVGRKSKVEIDRPLKAAYGTPSYGTHEGGFSMNLSFEMSGSGWGSSDVVINIFDYVRSWSSGKIVVDLGQITESSDCVIGIRGGSKYNVTVYDTTDQSTVNVYQADYTGPYGQVFPVRTDGTEPVRTYGYYSEIKQTQESISATVARVDDQGRRLSAAELTLTADNARIGVVENGLVNTGINITSRKIVLKSDNVLFQNNAGQQTAAINANGKLTANAIEVGEVVAGGFAAQRITTGNLTVTDGAVIGGMTITGGVLTGKNINIQDGAKIGNFTIVSGIFSAQNTPAGIQMTLSNNAATFDSSGVRVEHNSGGYALTTTGNGRVFLTGSNFWVQCKDVDFMGAQTWKAPGVFYACTILANGAIGKTWGNPDFHITRVTKNSTGRYTVNTTGSNGDYFVMITAYDPSSWLSTTVEPYSEGQFTYKVFDVNNGMCDGGVIIYFCGMVK
Physico‐chemical
properties
protein length:1970 AA
molecular weight: 216105,71200 Da
isoelectric point:4,98213
aromaticity:0,10761
hydropathy:-0,28822

Domains

Domains [InterPro]
Coil
828–869
QUD16575.1
1 1970
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacteroides phage vB_BfraS_NCTC
[NCBI]
2797298 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QUD16575.1 [NCBI]
Genbank nucleotide accession
MW314138.1 [NCBI]
CDS location
range 5372 -> 11284
strand +
CDS
ATGGAAGTACATAACAACTTTAGTCCTTTGGCATTTAGAAAGAAAGAATCTAAAGCCACATACGAAAAATGGTACGCTTTCGGGAAGAATTACGCTATTCCTGCAAGCGCAAACACGCTAACACCTTTCCAGTTTACAGAGTTGAACATACCAGTCTTTGATCCCAATACGATTGAGGTTGAGGTAATCAACGAAGAGACGGGAGAGGCGAAAAAATCGGGTGTATATGTTAGCTTTGATGTAATGCCCGAACATGGCGGTGTATTGTACGTATCACCCGGCAAGAACTCGTTTAGGGAGGCTTTGCCACAGGGGACGTATAGAGCACGTTTTTCAATCGGTGATCAAGTATATATTTCGACTCCTTTTTGCGTTATACCCGGCATAGAAACGAGTAGCAAATATCTGTTGATTGAGTATTGGAACGATGAAAAGATCGCCTATCCGGGTGGCTTCATTACAACGGGTGCGAACAACGACTTCCGGTATCAGATGTATGTTCCGGCAACTATCTGTAAACCTAAATACGAGTTTGAAGAAGAGCTAACCAAACGTGCAGGATACAAGTTTTTGGAACTGCAAACGTCTACGAAGGTGTACGCCTTTACGTTCGTTGCACCGGAGTTTATTTGTGACGCTATGCGACTTATTCGCCTATCTGACTATATCCGAATTTCGCACGATGGCGAATATTACAACGCCCTCAACTTCGAGTTTGATGTTGATTGGCAGGAACAATTGTATTTGGCGGCTGTTGACTGCCAGTTTGAGACAGACTCGATCATACAAAAACTCCCTTCTTTCAATAGACGGGATAAAGCGTCTTTTTATAATGCCCTATTAGCGAACATTGATACACCTATAATGTTCTCCCCCGATACCGTAGGGCTGTATTACAAAGAGTATCGGGAAACAGAGCCAGTAGTCAAGGGTAAATTGATACGGGAGTTATCCCCTATTGACTTGATAGATGAAAATACAACTATTGCCGTTGATTTGGGTACAGGTGAGGCGAGAAAGTTTAACTTATACCGAATGTTGCAGGACTATATTTCTAAATCGCATGAGGATGCAACAAACTTTTTGTTACATCTCCGTGGAGGTGCAACATTTGGTGATGATATTTCTGGTAGCGCTGCGCACATAAATTCGGCAGGCGATGCAAGATTTAACGATGTTGATGCAGATGCAGTTTCTGCCGATGCCGTTGACGTTGGTTCTTGGCTGTCGGTGGGTAACACTGCATTTACGGTTAGCAAGTCGGGAAAGACGGACACAGGCGAGTTTACAGCAAGGGGAAAAGCGTATCTCACAGAGGACGTTTATACAGGTGGCGGAACTGGAACGATAACGAAAGACGGACAATTAAAATACCTTTCTGCAATTATCCAACAGTTCCTATCATCCCCTACTTTCGTTTCCGGTTTTCTTGGCGAGGGCTTTAAAATATGGGTCGAGAATGGCAATTGGCATATAGAATGTGACAATTTGACAGTAAGACAGACTATGAATATATTTGAGCTACTTATCCAAAAGATAAGGAGCGTTAACGGTGCATTGGTCGTGTCTCAGTCGAACGGTAAATTGTCGGAAGTTAAAGAAGTTGGAGAGCAATATAAGTTAACCACTGGTGAAGAATTTCCCACTTTCCAAGAGGGCGATTTGGTGCGGTGTCAGACGTTTGCAGGTTATCAAGGTGCGGGGCTGACTTTTGATTTCACTCAGTTTGCTAAGTTCGACTATTCCGGCGGTTCTTTTGATAGCAGTTTGGTTGATGTCACGCCCGACTCTATTAGCTTCAACTTGAACGATACTGGAAATTCCGGATTCGCATTCTATAAAATGCAACCCTCAAGCGAGACTCCTATTGAGATGCCTTCGTTCATATTGATATTAGAGGGCGCATATCCGGGTATGATGGCTGTTGCAACCGGACTTGATTCAAATGATAGCCCGGTAGAGAGTGCAGGCGTATTGTTGAAGAATGGTGAGAACGTTATCCCCGCTATCACATTATCGCAAGGAATACACAACTTTGCTATAACAGTAGTAGGTGATTCGGGTCACGGTACAGGTAAGGTTACAGTAAAGCAAAAGAGAGCAGATGGAAGTGCACCAAGCAATAGCTTTGTTAAATTTTACTGGGTAGAAGTAAAGTCGGTTGATGGTACTTCATTCTTTGTCGATAAATCAGAATTTAACGGTGTTGTTCCGGCTGTCGGTGATGAAGTTGTTCAGATGGGAAATACGAAGAACCCCGAACGGCAGGCGTTAATCTACATCACAGCGCAGGAAAGCGGACACCCGTACATAGAAATATTGAACGGAGTTAAAACAAAATCGTTATCCGGTACGAATAGGACGCGTCTTGGCGATTTAAGTAACATACAGGACTCTGCGTTTCCGGAAGGACAACAGCCATCCGGTAGCGGCTTGTATTGCGATAACGCTTTTCTTCGTGGTATATTCTTGTTAAGAAACGGCAAGTCAGTTGAGGATGAAGTAAACCAAGCGAAGCAAGATGCAGCCAACGCAGCAACAGAGGCGGAGAGAGCACAACAGACAGCGCAGGAGGCGAAAGATCGGCTTAATAAATGGGCTGACGATGGATTTATATCTCCTACTGAAAAGCCCGCTTTGATTGATGAAGGAAAGCGCATACAGGCAGAGTTTTTGCAGATAAAAAATAACGCTGACAAATACGGTGTATCCGTTACTGAATATACCAAGGCTTATGAAGATTATTTAAATGAACTTAGATACCATTCAGCCCAACAGCCGGAAGATATTGCGGTGCGTCCGGAACTTGCAAAGACTCAAACGATATACTACGATCGGAGAAACGGAGCGTTGAACGCTATTGCGAACGCTGCAAAGGACTACGTAGATGAAGCTGACAAGAAGCTAAAGGAGTATTTAGATACGGAGATCACAGCGATACCCGGTAAGATCGAACTTGCTGTACGGAGTTTGAAAACGGCAAATTACAACTTGCTGGCAAATAGCAATATGGTGTTAAATGGTAATCCGTATCAACTTGGTGTTTATAGATATGAAACACATTTAGTTGTTGGCAAATCGTATACGTTGACAGTGTGTTATAAATGCGCAGATTCAAGTTCAATTTTAGCATATAATAACGCAGGCGGGGGGCATGTGGCTGAGTTCCCTAAATCAGATAACGAAACCATAGTTTCAGTTAAAATATCTCCATTCAATGAAGATTTAACGTATTTCGAGTTTTATAAGTTACCCCAAAAGGAAACAACTCAAACATACGTAAAATGGGCTGTTATTACTGAGGGTGATATTGGCGTGTCTAATTGGATACCGTCTAAATCTGGAATGTTCTCCGGAGGTAGCAATTTAGTGTTAAACTCAGGTGTTTGCGTAGATGATTACGCCTTGTTTGGTTTAAGTAAAACGTATTATGAATTAAGGGGTCAAGATGTTGTAATTTCGTTTGATTATGAATATAGTAATCTTGTTTTAGGTAGCAATAATCGTTTCGGAGTTGAAACGGAAGTTCCTTTGTCTACTGGTGGTGTTCAGTATTTCGGGGCTTTTTTATATGTTGACTCTCGTTCACCTTCAAGCGGAAAGGGTCGATACTCTTATGCCTTAAAAGTAAGTGATAACGTTGTAGATAATGGTTTAAAACACATACAGGCGCATGTTCAAGTAGGTAGCGGTACGGTAGTGAAAATATATAATTTCCAAATCGAGAAAGGGAATACCCCTACCGGGTGGAAGCCCGCACCGGAGGATATATTAAACGACTCCAAAAAGTACACCGATACGCAGATTCTTGCGGTTGATGGTAAGATCGAATTAACGGTAAAGACTAAGGTAGAAAACCTTGGAATAGGAGCAAATAACCTTTTCAGTTATACAAGTTCTGATCTTAATAATTTAGGTGATAGCTATGTTGCGGTAGAAAAGATTAACGATATTCACGGTTTTAAGGTAACAGGTGAGAACCATGGTAGAAATACTGTTAGAATACCAAATATAATACCTCCTATTCCGGGTAAATATACTGTATCCGGATGGATAAAAGGGTCTCAAAGTACAACGCCTGGTATAACTATTGATGTTTGTGATTCCGATTCTTACCGTGTTTTAGCCACACCCGATAACAATTGGAGTTATTTCAAGCATACATTTGACGTTTCAAAAAATACAGAAGATCAAAAGGATATATACAATTTTGTCGATTTGGGTGATATTAGTTGGGCTTATATCTGGGTTAAAGATTTCAAAGTTGAATCGGGTGAGATTGCTACTGCATGGAGTCCAAATATACAGGATGGTGTATATAGGAGCGCTGAGTACACTAACCAACAAATAAGCGTTGTTGAGGGCAAAATAACAACTACGGTAGAGAAATTGACAGAGGTTGACGGGAAAGTTACCGGACTCGCTTCACGGGTTGAACAGACCGAAAAGAGTATAACGTCTGTTGTTGGGGATATTAATGTTCTTAATAGCACTACAAATAGACACATTACTAAGCAAATAGATTTGACCGGGTGGGATAACAACAAATTCTTTCCTTTGGTTATTGATATTCCGGTAGGGCGTAAATCAAAAGTGGAGATAGACAGACCTTTAAAAGCAGCATACGGAACGCCATCATACGGTACGCATGAAGGCGGTTTTTCTATGAACTTATCATTTGAGATGTCCGGTAGCGGATGGGGATCTTCTGATGTTGTTATTAACATCTTCGACTATGTACGTTCATGGAGTAGTGGGAAGATCGTAGTCGATTTAGGGCAAATCACTGAAAGTTCTGACTGTGTAATAGGTATTCGTGGAGGGTCTAAATACAATGTTACGGTATATGATACAACAGATCAGAGCACAGTTAACGTTTATCAAGCTGATTATACCGGACCATACGGTCAAGTATTTCCCGTCCGCACCGATGGTACAGAGCCAGTCCGGACGTATGGTTACTACTCTGAAATAAAACAAACACAAGAAAGCATCTCCGCAACGGTTGCAAGGGTAGACGATCAAGGAAGACGATTAAGTGCGGCTGAGTTAACATTAACGGCAGATAATGCGAGGATCGGAGTTGTCGAGAACGGTTTAGTAAATACCGGAATAAACATAACATCCCGTAAAATCGTGCTAAAGTCTGATAACGTCCTTTTCCAAAACAACGCAGGACAGCAGACAGCCGCCATCAATGCGAACGGAAAACTTACTGCAAACGCAATCGAAGTTGGTGAGGTTGTTGCCGGAGGTTTTGCGGCTCAGAGAATCACTACCGGAAACTTGACTGTTACGGATGGTGCGGTTATCGGTGGTATGACTATTACAGGGGGAGTGCTGACCGGAAAGAACATCAATATTCAAGATGGTGCAAAGATTGGTAACTTCACCATTGTATCGGGTATATTTTCCGCCCAAAATACGCCCGCAGGCATACAAATGACTCTATCGAATAATGCCGCTACTTTTGACAGTAGCGGAGTACGTGTAGAACATAATTCGGGTGGTTATGCGTTGACTACTACGGGTAACGGAAGAGTATTCCTAACAGGGTCAAATTTTTGGGTTCAGTGCAAGGATGTTGATTTTATGGGTGCTCAAACATGGAAAGCCCCGGGTGTTTTTTACGCATGTACGATTTTGGCAAACGGAGCAATCGGTAAAACATGGGGTAACCCTGACTTTCACATAACAAGAGTAACTAAAAACTCAACAGGGAGATATACTGTTAATACTACCGGTTCCAATGGGGACTACTTTGTTATGATTACAGCGTATGACCCTTCAAGCTGGCTAAGTACAACAGTAGAACCATACTCAGAGGGACAGTTTACGTACAAAGTATTCGATGTAAATAATGGCATGTGTGACGGCGGAGTTATTATTTATTTTTGTGGAATGGTTAAGTAG

Tertiary structure

PDB ID
f42df6f240f08bf1c528fa011b763aa28662685cb1c9ab8616512f85dc56fec9
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6959
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Complete genome sequence of Bacteroides fragilis bacteriophage, vB_BfrS_NCTC Tariq,M.A. and Carding,S.R. 2021-07-22 GenBank