UniProt accession
A0A1B1PB74 [UniProt]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSVYDNHRTTFFVKADGTFRLGSRHVNGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVMVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKIKDMKDGARTSKDNLQKSIEALVKYIANDVNTNPITDANKLQITKLLDDIDNKKASLDGAAQMILLDPFLTDEQKVAVKKWYDKLNSDHTALKTTVMVAIQDGNLTAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITHLYNMVSIKVSSEQVTQQFIDLNTKIEKTQEETATALDDFQTQIDNTVKNLPYKVEVTSSNGLIFVNGGVNSTLAAKITKGTEDVTSTVAVADFIWTRVSNNTAADTTWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGIPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKHVRVEPTSFTDIGAGGQLEIKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLADITGESLLGTQDMKTSAQLDADTWGKGKFYSLRKQARDIAVDPNQDAAYKSLTTSYDALRTYLRALKTGAGRNTVYPWDTTSDVIMDVKRTEWDKAWADYENAYASLTVVVQQKQKDYTDNRIEDVNTEIKNISKTGQHATTDLRVPTTSISAPITTIALPSFKGFTKNNLQVGGVNYAYGTANKVEVKGNGAASTNQTVKPFTIKQDGLDLINTGKFICGYYWSIAQDGNNPVQGTMYVQLGGAPWTQIATPVAFSPSNMSGVYLADRNIAQSNGSGITDLQLRLDNVVGTVTVTNFMLTTNTTLETVEYSTNPTELRADGEYLYFNRNRAIAGVTMPTFYTAKNGTPDTARSSMTIQEVFHGNGSVYDDFHWTEDGTPTKTNKFADMLLDTGFSLAIQNQNVQLPNENGVTERYIQVQLNNFASRPMANNGTVRLANGKGLELERLASGNFTKYNQFKVDFANANMSFLVSAKEMNVAAAYQVKSEEVLFFMRGWKMFQGEPVQKNTGGVVTYTFNPYSGSDNSAPNFTPIGYVQKDQAIMNKGVLASTGEYKRPVEVAAPIRTKQTSQQWQVVYQLALPYDSTCQFTGAIDLIGDPEKVSPTVVRYTYVDWTPPFNDKDGTFMYGINLATAQEDTRYLIPVLERRIANAEQKVETDSIKSVVFSSREYELGLQDKASVADVEAKADKSDLTDLATKDELKSSEEARKRELEEAMKNIDFTPYVQKSEIEQLDRQWTAAFYSSGGMNIVKNSIGFDKSMSAKLNRETFTFWDDMINTAYHQPVNIQTNALDALGFTSGFMFNESPNTNWTAIAQVLNVIPNQPYTISYFLQKMNAGDSNYRFNILIQQTEKENPTSSDDWVTIQGGQISDNSSIKHSGFMPSYFEFTPTKSKVRLVLIAAPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGTEIGYTVITPERFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENPNNAGWAFISNY
Physico‐chemical
properties
protein length:2010 AA
molecular weight: 223228,75750 Da
isoelectric point:5,09371
aromaticity:0,09005
hydropathy:-0,50468

Domains

Domains [InterPro]
DC_0209
STR
9–941
Coil
Unmapped
552–572
A0A1B1PB74
1 2010
Architecture
STR
STR
STR 9-941 | STR 956-2010
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage DirtyBetty
[NCBI]
1873999 Uroviricota > Caudoviricetes > Herelleviridae > Wphvirus > Wphvirus megatron
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ANT41416.1 [NCBI]
Genbank nucleotide accession
KX349903 [NCBI]
CDS location
range 55137 -> 61169
strand +
CDS
ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTATAAGTATAATACAGTTGACGTTATCACGGTAAGAGAAAACAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTACTCAGCTATGCTTCCAACTCATATGTCTGGACGTACAGCTAATGGTAATATCTATGGTTCTACTACATTAGTAACTGTAGGTACGCGTGTACTAATCGGTTTCATCGATGGTCAGGTTGACACACCAATCGTAATCAACATCTACGGTAAGACCGATGACCAACAACAATTAACACGTACAGACTTCACAGCAGCAGATGATTCAATTGAGTCTATCCAGCAAGAACTGTGGAACACTTTCAATCTATATCCATCAATGACTTATGAAAATGTCGATGGTAGAGGTAACCGTGAAGTGACATTCTCTGGTAAGACGTTCTTGATTTCGACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCGCATTTCGATTATATGGACCTTCCACATTCTCGTTATGCGAATGGAGAGCTTATCGAACCAGAATCTCCTGATGCACCAACAGTACTTTACGTTCACCAAAGCGTATATGACAACCATCGTACAACTTTCTTCGTGAAAGCAGACGGTACGTTCCGATTAGGTTCTCGTCATGTTAATGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTAATGGTTAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATATCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTACTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAAGTAGAGAAAGACACCTACTTCATCGACACTGCTGAGATTGAAGCTAAGATTAAAGACATGAAAGACGGTGCTCGTACAAGTAAAGATAATCTACAAAAATCTATTGAGGCACTAGTAAAGTATATTGCTAATGATGTTAACACAAATCCTATAACGGATGCTAACAAATTGCAAATTACGAAATTATTAGATGACATAGATAACAAGAAAGCATCTCTTGACGGTGCTGCACAGATGATACTGCTGGACCCATTCTTGACAGATGAGCAGAAAGTAGCTGTGAAGAAGTGGTACGATAAACTTAACTCTGACCACACTGCACTGAAGACGACTGTGATGGTAGCTATCCAAGATGGTAACTTAACAGCACAAGATAAAAAGGACATCTCAACTGCCGCAGAAACATACCTAAATGACCTAACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATTGTTGATGCATTCGAGAACGCAGTGAACTACGCGAACAAAGAGTCATTACACCAAAGTGCAGTAATCACTCATCTATATAACATGGTATCTATCAAAGTTAGTTCTGAGCAAGTGACACAGCAGTTCATTGATTTGAACACGAAGATAGAAAAGACACAAGAAGAGACAGCTACAGCACTAGACGATTTCCAAACTCAGATTGATAACACAGTTAAGAACTTACCATACAAGGTAGAAGTGACATCATCTAACGGTTTGATATTCGTAAATGGTGGAGTTAACTCTACGCTAGCAGCTAAGATTACAAAAGGTACTGAAGACGTAACAAGTACAGTAGCTGTTGCTGATTTCATATGGACTCGTGTTTCTAATAACACAGCAGCGGATACAACTTGGAACAACGCTCACAAAAATGTAGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGACTACAAGAACCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATCACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCTTTATGGTACGACCGCGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTAGAGATTAATAGATTCGATGTTAACATCCGTAACTTATTAATCGGTTCTCGTGACTATGGCGCACAGAACTCTAATAATCCAACAGACCCTAACAACTCGACACCTCAAGGTAATATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGGACGCCGCCTAAGACAGGAGTTAAACCTTCACCACAGAATGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAATCTAGTAAGCTCGCTAGCAGCGGTCTATTAGATGTGGGGGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGCGGAACAAGCCCTGATAAAGGCATACCTATTAGATTATATGTAACAGATAATCGCGATGGTGGTACTGGTACAATCGGTTTCGAAATGAAAGATAAAGAGACAGACGGTAAACCAGTAACTGGAGCCCCTGTACAGATGCGCGCAACACAGCAATGGAAGATGGTATGGGGTACATTCCCTGTAACACAATTATTCCTAGATACTGCAAATGACCCAAACAGTACATCTAAGCACGTACGAGTAGAGCCGACGAGTTTCACAGACATCGGAGCCGGAGGACAACTAGAAATTAAGTCTCATATGGTTGTTAAAGGAGTTATTCCTTCTGACTGGGTTCCAGCTCCAGAAGATACAAAGCGTGACTCAGATAACACCAACTGGAACATGGATGCTCTTGGAAGCGATAACTACCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAATTAGCAGACATTACAGGCGAGTCACTTCTTGGCACGCAGGACATGAAGACATCAGCTCAGTTAGATGCAGACACATGGGGCAAAGGTAAGTTCTACTCTTTACGTAAACAGGCTAGAGACATCGCTGTGGACCCGAACCAAGATGCAGCATACAAAAGCTTAACTACATCTTACGACGCACTTAGAACGTACCTGAGAGCTCTTAAAACAGGTGCTGGTCGAAACACAGTGTACCCATGGGATACTACCTCTGATGTAATCATGGATGTTAAGCGTACAGAATGGGACAAAGCGTGGGCAGATTACGAGAATGCTTATGCATCGTTAACAGTAGTTGTACAGCAAAAACAGAAAGACTACACAGATAATCGTATCGAAGATGTAAATACGGAAATCAAGAACATCAGTAAGACAGGTCAACACGCAACAACTGACCTACGAGTCCCTACTACATCTATTTCTGCACCGATAACAACAATCGCGTTACCTAGTTTCAAAGGTTTCACGAAAAATAACTTGCAAGTTGGTGGTGTGAACTACGCGTATGGAACAGCAAACAAGGTAGAGGTTAAAGGTAATGGCGCAGCTTCAACAAACCAGACAGTAAAACCATTTACGATTAAACAAGATGGACTAGACTTAATCAATACTGGTAAGTTCATTTGTGGGTATTACTGGTCAATCGCGCAGGATGGAAACAACCCTGTACAAGGTACAATGTATGTTCAATTAGGTGGAGCACCTTGGACACAGATAGCAACTCCTGTAGCATTCTCTCCAAGTAACATGTCAGGTGTCTACTTAGCGGATAGAAACATAGCCCAAAGTAACGGCTCAGGCATAACAGACTTGCAGTTGCGTTTAGACAATGTGGTAGGTACTGTAACAGTAACTAATTTCATGTTAACAACGAACACTACACTGGAGACTGTCGAGTACTCTACAAACCCTACAGAGTTAAGAGCTGATGGTGAGTATCTGTACTTTAACCGTAACAGAGCTATTGCAGGTGTAACAATGCCTACGTTCTACACAGCTAAGAACGGAACACCAGATACAGCTCGTTCATCCATGACAATCCAAGAAGTGTTCCACGGTAACGGTTCGGTTTATGATGACTTCCATTGGACAGAGGATGGTACACCAACTAAAACCAACAAGTTCGCAGACATGCTGTTAGATACTGGATTCTCTCTTGCTATCCAGAACCAAAACGTTCAACTTCCTAATGAGAACGGAGTTACAGAGCGATACATCCAAGTACAGCTTAATAACTTCGCTAGTAGACCGATGGCTAATAATGGTACGGTTCGATTAGCTAATGGTAAAGGTTTAGAGTTAGAAAGATTGGCATCTGGTAACTTTACTAAGTACAACCAGTTCAAAGTTGACTTTGCTAATGCGAACATGTCATTCCTCGTATCTGCTAAAGAAATGAACGTTGCAGCAGCATACCAAGTAAAGAGCGAAGAAGTGTTGTTCTTTATGCGAGGATGGAAAATGTTTCAAGGAGAGCCAGTGCAGAAAAATACAGGAGGTGTTGTAACGTACACGTTCAACCCTTATTCTGGTTCCGATAACTCAGCTCCTAACTTCACTCCAATCGGTTACGTTCAAAAGGACCAAGCGATTATGAATAAAGGAGTACTAGCTTCTACAGGAGAATACAAACGCCCAGTTGAAGTCGCTGCACCTATAAGAACAAAACAAACAAGTCAACAGTGGCAAGTTGTATATCAGTTAGCGTTACCATACGATTCTACATGTCAGTTCACAGGAGCTATCGATTTAATAGGTGACCCAGAGAAAGTATCACCTACAGTAGTCCGTTATACGTACGTAGACTGGACACCACCATTCAATGACAAAGACGGTACATTTATGTACGGTATTAACTTAGCGACTGCACAAGAGGATACTAGGTACCTTATACCTGTTCTTGAGAGACGTATTGCTAACGCAGAGCAGAAAGTAGAGACAGACTCTATCAAAAGTGTTGTATTTAGTTCTCGTGAGTATGAGTTAGGTCTACAAGATAAAGCAAGTGTAGCAGACGTGGAAGCTAAAGCAGATAAGTCAGACCTTACCGATTTAGCGACTAAGGATGAGTTAAAGAGTAGCGAGGAGGCGCGTAAGCGTGAATTAGAAGAAGCGATGAAAAATATTGACTTCACTCCTTATGTACAAAAGTCTGAGATTGAACAGTTAGACAGACAATGGACAGCTGCATTCTATTCATCCGGCGGTATGAATATCGTTAAGAACTCTATCGGGTTCGATAAATCGATGAGTGCTAAATTAAATAGAGAGACGTTCACTTTCTGGGACGATATGATTAACACAGCGTACCATCAGCCAGTTAATATCCAGACTAACGCACTAGACGCATTAGGGTTCACTAGTGGGTTCATGTTTAACGAATCACCGAACACTAACTGGACAGCAATAGCTCAAGTGCTTAATGTTATCCCTAACCAACCATACACGATAAGTTATTTCTTACAGAAGATGAATGCAGGAGACAGTAACTACAGATTCAATATCCTAATCCAGCAGACAGAGAAAGAAAACCCAACATCAAGTGATGACTGGGTGACTATCCAAGGTGGTCAAATATCGGATAACAGTAGTATTAAGCACAGTGGTTTTATGCCTTCTTACTTCGAGTTTACTCCAACAAAGAGTAAGGTTCGATTGGTGTTAATTGCCGCTCCTAAATGCGTAGCACAGATTTCTGGTATAATGGTTAACATAGGGAAAAAACCCATCAAGTGGACAATGTCTACAGGGGAGAACTACAACACGAACGTTCGTATGAACTTAAACGGTATCCGCGTATCTCAGGTTGACAAGGATGGTACAGAAATAGGGTACACAGTCATCACACCGGAACGTTTCGCAGGTTATTACATCCGAGACGGTAAACCGGAAGAGATATTCCGACTCGACGGTGATGAAACTTGGACTAAAAAGTTAAGAGCCGAAAATGAGATAAACATGGGACCGATTAAGATTCTACGTGTTGAGAATCCTAACAACGCAGGATGGGCGTTTATTTCTAACTACTAG

Genome Context

Genome Context

Tertiary structure

PDB ID
30557d88ae8a9ace78b41e6b7e85aaf479f6c7fe7d33a9c0e8b39575d645250c
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7038
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50