UniProt accession
A0A1B1PB74 [UniProt]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSVYDNHRTTFFVKADGTFRLGSRHVNGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVMVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKIKDMKDGARTSKDNLQKSIEALVKYIANDVNTNPITDANKLQITKLLDDIDNKKASLDGAAQMILLDPFLTDEQKVAVKKWYDKLNSDHTALKTTVMVAIQDGNLTAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITHLYNMVSIKVSSEQVTQQFIDLNTKIEKTQEETATALDDFQTQIDNTVKNLPYKVEVTSSNGLIFVNGGVNSTLAAKITKGTEDVTSTVAVADFIWTRVSNNTAADTTWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGIPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKHVRVEPTSFTDIGAGGQLEIKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLADITGESLLGTQDMKTSAQLDADTWGKGKFYSLRKQARDIAVDPNQDAAYKSLTTSYDALRTYLRALKTGAGRNTVYPWDTTSDVIMDVKRTEWDKAWADYENAYASLTVVVQQKQKDYTDNRIEDVNTEIKNISKTGQHATTDLRVPTTSISAPITTIALPSFKGFTKNNLQVGGVNYAYGTANKVEVKGNGAASTNQTVKPFTIKQDGLDLINTGKFICGYYWSIAQDGNNPVQGTMYVQLGGAPWTQIATPVAFSPSNMSGVYLADRNIAQSNGSGITDLQLRLDNVVGTVTVTNFMLTTNTTLETVEYSTNPTELRADGEYLYFNRNRAIAGVTMPTFYTAKNGTPDTARSSMTIQEVFHGNGSVYDDFHWTEDGTPTKTNKFADMLLDTGFSLAIQNQNVQLPNENGVTERYIQVQLNNFASRPMANNGTVRLANGKGLELERLASGNFTKYNQFKVDFANANMSFLVSAKEMNVAAAYQVKSEEVLFFMRGWKMFQGEPVQKNTGGVVTYTFNPYSGSDNSAPNFTPIGYVQKDQAIMNKGVLASTGEYKRPVEVAAPIRTKQTSQQWQVVYQLALPYDSTCQFTGAIDLIGDPEKVSPTVVRYTYVDWTPPFNDKDGTFMYGINLATAQEDTRYLIPVLERRIANAEQKVETDSIKSVVFSSREYELGLQDKASVADVEAKADKSDLTDLATKDELKSSEEARKRELEEAMKNIDFTPYVQKSEIEQLDRQWTAAFYSSGGMNIVKNSIGFDKSMSAKLNRETFTFWDDMINTAYHQPVNIQTNALDALGFTSGFMFNESPNTNWTAIAQVLNVIPNQPYTISYFLQKMNAGDSNYRFNILIQQTEKENPTSSDDWVTIQGGQISDNSSIKHSGFMPSYFEFTPTKSKVRLVLIAAPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGTEIGYTVITPERFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENPNNAGWAFISNY
Physico‐chemical
properties
protein length:2010 AA
molecular weight: 223228,75750 Da
isoelectric point:5,09371
aromaticity:0,09005
hydropathy:-0,50468

Domains

Domains [InterPro]
A0A1B1PB74
1 2010
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage DirtyBetty
[NCBI]
1873999 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ANT41416.1 [NCBI]
Genbank nucleotide accession
KX349903 [NCBI]
CDS location
range 55137 -> 61169
strand +
CDS
ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTATAAGTATAATACAGTTGACGTTATCACGGTAAGAGAAAACAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTACTCAGCTATGCTTCCAACTCATATGTCTGGACGTACAGCTAATGGTAATATCTATGGTTCTACTACATTAGTAACTGTAGGTACGCGTGTACTAATCGGTTTCATCGATGGTCAGGTTGACACACCAATCGTAATCAACATCTACGGTAAGACCGATGACCAACAACAATTAACACGTACAGACTTCACAGCAGCAGATGATTCAATTGAGTCTATCCAGCAAGAACTGTGGAACACTTTCAATCTATATCCATCAATGACTTATGAAAATGTCGATGGTAGAGGTAACCGTGAAGTGACATTCTCTGGTAAGACGTTCTTGATTTCGACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCGCATTTCGATTATATGGACCTTCCACATTCTCGTTATGCGAATGGAGAGCTTATCGAACCAGAATCTCCTGATGCACCAACAGTACTTTACGTTCACCAAAGCGTATATGACAACCATCGTACAACTTTCTTCGTGAAAGCAGACGGTACGTTCCGATTAGGTTCTCGTCATGTTAATGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTAATGGTTAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATATCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTACTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAAGTAGAGAAAGACACCTACTTCATCGACACTGCTGAGATTGAAGCTAAGATTAAAGACATGAAAGACGGTGCTCGTACAAGTAAAGATAATCTACAAAAATCTATTGAGGCACTAGTAAAGTATATTGCTAATGATGTTAACACAAATCCTATAACGGATGCTAACAAATTGCAAATTACGAAATTATTAGATGACATAGATAACAAGAAAGCATCTCTTGACGGTGCTGCACAGATGATACTGCTGGACCCATTCTTGACAGATGAGCAGAAAGTAGCTGTGAAGAAGTGGTACGATAAACTTAACTCTGACCACACTGCACTGAAGACGACTGTGATGGTAGCTATCCAAGATGGTAACTTAACAGCACAAGATAAAAAGGACATCTCAACTGCCGCAGAAACATACCTAAATGACCTAACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATTGTTGATGCATTCGAGAACGCAGTGAACTACGCGAACAAAGAGTCATTACACCAAAGTGCAGTAATCACTCATCTATATAACATGGTATCTATCAAAGTTAGTTCTGAGCAAGTGACACAGCAGTTCATTGATTTGAACACGAAGATAGAAAAGACACAAGAAGAGACAGCTACAGCACTAGACGATTTCCAAACTCAGATTGATAACACAGTTAAGAACTTACCATACAAGGTAGAAGTGACATCATCTAACGGTTTGATATTCGTAAATGGTGGAGTTAACTCTACGCTAGCAGCTAAGATTACAAAAGGTACTGAAGACGTAACAAGTACAGTAGCTGTTGCTGATTTCATATGGACTCGTGTTTCTAATAACACAGCAGCGGATACAACTTGGAACAACGCTCACAAAAATGTAGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGACTACAAGAACCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATCACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCTTTATGGTACGACCGCGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTAGAGATTAATAGATTCGATGTTAACATCCGTAACTTATTAATCGGTTCTCGTGACTATGGCGCACAGAACTCTAATAATCCAACAGACCCTAACAACTCGACACCTCAAGGTAATATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGGACGCCGCCTAAGACAGGAGTTAAACCTTCACCACAGAATGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAATCTAGTAAGCTCGCTAGCAGCGGTCTATTAGATGTGGGGGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGCGGAACAAGCCCTGATAAAGGCATACCTATTAGATTATATGTAACAGATAATCGCGATGGTGGTACTGGTACAATCGGTTTCGAAATGAAAGATAAAGAGACAGACGGTAAACCAGTAACTGGAGCCCCTGTACAGATGCGCGCAACACAGCAATGGAAGATGGTATGGGGTACATTCCCTGTAACACAATTATTCCTAGATACTGCAAATGACCCAAACAGTACATCTAAGCACGTACGAGTAGAGCCGACGAGTTTCACAGACATCGGAGCCGGAGGACAACTAGAAATTAAGTCTCATATGGTTGTTAAAGGAGTTATTCCTTCTGACTGGGTTCCAGCTCCAGAAGATACAAAGCGTGACTCAGATAACACCAACTGGAACATGGATGCTCTTGGAAGCGATAACTACCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAATTAGCAGACATTACAGGCGAGTCACTTCTTGGCACGCAGGACATGAAGACATCAGCTCAGTTAGATGCAGACACATGGGGCAAAGGTAAGTTCTACTCTTTACGTAAACAGGCTAGAGACATCGCTGTGGACCCGAACCAAGATGCAGCATACAAAAGCTTAACTACATCTTACGACGCACTTAGAACGTACCTGAGAGCTCTTAAAACAGGTGCTGGTCGAAACACAGTGTACCCATGGGATACTACCTCTGATGTAATCATGGATGTTAAGCGTACAGAATGGGACAAAGCGTGGGCAGATTACGAGAATGCTTATGCATCGTTAACAGTAGTTGTACAGCAAAAACAGAAAGACTACACAGATAATCGTATCGAAGATGTAAATACGGAAATCAAGAACATCAGTAAGACAGGTCAACACGCAACAACTGACCTACGAGTCCCTACTACATCTATTTCTGCACCGATAACAACAATCGCGTTACCTAGTTTCAAAGGTTTCACGAAAAATAACTTGCAAGTTGGTGGTGTGAACTACGCGTATGGAACAGCAAACAAGGTAGAGGTTAAAGGTAATGGCGCAGCTTCAACAAACCAGACAGTAAAACCATTTACGATTAAACAAGATGGACTAGACTTAATCAATACTGGTAAGTTCATTTGTGGGTATTACTGGTCAATCGCGCAGGATGGAAACAACCCTGTACAAGGTACAATGTATGTTCAATTAGGTGGAGCACCTTGGACACAGATAGCAACTCCTGTAGCATTCTCTCCAAGTAACATGTCAGGTGTCTACTTAGCGGATAGAAACATAGCCCAAAGTAACGGCTCAGGCATAACAGACTTGCAGTTGCGTTTAGACAATGTGGTAGGTACTGTAACAGTAACTAATTTCATGTTAACAACGAACACTACACTGGAGACTGTCGAGTACTCTACAAACCCTACAGAGTTAAGAGCTGATGGTGAGTATCTGTACTTTAACCGTAACAGAGCTATTGCAGGTGTAACAATGCCTACGTTCTACACAGCTAAGAACGGAACACCAGATACAGCTCGTTCATCCATGACAATCCAAGAAGTGTTCCACGGTAACGGTTCGGTTTATGATGACTTCCATTGGACAGAGGATGGTACACCAACTAAAACCAACAAGTTCGCAGACATGCTGTTAGATACTGGATTCTCTCTTGCTATCCAGAACCAAAACGTTCAACTTCCTAATGAGAACGGAGTTACAGAGCGATACATCCAAGTACAGCTTAATAACTTCGCTAGTAGACCGATGGCTAATAATGGTACGGTTCGATTAGCTAATGGTAAAGGTTTAGAGTTAGAAAGATTGGCATCTGGTAACTTTACTAAGTACAACCAGTTCAAAGTTGACTTTGCTAATGCGAACATGTCATTCCTCGTATCTGCTAAAGAAATGAACGTTGCAGCAGCATACCAAGTAAAGAGCGAAGAAGTGTTGTTCTTTATGCGAGGATGGAAAATGTTTCAAGGAGAGCCAGTGCAGAAAAATACAGGAGGTGTTGTAACGTACACGTTCAACCCTTATTCTGGTTCCGATAACTCAGCTCCTAACTTCACTCCAATCGGTTACGTTCAAAAGGACCAAGCGATTATGAATAAAGGAGTACTAGCTTCTACAGGAGAATACAAACGCCCAGTTGAAGTCGCTGCACCTATAAGAACAAAACAAACAAGTCAACAGTGGCAAGTTGTATATCAGTTAGCGTTACCATACGATTCTACATGTCAGTTCACAGGAGCTATCGATTTAATAGGTGACCCAGAGAAAGTATCACCTACAGTAGTCCGTTATACGTACGTAGACTGGACACCACCATTCAATGACAAAGACGGTACATTTATGTACGGTATTAACTTAGCGACTGCACAAGAGGATACTAGGTACCTTATACCTGTTCTTGAGAGACGTATTGCTAACGCAGAGCAGAAAGTAGAGACAGACTCTATCAAAAGTGTTGTATTTAGTTCTCGTGAGTATGAGTTAGGTCTACAAGATAAAGCAAGTGTAGCAGACGTGGAAGCTAAAGCAGATAAGTCAGACCTTACCGATTTAGCGACTAAGGATGAGTTAAAGAGTAGCGAGGAGGCGCGTAAGCGTGAATTAGAAGAAGCGATGAAAAATATTGACTTCACTCCTTATGTACAAAAGTCTGAGATTGAACAGTTAGACAGACAATGGACAGCTGCATTCTATTCATCCGGCGGTATGAATATCGTTAAGAACTCTATCGGGTTCGATAAATCGATGAGTGCTAAATTAAATAGAGAGACGTTCACTTTCTGGGACGATATGATTAACACAGCGTACCATCAGCCAGTTAATATCCAGACTAACGCACTAGACGCATTAGGGTTCACTAGTGGGTTCATGTTTAACGAATCACCGAACACTAACTGGACAGCAATAGCTCAAGTGCTTAATGTTATCCCTAACCAACCATACACGATAAGTTATTTCTTACAGAAGATGAATGCAGGAGACAGTAACTACAGATTCAATATCCTAATCCAGCAGACAGAGAAAGAAAACCCAACATCAAGTGATGACTGGGTGACTATCCAAGGTGGTCAAATATCGGATAACAGTAGTATTAAGCACAGTGGTTTTATGCCTTCTTACTTCGAGTTTACTCCAACAAAGAGTAAGGTTCGATTGGTGTTAATTGCCGCTCCTAAATGCGTAGCACAGATTTCTGGTATAATGGTTAACATAGGGAAAAAACCCATCAAGTGGACAATGTCTACAGGGGAGAACTACAACACGAACGTTCGTATGAACTTAAACGGTATCCGCGTATCTCAGGTTGACAAGGATGGTACAGAAATAGGGTACACAGTCATCACACCGGAACGTTTCGCAGGTTATTACATCCGAGACGGTAAACCGGAAGAGATATTCCGACTCGACGGTGATGAAACTTGGACTAAAAAGTTAAGAGCCGAAAATGAGATAAACATGGGACCGATTAAGATTCTACGTGTTGAGAATCCTAACAACGCAGGATGGGCGTTTATTTCTAACTACTAG

Tertiary structure

PDB ID
30557d88ae8a9ace78b41e6b7e85aaf479f6c7fe7d33a9c0e8b39575d645250c
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7002
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50