Protein

View in Explore

Genbank accession

QQO38763.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Protein sequence

MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLALADVVKVNYKYNTVDVITVRDNNSTTKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYDNIDGRGNREITFSGKTFLIMTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTMLYVHQSVYDNHRTTFFVKADGTFRLGSRHISGGGITYQELRPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVLVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKIKDMKDSARKSKDSLQASIEALVKYIANDVNTNPITDANKLQISKLIDDMDNKKLTLDGSAQTILLDPFLTDEQKVAVKKWYDKINSDHTALKTTVMAAMQDGNLTAQDKKDISDSAATYLNDLNSWLTEMDKAADASYEQRIVEAFENAVNYANKESLHQSAVITQLYNMISIKVSSEQVTQQFLDLNMKIEKTQEETSTALDDIQNQIDSTVKNLPYKVEVTSSNGLIFVNGGVNSTLAAKITKGTEDVTSTVAVADFVWTRVSNNSAADTAWNNAHKNSGRSFNINASDVIDRATFFCDYKKPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQGKWVEINRFDVNIRNLFVGSRDFGAQNSNNPTDPNNATPQGKTSGGWINKGGTSTIRPPDQTATNQDTWINTTAENWGGMDYKLSKLAASGVINVGDMLTYACYVRTVGGTNPAAGIPIKMYATDNRTPSTTPFVDPTTAIPVVDSTTAKMPNPPQVNATQQWKMVWGTFTFTQDMMNTVNDPNNVDKTLRLEPISFTAIGNGGQLEVKSHILVKGVVPADWVPAPEDTKRDADNTNWNMDALGNDNYLTRFERGLVKTKLADITGESLSGAQDMKTSTQLDADAWGKGKFYAIRKQARDIAIDPVNDATYKALTTAYDALRTYLRALKTNTGRNTVYPWDTSSDTVMDVARTAWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNTEIGKISKTGQHSTTDLRVPTTSISAPITTIALPSFKGNTRNNLDVGGVNHAYNTLAPVEVTGLKGTGGKPDNQTVQPYSINSYGLNLIASGKYLVGYQWSIVPYQNKPLEGSMYIQIVGEPWTQITPTISFSPNSPTSGVVMLQKNDPAFTANGITKLQIRFDNLVGVVTISNFMLTTGPTLETVEYSPNPTELRADGDYQYYNRNRAIAGVTLPTFYTAKNGTTDTARSSMTIQEVFHGDGASRDEFYWTEDGQPTKINRFADILLDAGYSIAIQNQNVALAGKRYIQVQLNNFADKPMLNNGTVRMANGKGIELSRLATGSFTQPDQFKVDYANANISFLVSAEEMNVTSAYQVKGQDVAFFLRGWKLFEGEPVQKTAPSGATVYSFPPYNATSGVAPNFTPIGYVQKDLAIINRGEIAATDTYKRPIEVAPPIKLKQTGQQWQIVYALSLPYESYCSFTGAIDLIGDPDKVSPTVIRYSYVDWTPTFFDKDGTFMYGNNLATAQEDTRYLIPVLERRIANAETKVETDSIKSVVFSSREYELGLQDKANVTDLQGKADKGDLTGLATKDELAQKDEAQKKALEDAMKNIDFTPYVLKSEIEQLDRSWTAAFFASGGMNIVKNSIGFDRSMSAKLNKETFTFWDDMVNPAYHQPVGIQTNALDALGFTSGFMFNESPNTSWTAIAQVLNVIPNQPYTISYFLQKMSAGDGNYRFNILVQESQLENPTTDGDWATISGGQLADNSSIKHSAFMPSYFEFTPTKSKIRLVLIAAPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGAEIGYTVITPEKFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENTNNAGWAFISNY

Physico‐chemical properties

protein length:	2006 AA
molecular weight:	222019,04850 Da
isoelectric point:	5,07177
aromaticity:	0,09023
hydropathy:	-0,44935

Domains

Domains [InterPro]

DC_0209
STR
9–914

DC_0209 Coil

Coil
Unmapped
552–572

Coil DC_0015

QQO38763.1

1 2006

Architecture

STR

STR 9-2006

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0209	STR	DC_0209	9	914	Novel HMM	DC_0209	Central	Low	Positional only	123 proteins / 123 hits
Coil	Unmapped	-	552	572	Coils	Coil	-	-	-	-
DC_0015	STR	DC_0015	658	2006	Novel HMM	DC_0015	Central	Low	Positional only	187 proteins / 187 hits
Coil	Unmapped	-	1685	1705	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage BCPG1 [NCBI]	2801505	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus cereus [NCBI]	1396	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

QQO38763.1 [NCBI]

Genbank nucleotide accession

MW392803.1 [NCBI]

CDS location

range 28662 -> 34682
strand +

CDS

ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTTCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAAGAGGGTAACAATCTTGTTACTCTCGCTCTTGCTGATGTCGTAAAAGTAAACTATAAATATAATACAGTCGACGTTATCACAGTAAGAGACAACAACTCTACAACGAAAAACCCTAACGATAACGGTAAATACTCAGCTATGCTTCCAACACATATGTCCGGTCGTACAGCTAATGGTAACATCTACGGTTCTACAACATTAGTAACTGTAGGCACACGAGTATTAATCGGGTTCATCGATGGTCAGGTAGACACACCAATCGTAATTAACATCTACGGTAAGACAGATGACCAGCAACAATTAACTCGTACAGATTTCACAGCAGCAGATGATTCAATTGAGTCAATCCAGCAGGAGCTATGGAACACATTTAATCTGTACCCATCTATGACTTACGATAACATAGATGGTCGTGGTAACCGCGAAATAACATTCTCTGGTAAAACATTCCTAATCATGACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCACATTTCGATTACATGGACCTTCCACATTCTCGTTATGCAAATGGTGAACTTATTGAACCAGAATCTCCAGATGCGCCAACAATGTTATACGTACACCAAAGCGTATACGATAATCATCGTACAACTTTCTTCGTGAAAGCAGATGGTACATTCCGATTAGGTTCTCGTCACATTAGTGGTGGAGGTATTACGTACCAAGAACTAAGACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAACCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCCTTAAGGATGGTAACGTTGTGTTACAGAACCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTACTTGTGAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATCTCCCCTGAGTTAGAGAATATCATAAAACAAATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAAGTAGAGAAGGACACATACTTCATCGATACTGCTGAGATTGAAGCGAAGATTAAGGACATGAAGGATAGCGCTCGTAAAAGTAAAGACTCACTACAAGCATCTATTGAGGCTCTAGTAAAGTATATTGCTAACGACGTTAACACGAACCCTATCACCGATGCTAACAAACTACAAATCTCTAAGTTAATCGATGATATGGACAACAAGAAATTAACGTTAGATGGTAGTGCGCAAACAATTTTACTAGACCCATTCTTAACAGATGAGCAAAAGGTAGCCGTTAAAAAATGGTACGACAAGATTAACTCTGACCATACTGCATTAAAGACTACTGTCATGGCAGCTATGCAAGATGGTAACTTGACAGCACAAGATAAGAAGGACATCTCTGACTCCGCAGCAACATACCTAAACGACCTTAACTCATGGTTAACTGAGATGGATAAAGCAGCGGATGCTAGTTACGAACAACGTATCGTCGAGGCATTTGAGAACGCAGTAAATTACGCTAACAAAGAGTCACTTCATCAAAGCGCGGTAATCACTCAGCTGTACAACATGATTTCTATCAAAGTTAGCTCAGAACAAGTAACGCAGCAGTTCCTTGATTTGAACATGAAGATAGAAAAGACACAAGAAGAGACGTCTACAGCATTAGATGATATCCAAAACCAGATTGATAGCACAGTTAAGAACTTACCGTACAAGGTAGAAGTGACATCATCTAATGGTTTGATTTTCGTTAATGGTGGAGTTAACTCTACGTTAGCAGCTAAGATTACAAAAGGAACTGAAGATGTAACAAGTACGGTAGCTGTTGCAGATTTCGTTTGGACTCGTGTATCCAATAACTCAGCAGCGGATACAGCTTGGAACAACGCTCATAAAAACTCTGGGCGTTCATTCAACATCAATGCTAGTGATGTAATTGATAGAGCGACATTCTTCTGTGACTACAAAAAACCTCCAGTTGCTACAGGTAGTGTTACAATTGCAAACATCCAAGATATCACAGTGGGTAACGTTGAGCCAACAAATCCTCGTGAAGGTGCATTATGGTACGACCGTGGGACAGGTATCGTGTGGATGTGGCAGCAAGGTAAGTGGGTTGAGATTAATAGATTTGATGTTAACATCCGTAACTTATTTGTCGGCTCTCGTGACTTCGGTGCGCAGAATTCCAATAATCCAACAGACCCTAACAACGCAACACCACAAGGAAAAACATCAGGAGGATGGATAAATAAAGGCGGTACCAGCACAATTAGACCACCGGACCAGACTGCAACAAATCAGGACACATGGATAAACACAACAGCAGAGAACTGGGGAGGGATGGATTACAAACTAAGCAAGCTAGCTGCCAGTGGAGTTATCAATGTAGGCGATATGTTAACTTATGCATGTTACGTTAGAACTGTAGGTGGAACAAACCCAGCAGCAGGTATACCTATAAAGATGTATGCAACAGATAACAGAACACCTAGTACAACTCCATTCGTGGACCCTACTACCGCGATTCCAGTAGTAGATAGCACAACAGCCAAAATGCCCAACCCACCACAAGTTAATGCTACACAACAATGGAAAATGGTTTGGGGTACATTTACATTTACACAGGACATGATGAACACAGTTAATGACCCAAACAACGTAGATAAGACGTTACGTTTAGAACCCATCAGTTTCACTGCGATAGGTAACGGAGGTCAATTAGAAGTAAAGTCACACATCTTGGTTAAAGGTGTAGTTCCTGCGGACTGGGTTCCGGCTCCAGAAGATACAAAACGTGATGCAGATAACACGAACTGGAACATGGATGCTCTTGGTAATGACAACTATCTAACTCGTTTCGAGCGTGGACTAGTTAAAACTAAGTTAGCAGACATCACAGGTGAATCGCTATCAGGTGCTCAGGATATGAAAACATCCACGCAGTTAGATGCAGACGCATGGGGTAAAGGTAAGTTCTACGCTATCCGTAAACAGGCTAGAGACATCGCTATAGACCCAGTAAACGATGCGACATACAAAGCGCTAACTACAGCTTACGATGCGCTTAGAACGTATCTGAGAGCCCTTAAAACGAATACTGGTAGAAACACAGTTTATCCATGGGACACTTCTTCTGATACAGTTATGGATGTTGCACGTACAGCGTGGGATAAAGCGTGGGCGGATTATGAGAATGCTTATGCGTCATTAACAGTGCTAGTCCAACAGAAACAAAAAACGTACACTGACGACCGTATTAAAGATGTAAATACAGAGATTGGTAAGATTAGTAAAACGGGACAACACTCAACTACTGACTTACGAGTTCCAACAACATCAATCTCGGCACCAATCACTACAATTGCTTTACCAAGTTTCAAAGGTAATACACGAAACAATCTAGATGTAGGTGGTGTCAACCACGCGTACAACACGCTAGCCCCTGTAGAAGTGACAGGTCTTAAAGGTACAGGAGGTAAACCTGATAACCAAACAGTTCAGCCATATAGCATTAATTCATATGGGTTAAACTTAATAGCTAGCGGTAAGTATCTCGTAGGATATCAATGGTCAATCGTCCCTTACCAGAATAAACCATTAGAAGGTTCTATGTACATCCAAATAGTAGGGGAACCGTGGACGCAGATAACACCGACAATATCATTTTCACCAAATAGCCCTACATCAGGCGTCGTTATGTTACAAAAGAATGACCCTGCATTCACTGCAAACGGTATAACGAAACTACAGATACGTTTTGATAACTTAGTAGGTGTAGTCACAATTAGTAACTTCATGTTGACTACGGGACCAACTTTAGAAACAGTAGAGTACTCACCGAACCCTACAGAACTAAGAGCCGATGGCGATTATCAATACTACAATCGTAATAGAGCTATAGCGGGTGTGACACTGCCTACGTTCTACACAGCTAAGAATGGAACTACAGATACGGCACGTTCTTCAATGACAATACAAGAAGTGTTTCACGGCGACGGTGCATCCCGTGATGAATTCTACTGGACAGAGGATGGACAACCAACGAAGATTAATAGATTTGCAGACATACTGCTAGACGCAGGGTACTCTATTGCTATCCAAAACCAGAATGTAGCTCTCGCAGGAAAGCGATATATCCAAGTTCAGCTAAACAACTTCGCAGATAAACCTATGCTAAACAATGGTACGGTTCGTATGGCGAATGGTAAAGGTATAGAGCTTAGTCGTTTAGCGACGGGTAGCTTCACACAACCAGACCAGTTCAAAGTAGATTACGCTAATGCAAATATATCATTCTTGGTATCTGCCGAGGAGATGAACGTTACTAGCGCGTATCAGGTAAAAGGTCAAGACGTAGCATTTTTCTTACGAGGATGGAAGTTGTTCGAAGGCGAACCAGTTCAAAAAACTGCACCTAGCGGGGCTACTGTTTACTCATTCCCTCCGTATAACGCGACTAGCGGAGTTGCTCCTAACTTCACTCCAATAGGTTATGTTCAAAAAGACCTAGCGATTATAAACCGAGGAGAGATTGCCGCTACAGACACGTACAAGAGACCAATTGAGGTCGCACCACCGATAAAACTAAAACAAACAGGGCAGCAATGGCAAATTGTTTATGCGCTTAGCTTACCATACGAATCTTATTGCTCATTCACTGGAGCTATTGACTTAATCGGAGACCCTGATAAAGTATCACCTACAGTCATCCGTTATTCGTACGTAGACTGGACTCCTACGTTCTTCGACAAAGATGGTACATTTATGTATGGGAACAACCTAGCAACTGCTCAAGAGGACACTAGGTACCTTATACCTGTACTGGAACGTCGTATAGCTAACGCAGAAACAAAAGTAGAGACAGATTCCATCAAGAGTGTTGTGTTTAGTTCACGTGAGTACGAGTTAGGTTTGCAAGATAAAGCCAATGTTACAGACCTGCAAGGTAAAGCAGACAAAGGGGACTTGACTGGTTTAGCTACAAAAGATGAATTAGCGCAAAAGGATGAAGCCCAGAAGAAAGCGTTAGAGGACGCAATGAAGAACATCGACTTCACACCGTATGTTCTAAAGTCTGAGATTGAACAGTTAGACCGTTCATGGACAGCAGCATTCTTCGCATCAGGTGGTATGAACATCGTTAAAAATTCCATCGGTTTTGACAGGTCGATGAGTGCTAAATTAAATAAAGAGACGTTCACTTTCTGGGATGACATGGTAAACCCAGCTTATCACCAACCAGTAGGAATTCAAACTAACGCGTTAGACGCATTAGGTTTCACTAGTGGATTCATGTTTAACGAATCACCTAACACTAGTTGGACTGCGATAGCTCAAGTTCTTAATGTTATCCCTAACCAACCATATACTATCAGTTACTTCCTACAAAAAATGAGTGCCGGAGATGGGAACTATAGGTTCAACATCTTAGTACAAGAATCACAACTAGAGAACCCAACAACAGATGGTGATTGGGCAACGATTAGTGGAGGTCAATTAGCAGATAATAGCAGCATTAAACACAGTGCGTTTATGCCATCTTACTTCGAGTTTACTCCAACAAAGAGTAAGATTCGACTAGTACTTATAGCCGCACCAAAATGCGTAGCTCAGATTTCTGGTATAATGGTTAACATAGGTAAAAAACCTATTAAGTGGACTATGTCTACTGGGGAGAACTACAATACCAACGTTCGTATGAACTTAAATGGTATCCGAGTATCTCAGGTAGATAAGGATGGCGCAGAAATCGGTTATACCGTTATAACGCCGGAGAAATTTGCAGGTTATTACATCAGGGACGGTAAGCCGGAAGAGATATTCCGACTGGATGGTGATGAGACTTGGACTAAAAAGTTAAGAGCAGAAAATGAGATAAATATGGGACCAATCAAGATACTACGCGTAGAGAATACGAACAACGCAGGTTGGGCATTTATTTCAAACTACTAG

Genome Context

Tertiary structure

PDB ID

49cbe5b96223bb9edbef0a33d060befcbfb8017a0a5db77359b70e9743e6bd7e

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7106

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence