UniProt accession
A0A024B3U2 [UniProt]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSVYDNHRTTFFVKADGTFRLGSRHVNGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVMVNGKPIGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKIKDMKDGARTSKDNLQKSIEALVKYIANDVNTNPITDANKLQITKLLDDIDNKKASLDGAAQMILLDPFLTDEQKVAVKKWYDKLNSDHTALKTTVMVAIQDGNLTAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITHLYNMVSIKVSSEQVTQQFIDLNTKIEKTQEETATALDDFQTQIDNTVKNLPYKVEVTSSNGLIFVNGGVNSTLAAKITKGTEDVTSTVAVADFIWTRVSNNTAADTTWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGIPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKHVRVEPTSFTDIGAGGQLEIKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLADITGESLLGTQDMKTSAQLDADTWGKGKFYSLRKQARDIAVDPNQDAAYKSLTTSYDALRTYLRALKTGAGRNTVYPWDTTSDVIMDVKRTEWDKAWADYENAYASLTVVVQQKQKDYTDNRIEDVNTEIKNISKTGQHATTDLRVPTTSISAPITTIALPSFKGFTKNNLQVGGVNYAYGTANKVEVKGNGAASTNQTVKPFTIKQDGLDLINTGKFICGYYWSIAQDGNNPVQGTMYVQLGGAPWTQIATPVAFSPSNMSGVYLADRNIAQSNGSGITDLQLRLDNVVGTVTVTNFMLTTNTTLETVEYSTNPTELRADGEYLYFNRNRAIAGVTMPTFYTAKNGTPDTARSSMTIQEVFHGNGSVYDDFHWTEDGTPTKTNKFADMLLDTGFSLAIQNQNVQLPNENGVTERYIQVQLNNFASRPMANNGTVRLANGKGLELERLASGNFTKYNQFKVDFANANMSFLVSAKEMNVAAAYQVKSEEVLFFMRGWKMFQGEPVQKNTGGVVTYTFNTYSGSDNSAPNFTPIGYVQKDQAIMNKGVLASTGEYKRPVEVAAPIRTKQTGQQWQVVYQLALPYDSTCQFTGAIDLIGDPEKVSPTVVRYTYVDWTPPFNDKDGTFMYGINLATAQEDTRYLIPVLERRIANAEQKVETDSIKSVVFSSREYELGLQDKASVADVEAKADKSDLTDLATKDELKSSEEARKRELEEAMKNIDFTPYVQKSEIEQLDRQWTAAFYSSGGMNIVKNSIGFDKSMSAKLNRETFTFWDDMINTAYHQPVNIQTNALDALGFTSGFMFNESPNTNWTAIAQVLNVIPNQPYTISYFLQKMNAGDSNYRFNILIQQTEKENPTSSDDWVTIQGGQISDNSSIKHSGFMPSYFEFTPTKSKVRLVLIAAPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGTEIGYTVITPERFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENPNNAGWAFISNY
Physico‐chemical
properties
protein length:2007 AA
molecular weight: 223001,54030 Da
isoelectric point:5,09371
aromaticity:0,09018
hydropathy:-0,50399

Domains

Domains [InterPro]
DC_0209
STR
9–925
Coil
Unmapped
549–569
A0A024B3U2
1 2007
Architecture
STR
STR
STR 9-925 | STR 953-2007
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage Megatron
[NCBI]
1486661 Uroviricota > Caudoviricetes > Herelleviridae > Wphvirus > Wphvirus megatron
Host Bacillus thuringiensis
[NCBI]
1428 cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AHZ10683.1 [NCBI]
Genbank nucleotide accession
KJ489401 [NCBI]
CDS location
range 54851 -> 60874
strand +
CDS
ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTATAAGTATAATACAGTTGACGTTATCACGGTAAGAGAAAACAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTACTCAGCTATGCTTCCAACTCATATGTCTGGACGTACAGCTAATGGTAATATCTATGGTTCTACTACATTAGTAACTGTAGGTACGCGTGTACTAATCGGTTTCATCGATGGTCAGGTTGACACACCAATCGTAATCAACATCTACGGTAAGACCGATGACCAACAACAATTAACACGTACAGACTTCACAGCAGCAGATGATTCAATTGAGTCTATCCAGCAAGAACTGTGGAACACTTTCAATCTATATCCATCAATGACTTATGAAAATGTCGATGGTAGAGGTAACCGTGAAGTGACATTCTCTGGTAAGACGTTCTTGATTTCGACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCGCATTTCGATTATATGGACCTTCCACATTCTCGTTATGCGAATGGAGAGCTTATCGAACCAGAATCTCCTGATGCACCAACAGTACTTTACGTTCACCAAAGCGTATATGACAACCATCGTACAACTTTCTTCGTGAAAGCAGACGGTACGTTCCGATTAGGTTCTCGTCATGTTAATGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTAATGGTTAATGGTAAGCCAATCGGTTCTGGTGGAGGTATATCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTACTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAAGTAGAGAAAGACACCTACTTCATCGACACTGCTGAGATTGAAGCTAAGATTAAAGACATGAAAGACGGTGCTCGTACAAGTAAAGATAATCTACAAAAATCTATTGAGGCACTAGTAAAGTATATTGCTAATGATGTTAACACAAATCCTATAACGGATGCTAACAAATTGCAAATTACGAAATTATTAGATGACATAGATAACAAGAAAGCATCTCTTGACGGTGCTGCACAGATGATACTGCTGGACCCATTCTTGACAGATGAGCAGAAAGTAGCTGTGAAGAAGTGGTACGATAAACTTAACTCTGACCACACTGCACTGAAGACGACTGTGATGGTAGCTATCCAAGATGGTAACTTAACAGCACAAGATAAAAAGGACATCTCAACTGCCGCAGAAACATACCTAAATGACCTAACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATTGTTGATGCATTCGAGAACGCAGTGAACTACGCGAACAAAGAGTCATTACACCAAAGTGCAGTAATCACTCATCTATATAACATGGTATCTATCAAAGTTAGTTCTGAGCAAGTGACACAGCAGTTCATTGATTTGAACACGAAGATAGAAAAGACACAAGAAGAGACAGCTACAGCACTAGACGATTTCCAAACTCAGATTGATAACACAGTTAAGAACTTACCATACAAGGTAGAAGTGACATCATCTAACGGTTTGATATTCGTAAATGGTGGAGTTAACTCTACGCTAGCAGCTAAGATTACAAAAGGTACTGAAGACGTAACAAGTACAGTAGCTGTTGCTGATTTCATATGGACTCGTGTTTCTAATAACACAGCAGCGGATACAACTTGGAACAACGCTCACAAAAATGTAGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGACTACAAGAACCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATCACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCTTTATGGTACGACCGCGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTAGAGATTAATAGATTCGATGTTAACATCCGTAACTTATTAATCGGTTCTCGTGACTATGGCGCACAGAACTCTAATAATCCAACAGACCCTAACAACTCGACACCTCAAGGTAATATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGGACGCCGCCTAAGACAGGAGTTAAACCTTCACCACAGAATGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAATCTAGTAAGCTCGCTAGCAGCGGTCTATTAGATGTGGGGGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGCGGAACAAGCCCTGATAAAGGCATACCTATTAGATTATATGTAACAGATAATCGCGATGGTGGTACTGGTACAATCGGTTTCGAAATGAAAGATAAAGAGACAGACGGTAAACCAGTAACTGGAGCCCCTGTACAGATGCGCGCAACACAGCAATGGAAGATGGTATGGGGTACATTCCCTGTAACACAATTATTCCTAGATACTGCAAATGACCCAAACAGTACATCTAAGCACGTACGAGTAGAGCCGACGAGTTTCACAGACATCGGAGCCGGAGGACAACTAGAAATTAAGTCTCATATGGTTGTTAAAGGAGTTATTCCTTCTGACTGGGTTCCAGCTCCAGAAGATACAAAGCGTGACTCAGATAACACCAACTGGAACATGGATGCTCTTGGAAGCGATAACTACCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAATTAGCAGACATTACAGGCGAGTCACTTCTTGGCACGCAGGACATGAAGACATCAGCTCAGTTAGATGCAGACACATGGGGCAAAGGTAAGTTCTACTCTTTACGTAAACAGGCTAGAGACATCGCTGTGGACCCGAACCAAGATGCAGCATACAAAAGCTTAACTACATCTTACGACGCACTTAGAACGTACCTGAGAGCTCTTAAAACAGGTGCTGGTCGAAACACAGTGTACCCATGGGATACTACCTCTGATGTAATCATGGATGTTAAGCGTACAGAATGGGACAAAGCGTGGGCAGATTACGAGAATGCTTATGCATCGTTAACAGTAGTTGTACAGCAAAAACAGAAAGACTACACAGATAATCGTATCGAAGATGTAAATACGGAAATCAAGAACATCAGTAAGACAGGTCAACACGCAACAACTGACCTACGAGTCCCTACTACATCTATTTCTGCACCGATAACAACAATCGCGTTACCTAGTTTCAAAGGTTTCACGAAAAATAACTTGCAAGTTGGTGGTGTGAACTACGCGTATGGAACAGCAAACAAGGTAGAGGTTAAAGGTAATGGCGCAGCTTCAACAAACCAGACAGTAAAACCATTTACGATTAAACAAGATGGACTAGACTTAATCAATACTGGTAAGTTCATTTGTGGGTATTACTGGTCAATCGCGCAGGATGGAAACAACCCTGTACAAGGTACAATGTATGTTCAATTAGGTGGAGCACCTTGGACACAGATAGCAACTCCTGTAGCATTCTCTCCAAGTAACATGTCAGGTGTCTACTTAGCGGATAGAAACATAGCCCAAAGTAACGGCTCAGGCATAACAGACTTGCAGTTGCGTTTAGACAATGTGGTAGGTACTGTAACAGTAACTAATTTCATGTTAACAACGAACACTACACTGGAGACTGTCGAGTACTCTACAAACCCTACAGAGTTAAGAGCTGATGGTGAGTATCTGTACTTTAACCGTAACAGAGCTATTGCAGGTGTAACAATGCCTACGTTCTACACAGCTAAGAACGGAACACCAGATACAGCTCGTTCATCCATGACAATCCAAGAAGTGTTCCACGGTAACGGTTCGGTTTATGATGACTTCCATTGGACAGAGGATGGTACACCAACTAAAACCAACAAGTTCGCAGACATGCTGTTAGATACTGGATTCTCTCTTGCTATCCAGAACCAAAACGTTCAACTTCCTAATGAGAACGGAGTTACAGAGCGATACATCCAAGTACAGCTTAATAACTTCGCTAGTAGACCGATGGCTAATAATGGTACGGTTCGATTAGCTAATGGTAAAGGTTTAGAGTTAGAAAGATTGGCATCTGGTAACTTTACTAAGTACAACCAGTTCAAAGTTGACTTTGCTAATGCGAACATGTCATTCCTCGTATCTGCTAAAGAAATGAACGTTGCAGCAGCATACCAAGTAAAGAGCGAAGAAGTGTTGTTCTTTATGCGAGGATGGAAAATGTTTCAAGGAGAGCCAGTGCAGAAAAATACAGGCGGTGTCGTAACGTACACGTTCAATACTTACTCTGGTTCCGATAACTCAGCTCCTAACTTCACTCCAATTGGTTACGTTCAAAAGGACCAAGCGATTATGAATAAAGGTGTACTCGCTTCTACAGGAGAGTACAAGCGCCCAGTTGAAGTCGCCGCACCTATAAGAACAAAACAAACAGGTCAACAGTGGCAAGTTGTGTATCAGTTAGCGTTACCGTATGATTCTACATGTCAGTTCACAGGAGCTATCGATTTAATAGGTGACCCAGAGAAAGTATCACCTACAGTAGTCCGTTATACGTACGTAGACTGGACACCACCATTCAATGACAAAGATGGTACATTTATGTACGGTATTAACTTAGCGACTGCACAAGAGGATACTAGATACCTTATACCTGTTCTTGAGAGACGTATTGCTAACGCAGAGCAGAAAGTAGAGACAGACTCTATCAAGAGTGTCGTATTTAGTTCTCGCGAGTATGAGTTAGGATTGCAAGATAAAGCAAGTGTAGCCGATGTAGAAGCTAAGGCTGATAAGTCGGACCTTACCGATTTAGCGACTAAGGACGAGTTAAAGAGTAGCGAGGAGGCGCGTAAGCGTGAATTAGAAGAGGCGATGAAAAATATCGACTTCACTCCTTATGTACAAAAGTCTGAGATTGAGCAGTTAGACAGACAATGGACAGCTGCATTCTACTCTTCTGGTGGTATGAATATCGTTAAGAATTCTATCGGGTTCGATAAATCGATGAGTGCTAAATTAAATAGAGAGACGTTCACTTTCTGGGACGATATGATTAACACGGCATACCATCAACCAGTTAATATCCAGACTAACGCATTAGACGCATTAGGATTCACTAGTGGGTTCATGTTTAACGAATCACCGAACACTAACTGGACAGCAATAGCTCAAGTGCTTAATGTTATCCCTAACCAACCATACACGATAAGTTATTTCTTACAGAAGATGAATGCAGGAGACAGCAACTACAGATTCAACATCCTAATCCAGCAGACAGAGAAAGAAAACCCAACATCAAGTGATGACTGGGTGACTATCCAAGGTGGTCAAATATCGGATAACAGTAGTATTAAGCACAGTGGTTTTATGCCTTCTTACTTCGAGTTTACTCCAACAAAGAGTAAGGTTCGATTGGTGTTAATTGCCGCTCCTAAATGCGTAGCACAGATTTCTGGTATAATGGTTAACATAGGGAAAAAACCCATCAAGTGGACAATGTCTACAGGGGAGAACTACAACACGAACGTTCGTATGAACTTAAACGGTATCCGAGTATCTCAGGTTGACAAGGATGGTACAGAAATTGGGTACACGGTCATCACACCGGAACGTTTCGCAGGTTATTACATCCGAGACGGTAAACCGGAAGAGATATTCCGACTCGACGGTGATGAAACTTGGACTAAAAAGTTAAGAGCCGAAAATGAGATAAACATGGGACCGATTAAGATTCTACGTGTTGAGAATCCTAACAACGCAGGATGGGCGTTTATTTCTAACTACTAG

Genome Context

Genome Context

Tertiary structure

PDB ID
19f806495cd2199896e56d44f355559bad846c685ae603dacd8ccf78394b00be
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7090
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50