Genbank accession
ABC40414.1 [GenBank]
Protein name
putative minor structural protein
RBP type
TF
Evidence RBPdetect2
Probability 0,95
Protein sequence
MRTPSGILHVVDFKTDQIVAAIQPEDYWDDKRHWELKNNVDMLDFTAFDGTDHAVTLQQQNLVLKEVRDGRIVPYVITETEKNSDTRSITTYASGAWIQIAKSGIIKPQRIESKTVNEFMDLALLGMKWKRGITEYAGFHTMTIDEYIDPLTFLKKIASLFKLEIRYRVEIKGSRIIGWYVDMIQKRGHDTGKEIELGKDLVGVTRIEHTRNICSALVGFVKGEGDKVITIESINKGLPYIVDADAFQRWNEHGQHKFGFYTPETEELDMTPKRLLTLMEIELKKRVNSSISYEVEAQSIGRIFGLEHELINEGDTIKIKDTGFTPELYLEARVIAGDESFTDSTQDKYEFGDYREIVNQNEELRKIYNRILSSLGNKQEMIDQLDRLVQEANETASNAKKESEAAKTLAEKVQENIKNNTVEIIESKNPPTTGLKPFKTLWRDISIGKPGILKIWTGTAWESVVPDVESVKKETLDQVNKDIATTKTELNQKVQEAQNQATGQFNEVKESLQGVSRTISNVENKQGEIDKKITKFEQDSSGFKTSIESLTKKDTEISNKLNTVESTVEGTKKTISEVQQTTNDLKKKTTEIEEKAGKITEKLTSLETREVNVRNYVINSDFSNVTNSWIGITNATLFKFVDVNISEASAIKKGLQITSNKAFVYQKLPADVFKKKKGIASCYINVSSFTPGTDYPRLYMRFTYDQNGTEKQYYAILKQQEVTNGWIRISIPFDTTGYTGELKEVRVNIATADTTTIDATFTGIMVTFGDLIESWNLAPEDGVTQGVFQSKTTEIEKSVDGVKTTVTNVQNSQAGFEKRMSNVEQTATGLSSTVSNLNNVVSDQGKKLTEANTKLEQQATAIGAKVELKQVEDYVAGFKIPELKQTVDKNKQDLLDELANKLATEQFNQKMTLIDNRFTINEQGINAAAKKTEVYTKTQADGQFATDSYVRDMESRLQLTEKGVSISVKENDVIAAINMSKENIKLNAARIDLVGKVNAEWIKAGLLSGCQIRTSNTDNYVSLDDQFIRLYERGVARAFLGHYRRSDGAVQPTFILGSDEKTNAPEGTLFMSQAGAGWSGAYASIGISNGIVDGAVQKSVYWELQRNGLSVLNANDYHVFYAGNGNWYFRRGKPGLYQTSLVVEDNSTDSDLRLPNVTIRNSRAAGYTGVIQLKSPVTQNGWGAVQGNFMTPSLREYKSNIRDISFSALEKIRSLKIRQFNYKNAVNELYRMREEKSPNDPPLTTEDIKTYYGLIVDECDEMFVDESGKGIHLYSYASIGIKGLQEVDATVQEQEVEIANLKSQIASQEDRIARLEELLLQQLINKKPEQP
Physico‐chemical
properties
protein length:1331 AA
molecular weight: 149664,82530 Da
isoelectric point:5,49056
aromaticity:0,07889
hydropathy:-0,51578

Domains

Domains [InterPro]
DC_1956
STR
1–668
IPR007119
Unmapped
29–352
SSF57997
STR
474–610
Coil
Unmapped
476–507
ABC40414.1
1 1331
Architecture
STR
RBD
STR 1-765 | RBD 780-1331
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage WBeta
[NCBI]
2885908 Uroviricota > Caudoviricetes > Wbetavirus >
Host Bacillus anthracis
[NCBI]
1392 cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ABC40414.1 [NCBI]
Genbank nucleotide accession
DQ289555 [NCBI]
CDS location
range 13325 -> 17320
strand +
CDS
ATGAGAACACCAAGCGGGATTTTGCATGTTGTGGATTTTAAAACAGATCAAATCGTCGCAGCTATCCAACCAGAGGACTATTGGGATGACAAACGGCATTGGGAACTTAAAAATAATGTTGACATGTTGGATTTCACCGCATTTGATGGAACAGACCATGCAGTTACCTTACAACAACAGAATCTTGTTTTGAAAGAAGTTCGCGATGGAAGAATCGTACCATATGTTATTACAGAGACTGAAAAAAATTCCGATACACGATCTATTACCACATATGCTTCAGGAGCTTGGATTCAAATTGCGAAATCAGGGATTATAAAACCACAACGGATAGAGAGTAAGACGGTTAATGAGTTTATGGATTTAGCACTCTTAGGTATGAAGTGGAAACGCGGAATTACTGAATATGCTGGATTTCATACAATGACCATCGATGAATATATTGACCCACTCACTTTTTTAAAGAAGATTGCATCTTTATTTAAACTGGAAATTCGATATCGTGTTGAGATTAAAGGTTCAAGAATCATCGGTTGGTATGTAGATATGATTCAAAAACGTGGTCATGATACAGGCAAAGAAATAGAATTAGGAAAAGATTTAGTCGGTGTTACGCGAATTGAACATACACGTAATATTTGCTCTGCTTTAGTTGGATTTGTAAAAGGTGAAGGTGACAAAGTAATCACTATTGAAAGCATTAATAAAGGTCTACCCTATATCGTAGATGCAGATGCGTTTCAAAGATGGAATGAACACGGACAACATAAATTCGGTTTTTATACACCAGAAACAGAAGAATTAGACATGACTCCAAAACGTTTACTGACGCTTATGGAAATAGAATTGAAAAAGCGTGTCAACTCTTCAATTTCTTATGAAGTGGAAGCACAATCTATTGGTCGTATTTTCGGTCTAGAACACGAATTAATTAACGAAGGCGACACGATTAAAATTAAAGATACAGGGTTTACACCAGAATTATATCTTGAAGCGCGAGTAATAGCTGGGGATGAATCTTTTACAGATTCAACGCAAGATAAATATGAATTCGGAGATTATCGTGAGATAGTTAATCAAAATGAGGAATTAAGAAAAATTTATAATAGAATCCTTAGTTCGCTTGGTAATAAACAAGAAATGATAGATCAGCTAGACAGATTAGTTCAAGAAGCTAACGAAACCGCTAGTAATGCAAAGAAGGAGTCAGAAGCAGCAAAAACACTAGCTGAAAAAGTACAAGAAAATATTAAAAATAATACCGTTGAAATTATAGAATCTAAGAATCCACCGACAACAGGTCTTAAACCATTTAAAACGCTTTGGCGTGATATTAGTATCGGAAAGCCTGGTATTTTAAAAATATGGACAGGTACAGCGTGGGAATCGGTTGTACCTGATGTTGAATCTGTAAAAAAAGAAACATTAGATCAGGTTAATAAAGATATCGCAACCACAAAAACAGAGTTAAATCAAAAGGTTCAAGAAGCCCAGAACCAAGCGACTGGTCAATTCAATGAAGTGAAAGAGAGTTTACAAGGCGTTAGTCGTACGATTTCTAATGTTGAGAACAAACAAGGTGAAATCGATAAGAAGATTACTAAGTTTGAACAAGATTCAAGTGGATTTAAAACTTCAATTGAATCGTTAACGAAAAAAGATACTGAAATTAGTAATAAATTAAATACAGTTGAGTCTACTGTGGAAGGTACGAAAAAGACGATATCTGAGGTACAGCAAACAACTAATGATTTAAAGAAAAAAACTACTGAAATAGAAGAGAAGGCTGGAAAAATCACCGAAAAACTTACAAGTTTAGAGACAAGAGAAGTTAATGTTCGAAACTATGTAATTAACTCTGATTTTTCGAATGTTACAAATTCTTGGATTGGAATTACTAATGCAACTCTTTTTAAATTTGTAGATGTGAATATTTCGGAAGCCTCCGCTATTAAGAAAGGTTTACAAATAACAAGTAATAAAGCTTTTGTTTATCAGAAGTTACCCGCAGACGTGTTTAAAAAGAAGAAGGGGATAGCTTCTTGTTATATAAATGTATCAAGTTTTACACCTGGTACAGATTATCCACGTTTATATATGAGATTCACCTATGACCAAAACGGAACAGAAAAACAATATTATGCCATTTTAAAACAACAAGAAGTAACTAATGGATGGATTAGGATTTCTATACCATTTGATACAACTGGATATACAGGTGAATTAAAAGAAGTACGTGTAAATATAGCTACCGCTGACACAACTACTATCGATGCAACGTTCACTGGAATAATGGTTACATTCGGTGACTTAATTGAATCTTGGAATCTCGCTCCAGAAGATGGAGTAACACAAGGTGTTTTTCAATCTAAAACAACCGAGATTGAAAAAAGTGTGGATGGTGTAAAAACTACTGTAACAAATGTTCAAAATAGCCAAGCTGGATTTGAAAAGCGCATGTCTAATGTGGAACAAACAGCAACTGGATTATCTTCTACCGTAAGTAATTTAAACAATGTAGTATCCGATCAAGGAAAAAAGCTTACTGAAGCAAATACAAAACTCGAACAGCAAGCAACCGCGATTGGAGCAAAAGTTGAGCTTAAACAAGTAGAGGATTATGTTGCTGGGTTTAAGATTCCTGAGTTGAAACAAACAGTTGATAAAAATAAACAAGATTTATTAGATGAATTAGCCAATAAGCTTGCAACTGAACAATTTAACCAGAAGATGACTCTGATTGATAACCGTTTCACTATTAATGAACAGGGTATCAATGCCGCAGCAAAAAAGACAGAAGTATATACAAAGACGCAAGCAGATGGACAATTTGCTACAGATTCTTATGTAAGAGATATGGAGTCGCGCCTGCAGCTAACAGAAAAGGGTGTTAGCATATCTGTAAAAGAAAATGATGTAATCGCAGCCATTAACATGAGTAAAGAAAACATTAAGTTAAATGCTGCACGAATAGATTTAGTTGGTAAAGTTAATGCGGAGTGGATTAAAGCTGGATTGCTGAGCGGTTGCCAAATTAGAACATCAAATACGGATAACTATGTTAGTTTAGATGATCAATTTATACGTCTCTATGAAAGAGGAGTTGCTAGAGCATTTCTGGGGCATTACAGAAGATCAGATGGTGCAGTACAACCGACTTTCATCTTAGGTTCAGATGAAAAGACTAACGCTCCGGAAGGTACTTTGTTTATGTCTCAAGCAGGTGCAGGATGGTCAGGGGCTTATGCGAGCATTGGTATTAGCAATGGCATAGTTGATGGTGCAGTCCAAAAGTCTGTGTATTGGGAGTTGCAAAGAAACGGACTAAGTGTTCTAAACGCTAATGATTACCATGTTTTTTACGCTGGAAATGGAAATTGGTATTTCAGAAGAGGGAAACCAGGGTTGTATCAAACTTCGTTAGTCGTTGAAGATAATAGTACAGATTCTGATTTAAGATTACCTAATGTAACTATACGTAATAGCCGTGCAGCAGGATATACAGGAGTTATTCAATTGAAATCCCCTGTTACTCAAAATGGATGGGGTGCTGTTCAAGGGAATTTTATGACTCCTTCATTACGGGAGTATAAATCTAATATCCGTGATATTTCTTTTTCCGCCTTAGAAAAAATTAGAAGTCTTAAAATTAGACAATTTAATTATAAGAATGCTGTAAACGAACTATACCGGATGAGAGAAGAGAAAAGTCCCAATGATCCACCATTGACAACAGAAGATATTAAAACATACTACGGTTTAATCGTAGATGAATGTGATGAAATGTTTGTGGATGAAAGTGGGAAAGGAATTCATTTGTACTCATACGCATCCATTGGAATTAAAGGTTTACAAGAAGTTGATGCAACAGTACAGGAACAGGAGGTAGAAATAGCAAATCTAAAATCACAAATAGCTAGTCAAGAAGATCGGATAGCACGATTAGAAGAATTATTACTACAACAATTAATAAATAAGAAACCAGAGCAGCCATAG

Genome Context

Genome Context

Tertiary structure

PDB ID
8564ba9b5b6c0c360d8f4aeddd39537efe48a14682f38fac6a1ab007532743ee
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7512
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50