Protein

View in Explore

Genbank accession

ABC40414.1 [GenBank]

Protein name

putative minor structural protein

RBP type

Evidence RBPdetect2

Probability 0,95

Protein sequence

MRTPSGILHVVDFKTDQIVAAIQPEDYWDDKRHWELKNNVDMLDFTAFDGTDHAVTLQQQNLVLKEVRDGRIVPYVITETEKNSDTRSITTYASGAWIQIAKSGIIKPQRIESKTVNEFMDLALLGMKWKRGITEYAGFHTMTIDEYIDPLTFLKKIASLFKLEIRYRVEIKGSRIIGWYVDMIQKRGHDTGKEIELGKDLVGVTRIEHTRNICSALVGFVKGEGDKVITIESINKGLPYIVDADAFQRWNEHGQHKFGFYTPETEELDMTPKRLLTLMEIELKKRVNSSISYEVEAQSIGRIFGLEHELINEGDTIKIKDTGFTPELYLEARVIAGDESFTDSTQDKYEFGDYREIVNQNEELRKIYNRILSSLGNKQEMIDQLDRLVQEANETASNAKKESEAAKTLAEKVQENIKNNTVEIIESKNPPTTGLKPFKTLWRDISIGKPGILKIWTGTAWESVVPDVESVKKETLDQVNKDIATTKTELNQKVQEAQNQATGQFNEVKESLQGVSRTISNVENKQGEIDKKITKFEQDSSGFKTSIESLTKKDTEISNKLNTVESTVEGTKKTISEVQQTTNDLKKKTTEIEEKAGKITEKLTSLETREVNVRNYVINSDFSNVTNSWIGITNATLFKFVDVNISEASAIKKGLQITSNKAFVYQKLPADVFKKKKGIASCYINVSSFTPGTDYPRLYMRFTYDQNGTEKQYYAILKQQEVTNGWIRISIPFDTTGYTGELKEVRVNIATADTTTIDATFTGIMVTFGDLIESWNLAPEDGVTQGVFQSKTTEIEKSVDGVKTTVTNVQNSQAGFEKRMSNVEQTATGLSSTVSNLNNVVSDQGKKLTEANTKLEQQATAIGAKVELKQVEDYVAGFKIPELKQTVDKNKQDLLDELANKLATEQFNQKMTLIDNRFTINEQGINAAAKKTEVYTKTQADGQFATDSYVRDMESRLQLTEKGVSISVKENDVIAAINMSKENIKLNAARIDLVGKVNAEWIKAGLLSGCQIRTSNTDNYVSLDDQFIRLYERGVARAFLGHYRRSDGAVQPTFILGSDEKTNAPEGTLFMSQAGAGWSGAYASIGISNGIVDGAVQKSVYWELQRNGLSVLNANDYHVFYAGNGNWYFRRGKPGLYQTSLVVEDNSTDSDLRLPNVTIRNSRAAGYTGVIQLKSPVTQNGWGAVQGNFMTPSLREYKSNIRDISFSALEKIRSLKIRQFNYKNAVNELYRMREEKSPNDPPLTTEDIKTYYGLIVDECDEMFVDESGKGIHLYSYASIGIKGLQEVDATVQEQEVEIANLKSQIASQEDRIARLEELLLQQLINKKPEQP

Physico‐chemical properties

protein length:	1331 AA
molecular weight:	149664,82530 Da
isoelectric point:	5,49056
aromaticity:	0,07889
hydropathy:	-0,51578

Domains

Domains [InterPro]

DC_1956
STR
1–668

DC_1956 DC_0497

IPR007119
Unmapped
29–352

IPR007119 PTHR34707 IPR030392

Coil
Unmapped
375–416

Coil G3DSA:1.10.287.1490 G3DSA:2.60.120.260 IPR030392 Coil

SSF57997
STR
474–610

SSF57997

Coil
Unmapped
476–507

Coil

ABC40414.1

1 1331

Architecture

STR

RBD

STR 1-765 | RBD 780-1331

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1956	STR	DC_1956	1	668	Novel HMM	DC_1956	Central	Low	Positional only	117 proteins / 117 hits
IPR007119	Unmapped	-	29	352	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
PTHR34707	Unmapped	-	363	957	PANTHER	VIMENTIN-TYPE INTERMEDIATE FILAMENT-ASSOCIATED COILED-COIL PROTEIN	-	-	-	-
Coil	Unmapped	-	375	416	Coils	Coil	-	-	-	-
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	470	614	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
SSF57997	STR	SSF57997	474	610	Merged direct domain	SSF57997	Central	Low	Positional only	14 proteins / 14 hits
Coil	Unmapped	-	476	507	Coils	Coil	-	-	-	-
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	615	765	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_0497	RBD	DC_0497	780	1331	Novel HMM	DC_0497	C-terminal	Low	Positional only	10 proteins / 10 hits
IPR030392	CHP	DC_0088	1193	1298	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1195	1261	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1284	1325	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage WBeta [NCBI]	2885908	Uroviricota > Caudoviricetes > Wbetavirus >
Host	Bacillus anthracis [NCBI]	1392	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

ABC40414.1 [NCBI]

Genbank nucleotide accession

DQ289555 [NCBI]

CDS location

range 13325 -> 17320
strand +

CDS

ATGAGAACACCAAGCGGGATTTTGCATGTTGTGGATTTTAAAACAGATCAAATCGTCGCAGCTATCCAACCAGAGGACTATTGGGATGACAAACGGCATTGGGAACTTAAAAATAATGTTGACATGTTGGATTTCACCGCATTTGATGGAACAGACCATGCAGTTACCTTACAACAACAGAATCTTGTTTTGAAAGAAGTTCGCGATGGAAGAATCGTACCATATGTTATTACAGAGACTGAAAAAAATTCCGATACACGATCTATTACCACATATGCTTCAGGAGCTTGGATTCAAATTGCGAAATCAGGGATTATAAAACCACAACGGATAGAGAGTAAGACGGTTAATGAGTTTATGGATTTAGCACTCTTAGGTATGAAGTGGAAACGCGGAATTACTGAATATGCTGGATTTCATACAATGACCATCGATGAATATATTGACCCACTCACTTTTTTAAAGAAGATTGCATCTTTATTTAAACTGGAAATTCGATATCGTGTTGAGATTAAAGGTTCAAGAATCATCGGTTGGTATGTAGATATGATTCAAAAACGTGGTCATGATACAGGCAAAGAAATAGAATTAGGAAAAGATTTAGTCGGTGTTACGCGAATTGAACATACACGTAATATTTGCTCTGCTTTAGTTGGATTTGTAAAAGGTGAAGGTGACAAAGTAATCACTATTGAAAGCATTAATAAAGGTCTACCCTATATCGTAGATGCAGATGCGTTTCAAAGATGGAATGAACACGGACAACATAAATTCGGTTTTTATACACCAGAAACAGAAGAATTAGACATGACTCCAAAACGTTTACTGACGCTTATGGAAATAGAATTGAAAAAGCGTGTCAACTCTTCAATTTCTTATGAAGTGGAAGCACAATCTATTGGTCGTATTTTCGGTCTAGAACACGAATTAATTAACGAAGGCGACACGATTAAAATTAAAGATACAGGGTTTACACCAGAATTATATCTTGAAGCGCGAGTAATAGCTGGGGATGAATCTTTTACAGATTCAACGCAAGATAAATATGAATTCGGAGATTATCGTGAGATAGTTAATCAAAATGAGGAATTAAGAAAAATTTATAATAGAATCCTTAGTTCGCTTGGTAATAAACAAGAAATGATAGATCAGCTAGACAGATTAGTTCAAGAAGCTAACGAAACCGCTAGTAATGCAAAGAAGGAGTCAGAAGCAGCAAAAACACTAGCTGAAAAAGTACAAGAAAATATTAAAAATAATACCGTTGAAATTATAGAATCTAAGAATCCACCGACAACAGGTCTTAAACCATTTAAAACGCTTTGGCGTGATATTAGTATCGGAAAGCCTGGTATTTTAAAAATATGGACAGGTACAGCGTGGGAATCGGTTGTACCTGATGTTGAATCTGTAAAAAAAGAAACATTAGATCAGGTTAATAAAGATATCGCAACCACAAAAACAGAGTTAAATCAAAAGGTTCAAGAAGCCCAGAACCAAGCGACTGGTCAATTCAATGAAGTGAAAGAGAGTTTACAAGGCGTTAGTCGTACGATTTCTAATGTTGAGAACAAACAAGGTGAAATCGATAAGAAGATTACTAAGTTTGAACAAGATTCAAGTGGATTTAAAACTTCAATTGAATCGTTAACGAAAAAAGATACTGAAATTAGTAATAAATTAAATACAGTTGAGTCTACTGTGGAAGGTACGAAAAAGACGATATCTGAGGTACAGCAAACAACTAATGATTTAAAGAAAAAAACTACTGAAATAGAAGAGAAGGCTGGAAAAATCACCGAAAAACTTACAAGTTTAGAGACAAGAGAAGTTAATGTTCGAAACTATGTAATTAACTCTGATTTTTCGAATGTTACAAATTCTTGGATTGGAATTACTAATGCAACTCTTTTTAAATTTGTAGATGTGAATATTTCGGAAGCCTCCGCTATTAAGAAAGGTTTACAAATAACAAGTAATAAAGCTTTTGTTTATCAGAAGTTACCCGCAGACGTGTTTAAAAAGAAGAAGGGGATAGCTTCTTGTTATATAAATGTATCAAGTTTTACACCTGGTACAGATTATCCACGTTTATATATGAGATTCACCTATGACCAAAACGGAACAGAAAAACAATATTATGCCATTTTAAAACAACAAGAAGTAACTAATGGATGGATTAGGATTTCTATACCATTTGATACAACTGGATATACAGGTGAATTAAAAGAAGTACGTGTAAATATAGCTACCGCTGACACAACTACTATCGATGCAACGTTCACTGGAATAATGGTTACATTCGGTGACTTAATTGAATCTTGGAATCTCGCTCCAGAAGATGGAGTAACACAAGGTGTTTTTCAATCTAAAACAACCGAGATTGAAAAAAGTGTGGATGGTGTAAAAACTACTGTAACAAATGTTCAAAATAGCCAAGCTGGATTTGAAAAGCGCATGTCTAATGTGGAACAAACAGCAACTGGATTATCTTCTACCGTAAGTAATTTAAACAATGTAGTATCCGATCAAGGAAAAAAGCTTACTGAAGCAAATACAAAACTCGAACAGCAAGCAACCGCGATTGGAGCAAAAGTTGAGCTTAAACAAGTAGAGGATTATGTTGCTGGGTTTAAGATTCCTGAGTTGAAACAAACAGTTGATAAAAATAAACAAGATTTATTAGATGAATTAGCCAATAAGCTTGCAACTGAACAATTTAACCAGAAGATGACTCTGATTGATAACCGTTTCACTATTAATGAACAGGGTATCAATGCCGCAGCAAAAAAGACAGAAGTATATACAAAGACGCAAGCAGATGGACAATTTGCTACAGATTCTTATGTAAGAGATATGGAGTCGCGCCTGCAGCTAACAGAAAAGGGTGTTAGCATATCTGTAAAAGAAAATGATGTAATCGCAGCCATTAACATGAGTAAAGAAAACATTAAGTTAAATGCTGCACGAATAGATTTAGTTGGTAAAGTTAATGCGGAGTGGATTAAAGCTGGATTGCTGAGCGGTTGCCAAATTAGAACATCAAATACGGATAACTATGTTAGTTTAGATGATCAATTTATACGTCTCTATGAAAGAGGAGTTGCTAGAGCATTTCTGGGGCATTACAGAAGATCAGATGGTGCAGTACAACCGACTTTCATCTTAGGTTCAGATGAAAAGACTAACGCTCCGGAAGGTACTTTGTTTATGTCTCAAGCAGGTGCAGGATGGTCAGGGGCTTATGCGAGCATTGGTATTAGCAATGGCATAGTTGATGGTGCAGTCCAAAAGTCTGTGTATTGGGAGTTGCAAAGAAACGGACTAAGTGTTCTAAACGCTAATGATTACCATGTTTTTTACGCTGGAAATGGAAATTGGTATTTCAGAAGAGGGAAACCAGGGTTGTATCAAACTTCGTTAGTCGTTGAAGATAATAGTACAGATTCTGATTTAAGATTACCTAATGTAACTATACGTAATAGCCGTGCAGCAGGATATACAGGAGTTATTCAATTGAAATCCCCTGTTACTCAAAATGGATGGGGTGCTGTTCAAGGGAATTTTATGACTCCTTCATTACGGGAGTATAAATCTAATATCCGTGATATTTCTTTTTCCGCCTTAGAAAAAATTAGAAGTCTTAAAATTAGACAATTTAATTATAAGAATGCTGTAAACGAACTATACCGGATGAGAGAAGAGAAAAGTCCCAATGATCCACCATTGACAACAGAAGATATTAAAACATACTACGGTTTAATCGTAGATGAATGTGATGAAATGTTTGTGGATGAAAGTGGGAAAGGAATTCATTTGTACTCATACGCATCCATTGGAATTAAAGGTTTACAAGAAGTTGATGCAACAGTACAGGAACAGGAGGTAGAAATAGCAAATCTAAAATCACAAATAGCTAGTCAAGAAGATCGGATAGCACGATTAGAAGAATTATTACTACAACAATTAATAAATAAGAAACCAGAGCAGCCATAG

Genome Context

Tertiary structure

PDB ID

8564ba9b5b6c0c360d8f4aeddd39537efe48a14682f38fac6a1ab007532743ee

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7512

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence