Protein

View in Explore

Genbank accession

YP_009273347.1 [GenBank]

Protein name

tail spike protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,90

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MLPHAIGGQVNSQDLNDNFSYLDSEKLGKDELTYLNIKDNGALGDGVMDDTLAIQSILDNLQDGDEVVIPFGEYLVNKNTALLDFPNNDQPCLLLRGKKNIRILAHGATFKTNTHGQGVLELQLCENVVIEGLKVEGHGSFPALDGTTGRGEKGTSTAGYPTQQQWGFYKNNAADLGHGSFGGGYIGNAGIGIMIHRGCKNIRFIRCEAAGFNYSGFGVGHNGDYNPTFLNYADSENILFENCIGTDNYSSNFHFLAVDGGKLVNCVSERAGHPNALYTHDAVDPGYGVTLIGSDWSNSKNVEILNSTFKDDKRKGIDVHGGDGVRIHGNRVENAIMSGIFAKSTSVNMPVKNVSIEGNTVVNSSYHAQSFGAILIGGLNGVNYSKANAYFNGIVSKNKLINCGNGIICSPYDTLEISNNTVDGVDNRATVPFEGIRAGTLASAEKNYNGNIKGNIVNSRGNALMTQGVTVRYLQEGHVNDNIIILENDAAGTGLYLVACENVNAVDNYAKLLNNGTAIADTQTKGKVSNIGLGGTPSVKQTTGQVIHFLLTCNGGDGTKTYFSGANLVASVVSNTYGIAINLQGVSKGVRPFSNVSIASSDGIKNASEVVHSYFYNRTANDAQVIIGVKANAGAGHSPLNTLTNGTIEIKIEL

Physico‐chemical properties

protein length:	654 AA
molecular weight:	69400,53950 Da
isoelectric point:	5,71615
aromaticity:	0,07492
hydropathy:	-0,20765

Domains

Domains [InterPro]

IPR011050
STR
33–458

IPR011050

IPR012334
STR
35–399

IPR012334 IPR006626 IPR006626

IPR024535
ENZ
35–79

IPR024535 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

DC_0453
RBD
365–542

DC_0453

YP_009273347.1

1 654

Architecture

STR

RBD

STR 33-458 | RBD 459-542 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR011050	STR	IPR011050	33	458	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	35	399	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR024535	ENZ	DC_0410	35	79	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
IPR006626	Unmapped	-	125	197	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	199	221	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	235	257	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	299	321	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	322	344	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	351	378	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_0453	RBD	DC_0453	365	542	Novel HMM	DC_0453	C-terminal	Low	Positional only	102 proteins / 102 hits
IPR006626	Unmapped	-	390	411	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	412	440	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	447	473	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009273347.1

1 654

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	49	49	0,9643
Central domain	50	531	483	0,9873
C-terminal	532	654	122	0,9812

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-49

Central
50-531

C-terminal
532-654

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage vB_BhaS-171 [NCBI]	1775140	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus halmapalus [NCBI]	79882	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

YP_009273347.1 [NCBI]

Genbank nucleotide accession

NC_030904 [NCBI]

CDS location

range 16184 -> 18148
strand +

CDS

ATGTTACCACACGCAATAGGTGGTCAAGTGAATTCACAGGACTTGAATGATAACTTCTCCTACCTAGACAGTGAGAAGTTAGGCAAGGATGAATTAACCTACCTAAACATCAAAGATAATGGAGCTTTAGGGGATGGGGTAATGGATGATACCCTGGCCATCCAATCTATATTAGACAACCTTCAAGACGGGGATGAAGTAGTCATTCCATTTGGAGAGTATCTGGTCAATAAGAATACTGCACTACTTGATTTTCCGAACAACGATCAACCCTGCTTGTTATTAAGGGGAAAGAAAAACATTCGCATTCTGGCGCATGGAGCGACCTTTAAAACTAATACACATGGTCAAGGGGTATTGGAACTGCAACTATGCGAAAACGTGGTAATCGAAGGGCTGAAGGTCGAGGGACACGGTTCCTTCCCGGCACTTGATGGAACAACGGGACGTGGAGAAAAAGGAACTTCTACCGCAGGATATCCGACACAACAGCAATGGGGATTCTATAAGAACAATGCTGCCGATTTAGGTCATGGCTCATTTGGTGGTGGGTATATCGGTAATGCTGGCATAGGCATCATGATACATCGAGGTTGTAAAAACATTCGTTTCATCCGATGTGAAGCGGCAGGATTTAACTATTCCGGGTTTGGAGTTGGTCATAATGGCGACTACAACCCTACTTTCTTGAACTATGCGGATTCGGAAAACATACTTTTTGAAAATTGCATAGGGACGGATAACTACAGTTCCAACTTTCATTTCTTGGCTGTGGATGGTGGCAAGCTTGTTAATTGCGTATCGGAACGTGCAGGACATCCTAATGCACTTTACACACATGACGCAGTAGATCCTGGTTATGGGGTAACATTAATCGGTTCCGATTGGTCAAATTCCAAAAACGTTGAAATCCTCAATTCCACATTCAAGGATGACAAGCGCAAAGGAATTGATGTACATGGTGGCGATGGGGTGAGGATTCATGGAAATCGTGTGGAGAATGCGATTATGTCAGGAATCTTTGCGAAATCCACCTCGGTCAATATGCCAGTGAAAAATGTAAGCATCGAGGGAAATACAGTCGTCAACTCTTCCTATCATGCCCAAAGCTTCGGGGCTATTCTGATAGGTGGATTAAACGGTGTGAATTATTCCAAAGCAAATGCTTATTTTAATGGTATCGTTTCTAAAAACAAATTGATCAATTGTGGTAATGGTATCATTTGCTCTCCTTATGACACCTTAGAAATATCGAACAACACTGTGGATGGTGTGGATAACCGGGCGACAGTCCCTTTCGAGGGTATACGGGCAGGGACCTTGGCATCTGCTGAGAAAAACTATAATGGCAACATTAAAGGGAACATCGTAAACAGCCGGGGGAACGCACTCATGACCCAAGGTGTGACAGTTCGCTATCTCCAAGAAGGTCATGTCAATGACAACATCATCATACTTGAAAACGATGCTGCAGGAACAGGATTGTATCTGGTAGCCTGCGAAAATGTCAATGCGGTGGATAACTATGCCAAACTCCTGAATAACGGTACTGCCATCGCAGATACGCAAACCAAAGGCAAGGTATCTAATATCGGGTTAGGCGGGACACCTTCCGTCAAGCAAACAACAGGCCAAGTAATTCACTTCCTATTGACATGTAATGGAGGAGACGGTACCAAAACATATTTCTCAGGTGCAAATCTCGTTGCTTCTGTGGTGTCCAACACCTACGGAATAGCAATCAACCTACAAGGTGTATCAAAAGGTGTGCGGCCATTCTCAAACGTATCTATCGCTTCATCTGATGGGATTAAGAACGCATCGGAAGTGGTACACTCCTATTTCTATAACCGTACCGCAAATGATGCTCAAGTTATTATCGGCGTCAAGGCAAATGCGGGAGCTGGTCACAGTCCTTTGAACACTTTGACGAACGGTACGATAGAAATCAAGATTGAATTGTAG

Genome Context

Tertiary structure

PDB ID

2ba663b9650f649b4d6e917a3d3fd4867008c64df3d2b8eecd40cee203ca4169

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7490

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence