Protein

View in Explore

Genbank accession

XBS49904.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence RBPdetect2

Probability 0,69

Protein sequence

MYPIPCLFLTLSGGGTEPLPPGSVKKVAFTRGLVGGATKRSMAILLIDGRLYTQGDNAWSECANGNISPFKDHWHLAANGVADVFGGGRAFVVKYNNGGWQYCGDTSQFTGSGSIYSSWTSFPSSITGTVSLANLQSVSCALGNTLWQMVDGRLYGSGSNTNGCLGSGNTTVISIPRSISASSVRAYSLNACVTYLNNIGLPRVCGATHQIDGTSTTQTQNFIDVSFASVTETVYVKEWLANETNSMAIASTGVDDTEHYLYTRGIGTAQYSKKEGIGPFETFRVIDGGQSHFLIADDKLYGLGDLSAQLGLGTPSTMVLEPTLVPVPTGRDWDLSKLTYIVDMKTDVLNQGNSISHWMVYDGNLYYAGNLYGFFGSTDSTGEFTNIPEASFGGTTADAITTGSIPYAIKGSRSQLTWTVEPADAEIYDISFTSSAPNIATVDSNGIMTFLEEGGFDITMTAKTGSGADAKTLTDTSGGYVSIFSVTTDSIPQKEVGDVFVFMDKNSPDYTPGPNVVGMEISPANVDINFIDGEFTTTNPDVVMIDEGGFLSCIAVGDARCGVRLIYREGQVEAFDDSYVSVSDFTAPPDPVDPGEPVVPSQPQ

Physico‐chemical properties

protein length:	604 AA
molecular weight:	64104,56140 Da
isoelectric point:	4,34843
aromaticity:	0,09934
hydropathy:	-0,07434

Domains

Domains [InterPro]

IPR009091
STR
37–401

IPR009091 G3DSA:2.60.40.1080 DC_1711

IPR009091
STR
41–377

IPR009091 IPR008964

DC_0918
STR
77–202

DC_0918 DC_0179

IPR000408
STR
151–183

IPR000408 IPR003343

XBS49904.1

1 604

Architecture

STR

RBD

STR 37-503 | RBD 504-601 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR009091	STR	IPR009091	37	401	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
IPR009091	STR	IPR009091	41	377	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
DC_0918	STR	DC_0918	77	202	Novel HMM	DC_0918	Central	Low	Positional only	78 proteins / 78 hits
IPR000408	STR	DC_0062	151	183	InterPro cluster	Regulator of chromosome condensation, RCC1	Central	Low	Positional only	52 proteins / 98 hits
DC_0179	STR	DC_0179	330	503	Novel HMM	DC_0179	Central	Low	Positional only	58 proteins / 58 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	402	475	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR008964	RBD	IPR008964	405	468	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
IPR003343	STR	DC_0008	409	472	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
DC_1711	RBD	DC_1711	480	601	Novel HMM	DC_1711	C-terminal	Low	Positional only	141 proteins / 141 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XBS49904.1

1 604

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	86	86	0,0686
Central domain	87	347	262	0,7672
C-terminal	348	604	256	0,1363

Note: Constraints were applied during segmentation.
Fixed 89 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-86

Central
87-347

C-terminal
348-604

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SalP219 [NCBI]	3158864	Uroviricota > Caudoviricetes > Vequintavirinae >
Host	Salmonella enterica [NCBI]	28901	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XBS49904.1 [NCBI]

Genbank nucleotide accession

PP595732 [NCBI]

CDS location

range 95773 -> 97587
strand +

CDS

ATGTATCCTATTCCATGTCTCTTCTTGACATTATCTGGAGGAGGAACAGAACCACTACCACCAGGTAGTGTTAAGAAGGTGGCCTTTACCCGTGGTCTGGTTGGTGGTGCTACCAAAAGGTCAATGGCGATCCTCCTGATTGATGGGAGACTCTATACCCAAGGGGATAATGCGTGGTCTGAATGCGCAAACGGGAACATAAGCCCGTTTAAGGATCATTGGCACTTGGCGGCTAATGGTGTAGCTGATGTTTTTGGTGGTGGTAGAGCCTTTGTTGTCAAATACAACAATGGTGGCTGGCAGTATTGTGGGGACACCAGTCAATTCACTGGTAGTGGGTCTATCTATTCTTCTTGGACAAGCTTCCCTTCATCAATCACAGGCACAGTATCCCTCGCAAATTTACAAAGTGTTTCTTGTGCTCTCGGTAACACACTCTGGCAGATGGTAGATGGAAGACTTTATGGAAGCGGGTCAAACACAAATGGATGCCTTGGCTCTGGTAATACTACCGTAATATCGATCCCAAGAAGTATTAGTGCATCCTCTGTGAGAGCTTACAGCTTAAATGCTTGCGTGACATACCTGAACAATATTGGACTTCCCCGTGTTTGTGGGGCCACCCATCAGATAGATGGTACTTCAACAACACAAACACAAAACTTTATCGATGTTAGTTTTGCCTCTGTGACTGAAACCGTCTATGTTAAAGAGTGGTTAGCGAACGAAACAAACTCAATGGCTATCGCCTCTACAGGTGTTGATGATACAGAGCATTATTTATATACGAGGGGTATCGGGACAGCCCAATACTCTAAGAAAGAGGGTATTGGTCCTTTCGAGACATTCAGGGTTATCGACGGTGGTCAGTCTCATTTCCTGATTGCTGATGACAAGCTTTACGGTCTTGGTGACCTAAGTGCTCAACTTGGCCTTGGCACACCATCAACAATGGTGTTAGAACCGACCCTTGTTCCAGTTCCTACAGGAAGGGATTGGGATCTTTCGAAGCTGACATACATTGTAGACATGAAGACAGATGTCCTTAACCAGGGGAACTCTATCAGCCATTGGATGGTGTATGACGGGAACCTTTACTACGCTGGTAACCTTTATGGTTTCTTTGGGTCAACCGATAGCACTGGTGAGTTCACAAACATCCCAGAAGCATCCTTTGGGGGGACAACTGCGGATGCTATCACCACAGGGTCTATCCCATACGCTATCAAAGGGTCGAGAAGTCAACTTACGTGGACTGTTGAGCCAGCAGATGCTGAGATTTATGATATTTCGTTCACATCGAGTGCTCCTAATATCGCAACTGTAGACTCAAATGGTATCATGACCTTCCTTGAAGAGGGTGGTTTTGACATCACAATGACTGCTAAAACAGGGTCTGGCGCGGATGCTAAAACACTCACAGATACTTCTGGCGGTTATGTTTCCATCTTCTCTGTGACTACCGATTCCATCCCACAAAAGGAAGTTGGTGATGTGTTCGTGTTCATGGATAAAAACAGTCCTGACTATACACCAGGTCCGAACGTTGTCGGAATGGAAATTTCTCCAGCCAATGTTGATATTAACTTCATAGACGGAGAATTCACAACTACAAATCCGGATGTGGTGATGATTGATGAGGGTGGATTCCTTTCCTGTATTGCAGTTGGTGATGCCCGTTGTGGTGTTCGTCTTATTTACAGGGAGGGTCAGGTTGAGGCATTTGATGATTCGTATGTCAGTGTTTCAGACTTCACAGCCCCACCAGATCCTGTGGACCCCGGCGAACCAGTTGTACCTTCTCAACCGCAATAA

Genome Context

Tertiary structure

PDB ID

07ff89587d1988c41d36546d13efc1fc32d4cf2857bdd897b8412ef731a23056

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8284

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence