Protein

View in Explore

Genbank accession

WDS51313.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,96

Protein sequence

MNPQFAQPKGSTSKETNKDSIARKFGCKKSEVVYAKSGQSLSGYKVIYDKVSQRAYALPSNIGAVAVTSLVDGVLTHSGGTVDLGELAVLRGEFVALIEDFSDGFAIHTKNEMIRSNNSFYRWGGSLPKVVSSGLTIGNTGGVSGSAWIFVKNTASEKETYMSNWVSIGEDISGIMNDLLNAYDTIYLDIDVGLSSNVVNNLDGKRIIGNGNKINLLGNSFDTNKGAIELTGNYTEVSGVVFTTTTATVTPLRLGNTSYGSTDNTRRVGVRCNKCVFENTGFKGPNQGNLVVIGALYPEITYPRFVGVSRAGGNMEVLGCKGGYVSEGYAENGLLINFHGTSADGIGFPTTDFQFINCEGVMNSSVLGDVEGVVGGNNNIKFSRGCSGCKIIGGKFVSVSAGSFNGNDHVIAIQGCSNNTVEGVVVQMNNNGDYKSAFGISDHNVSLTDSYDNVIQNCFVQINTPGQYNRILQIQSNAGKSIRRNKLINVSFNCYNGSNTVDAVCEQTSTTSGLVSDTQILGCTGLGVTNVLLNRSGLASTAITYLQGNRIGTVMNSTVLNSGVVRIIDQPISVIVNGSGVLTSAVNCTVSKTSPGVWVINSFTSMNKLAVSFSSPGTGRYCVITKTSDYSWTITLYNPSAVVTEMEFNLIIG

Physico‐chemical properties

protein length:	653 AA
molecular weight:	69207,00800 Da
isoelectric point:	6,92597
aromaticity:	0,07963
hydropathy:	-0,02466

Domains

Domains [InterPro]

IPR040775
RBD
100–151

IPR040775 DC_2141

WDS51313.1

1 653

Architecture

RBD

STR

RBD 100-151 | STR 152-653

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR040775	RBD	DC_0821	100	151	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
DC_2141	STR	DC_2141	152	653	Novel HMM	DC_2141	Central	Low	Positional only	3 proteins / 3 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WDS51313.1

1 653

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	172	172	0,9952
Central domain	173	553	382	0,9847
C-terminal	554	653	99	0,9647

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-172

Central
173-553

C-terminal
554-653

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SeF3a [NCBI]	2876784	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

WDS51313.1 [NCBI]

Genbank nucleotide accession

ON809763.1 [NCBI]

CDS location

range 147316 -> 149277
strand +

CDS

ATGAATCCGCAATTTGCTCAACCAAAAGGTTCTACTTCAAAAGAAACGAATAAAGATAGCATCGCCCGTAAATTTGGGTGCAAAAAGTCGGAAGTCGTTTATGCGAAATCAGGGCAGTCCTTGTCTGGTTATAAAGTGATCTACGATAAGGTATCTCAACGTGCCTACGCTCTCCCTTCTAACATTGGTGCTGTAGCGGTCACCAGTTTGGTGGACGGTGTCCTCACGCACTCTGGAGGCACCGTAGATTTGGGAGAACTGGCCGTTTTGCGTGGGGAATTTGTTGCGTTAATAGAAGATTTTTCTGATGGATTTGCAATTCACACCAAAAATGAAATGATAAGAAGCAATAATTCCTTTTATCGTTGGGGTGGTTCTCTTCCAAAAGTTGTTTCTTCAGGGTTGACAATTGGGAACACAGGCGGAGTTTCTGGTTCAGCTTGGATTTTTGTAAAGAATACAGCTAGTGAAAAAGAAACTTACATGTCAAATTGGGTTTCTATTGGGGAAGATATTTCCGGCATAATGAATGACCTTTTAAATGCGTATGATACAATTTATTTGGATATTGATGTTGGGTTATCGAGTAATGTGGTGAATAATTTAGATGGTAAACGCATCATCGGAAATGGAAACAAGATCAATTTGTTGGGGAATTCTTTTGACACGAATAAAGGAGCTATAGAATTAACTGGAAATTATACTGAGGTTTCTGGTGTGGTGTTTACGACTACCACAGCGACAGTAACACCTTTGCGTTTAGGGAACACTTCTTACGGTTCAACCGATAATACTCGGCGTGTTGGTGTCCGGTGTAATAAATGCGTGTTTGAAAATACAGGGTTTAAAGGACCGAACCAAGGTAATTTGGTTGTTATAGGCGCACTATACCCAGAAATAACATACCCTCGGTTTGTTGGGGTTTCTCGTGCTGGGGGTAACATGGAAGTTCTTGGTTGTAAAGGTGGGTATGTTTCCGAAGGCTATGCAGAAAATGGTTTGCTAATCAATTTCCATGGGACATCCGCAGACGGGATCGGATTTCCAACGACTGATTTCCAATTCATTAACTGTGAAGGGGTAATGAATTCTTCTGTTTTAGGAGACGTAGAAGGAGTTGTGGGTGGAAATAACAATATCAAATTTTCTCGAGGATGTTCTGGGTGTAAAATAATTGGAGGGAAGTTTGTTTCCGTATCAGCGGGATCTTTTAATGGGAATGATCATGTTATAGCGATCCAGGGGTGCAGTAATAATACAGTTGAAGGCGTTGTTGTTCAGATGAACAATAACGGTGATTATAAATCTGCGTTTGGGATATCAGATCATAATGTTTCATTAACAGATAGTTATGACAATGTTATTCAAAATTGTTTTGTACAGATCAATACCCCAGGCCAATATAATCGGATATTGCAGATTCAGTCTAATGCCGGAAAATCAATACGGCGCAATAAATTGATAAATGTATCTTTTAATTGTTATAACGGAAGTAATACGGTTGATGCCGTTTGTGAGCAAACTAGCACCACTTCAGGTTTAGTGTCAGATACCCAAATATTGGGTTGTACTGGTCTGGGTGTTACGAATGTATTGTTGAACAGATCAGGGTTGGCATCTACTGCGATTACATATTTACAAGGGAACCGTATTGGAACTGTTATGAATTCAACCGTATTGAATTCTGGTGTTGTGAGGATTATTGACCAACCAATATCTGTAATTGTGAATGGTTCTGGTGTCCTTACTAGTGCCGTGAATTGTACGGTGTCTAAGACGTCGCCTGGTGTTTGGGTAATAAATTCTTTCACAAGTATGAATAAATTGGCTGTATCTTTTAGTTCTCCAGGTACTGGTAGATATTGTGTTATTACAAAAACCAGTGATTATTCGTGGACAATCACATTGTACAACCCATCAGCAGTTGTAACAGAAATGGAATTTAATCTTATAATCGGATAA

Genome Context

Tertiary structure

PDB ID

9e34a7fa072d12d868da3ae9a1d32095872a5224bd2d5139d976a81c83887cb0

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7710

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence