Phage RBP Database

Genbank accession

YP_008130362.1 [GenBank]

Protein name

tail spike protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,99

Protein sequence

MSSGCGDVLSLEDLKTAKKHQLFEAEVITGRSGGVATGAFIDIATNQATGQVQKTMPAVLRDIGFAPASFDFNTGGTISDRNVAVLWPLPGGDGDWYVWEGALPKIIPAASTPDSTGGVAAGAWKAVNSNALRDQLSVVSPEMFGAIGNGIADDTIAWQAMDSYVSARATASHIITIIASRKYRVTAQLNGWSYVNLLGGGTLIYDGADQLNSTVLTYNSKTKFNISNINITRNFNDPFALRSKGAYGLTLASCSDFSVVGCDIYMHTDALSVMDSDRFKIESNRTHELGEEGIAVRRSRNWSVINNDVYHHNGDGILIKTGNVSSYAGSICDNRVYDGIQSAGTAGGNRGGGITGNDEVIGGGATESFNRLIVERNHCYNVSYGIAFTNIVDLSMSNNMVNNIDRFGIIIDTALFNNPNKNPVKRISVSNNHVSGTVQAGLLFTGTADISVSQVTISNNIVDTCGTSTAAGYPAIGASFASVTGNKVTNCKIGLQVEGCATTGNVITDSTYTSSAPASVWVKIIGGGSFNGNSLSDSKFGHIRFSSISGLTFTGNTITTASSFACLYFDSVSSGSTCIFRANNYVSAFTNVSVFNIGAVPAVPALVGDELIVSSPPAGGIRRLVCVTAGNPGVYVPVEWNIISAVSSSSSPTINAGASLRITGTAAGVASNSACVGAKFNQDPQGVDMVASVTGAGTVTFILTNNTGSSKTFSNLVMTAYCHS

Physico‐chemical properties

protein length:	724 AA
molecular weight:	75413,41280 Da
isoelectric point:	5,82880
aromaticity:	0,07873
hydropathy:	0,07403

Domain architecture

YP_008130362.1

1 724 aa

ATT 65–138 · STR 139–563 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

G3DSA:2.10.10.80
ATT

G3DSA:2.10.10.80 IPR012334 IPR006626 IPR006626 IPR006626

IPR040775
RBD

IPR040775 IPR011050

IPR039448
ENZ

IPR039448 IPR006626 IPR006626 IPR006626

IPR006626
Unmapped

IPR006626 IPR006626 IPR011050

IPR011050
STR

IPR011050

YP_008130362.1

1724 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0018
ATT

DC_0018 DC_2234 DC_0276

YP_008130362.1

1724 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	65	138	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR040775	RBD	DC_0821	71	127	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
IPR012334	STR	IPR012334	139	441	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	147	438	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR039448	ENZ	DC_0799	215	341	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR006626	Unmapped	-	276	298	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	299	321	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	369	390	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR011050	STR	IPR011050	375	560	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR011050	STR	IPR011050	375	563	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	391	413	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	424	446	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	452	477	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	478	499	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	548	571	InterPro	Parallel beta-helix repeat	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

YP_008130362.1

1 724 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	154	154	0,9885
Central domain	155	589	436	0,9944
C-terminal	590	724	134	0,9840

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Serratia phage Eta [NCBI] · taxon 1282995

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Serratia marcescens [NCBI] · taxon 615

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Enterobacterales

Genbank protein accession

YP_008130362.1 [NCBI]

Genbank nucleotide accession

NC_021563 [NCBI]

CDS location

range 40550 -> 42724
strand +

CDS

ATGTCTAGCGGCTGCGGTGACGTCTTGTCACTTGAAGACCTGAAAACAGCGAAAAAACATCAACTTTTCGAAGCAGAGGTTATTACCGGCCGTTCCGGCGGAGTGGCCACTGGGGCATTTATCGATATTGCGACGAACCAAGCAACGGGCCAAGTTCAAAAAACTATGCCCGCAGTACTGCGCGACATTGGCTTTGCGCCAGCATCGTTCGATTTTAATACCGGTGGGACTATTTCAGATCGTAATGTTGCCGTGTTATGGCCTCTCCCTGGTGGAGATGGAGATTGGTATGTGTGGGAAGGTGCATTACCTAAAATTATTCCTGCTGCGTCCACACCTGATTCCACCGGCGGGGTAGCAGCCGGGGCGTGGAAAGCCGTAAATAGTAATGCGTTACGTGACCAGTTATCTGTAGTGTCCCCGGAAATGTTTGGCGCAATAGGTAACGGGATCGCAGATGATACTATTGCTTGGCAAGCGATGGATAGCTATGTGTCAGCCAGAGCCACTGCAAGCCATATTATTACGATTATTGCATCGAGGAAATATAGGGTAACCGCGCAACTTAATGGGTGGAGTTACGTTAACTTATTAGGCGGCGGAACTCTAATCTATGACGGCGCTGACCAGTTAAACTCAACGGTACTTACGTATAATAGTAAGACTAAATTCAATATTTCTAATATAAATATTACTAGAAATTTCAATGACCCTTTCGCTCTGCGGTCTAAAGGGGCGTATGGATTAACACTAGCATCCTGCTCTGATTTCTCGGTGGTAGGGTGCGATATCTATATGCACACAGACGCGCTGTCTGTTATGGATTCTGATAGATTTAAAATTGAATCTAACCGTACACATGAATTAGGTGAAGAGGGTATTGCAGTGCGCCGCTCTCGCAACTGGAGCGTAATTAACAATGATGTGTACCACCATAACGGTGATGGGATATTAATAAAAACTGGCAACGTTTCAAGTTACGCCGGCAGCATTTGCGATAACCGAGTGTACGACGGTATCCAGTCCGCTGGCACTGCCGGGGGTAACCGCGGCGGGGGCATTACGGGTAATGACGAGGTAATCGGCGGAGGCGCCACTGAGTCTTTTAATCGTCTAATTGTAGAAAGAAACCATTGCTATAATGTTAGCTACGGCATCGCCTTTACTAATATTGTCGACCTGTCAATGTCTAACAACATGGTTAATAACATCGACCGTTTTGGCATTATTATCGACACTGCGCTTTTTAATAACCCTAACAAGAATCCGGTAAAACGTATCAGTGTTAGTAACAACCATGTGTCAGGTACAGTGCAGGCCGGGCTATTATTTACCGGGACTGCGGATATATCGGTTAGTCAAGTAACGATATCAAACAACATAGTTGATACTTGCGGCACCTCCACCGCCGCTGGGTACCCAGCTATCGGAGCATCTTTTGCATCTGTAACCGGTAACAAGGTTACCAATTGCAAGATTGGTCTACAGGTGGAAGGGTGCGCTACTACCGGTAACGTTATTACGGATTCAACTTATACTAGCTCCGCGCCAGCGTCGGTGTGGGTTAAGATAATCGGCGGCGGCAGCTTCAATGGGAACAGTTTATCCGATTCAAAATTCGGACACATCAGATTCTCCAGTATAAGCGGTTTAACATTTACCGGGAACACGATCACAACGGCGAGTAGTTTCGCCTGCTTATATTTTGACTCTGTTTCCTCCGGTAGCACCTGTATTTTTAGAGCTAACAATTATGTGAGCGCATTCACTAATGTGTCAGTTTTTAACATTGGCGCCGTGCCCGCCGTACCCGCGTTAGTAGGCGATGAGCTAATCGTGTCCTCTCCGCCTGCGGGCGGCATTCGCCGGTTGGTGTGCGTAACTGCCGGCAATCCAGGCGTTTACGTCCCTGTTGAGTGGAATATAATTTCTGCGGTTTCGTCATCCAGCAGCCCAACCATAAATGCTGGTGCATCATTACGTATAACCGGAACAGCCGCTGGGGTGGCGAGCAATTCAGCCTGTGTTGGGGCTAAATTTAACCAAGACCCGCAAGGGGTTGATATGGTAGCGTCGGTTACTGGCGCCGGGACAGTCACGTTCATCCTGACCAACAACACCGGATCAAGCAAAACATTTAGTAATTTGGTAATGACGGCGTATTGCCATTCATAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)