Phage RBP Database

Genbank accession

WPJ72496.1 [GenBank]

Protein name

L-shaped tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

TF

Evidence RBPdetect

Probability 0,88

TF

Evidence RBPdetect2

Probability 0,76

TF

Evidence UniProt/TrEMBL

Probability 1,00

Protein sequence

MALKTKIIVQQILNIDDTTTTASKYPKYTVVLGNSISSITAGELTAAVEAAAESAAAAKDSEIAAKDSENKAKDSEIQAGIHAGASEASATQSAASAAESERQANLSQGSAENSAASALESKNFKDASELAAQNAEQSKILAEQAQRAAEAAQSGAKASENKASAFATQAAASSASAGDFAAAAKQSELNAKTSETNAATSEVEAETQAETATTEANRAKAEADRAAQIVDSKLDKEDISGFIKVYKTKEEADADVSSRVLGEKILVWNQTDSKYGWYKVAGTAEAPVLELVETEQKLVSINNVRADDAGNVQITLPGGNPSLWLGEVTWFPYDKDSGVGYPGVLPADGREVLRVDYPDTWEAIEAGLIPSVTEEQWQAGATLYFSTGNGTTTFRLPDMMQGQAFRAAAKGEENAGNIKEQIPYITMINGKAPADDGTITLGNAADKNVWNGIDGEVLLRGAFGLGGTGLILNEPDAVSFFKAMRAFGSGYYRNDSESNPVIPKYSAGFYSKTADTHTFICSAYGNGVTFAATINDALLDGENPTVHTNILYGTANKPDLNTDTQGVLGVEKGGTGATTQKGARLNLDTPVGSRAIGMPNNSDVLAFMKSSAESGYYSSGNIVTGVPETAGWYMFDLHVHGKNAAGEMEYGNVYCTTSAGAIWYTLMEVGVWQPWRRLTTEHGIIPITSGGTGTNNANDARINLGLGPINAPTFSGMTLQGTNETTSGIAVFSNRNAEGTQLSYSRMYHEIQSGVGKTTIQTTREGGATNYFQIDEYGNIGNINSIIAYGYMGLGAANAMGNASIAIGDSDSGLKWNSDGNISTVADGVKIATWTPHGFYTHKIISSDVANTERGMYVNGVRTTGASALVAGVIEAGSHVGWRDRASGMLVELNTRGAAANIWKATRWGDQHAGASDIVIYDDGSPYYRTLVGGGEFGFNGLGQATCTSWISTSDIRLKAQLKEIVSAKDKVKSLQGYTYFKRNSLVEDEHSFYCEEAGLIAQDVQTVLPEAVYKIANSDLLGVNYSGVTALLANAVKEMLADAEAQEARISNLEEELAELKALIATLVNK

Physico‐chemical properties

protein length:	1071 AA
molecular weight:	113026,69140 Da
isoelectric point:	4,76910
aromaticity:	0,07470
hydropathy:	-0,27890

Domain architecture

WPJ72496.1

1 1071 aa

CHP 954–1058 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

Coil
Unmapped

Coil Coil IPR030392

IPR030392
CHP

IPR030392 Coil

WPJ72496.1

11071 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0608
ATT

DC_0608 DC_1093 DC_1942

WPJ72496.1

11071 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
Coil	Unmapped	-	142	162	Coils	Coil	-	-	-	-
Coil	Unmapped	-	202	229	Coils	Coil	-	-	-	-
IPR030392	CHP	DC_0088	954	1058	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	954	1014	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1037	1071	Coils	Coil	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

WPJ72496.1

1 1071 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	446	446	0,9392
Central domain	447	645	200	0,2881
C-terminal	646	1071	425	0,7668

Note: Constraints were applied during segmentation.
Fixed 16 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Salmonella phage CRW-SP6 [NCBI] · taxon 3079602

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Salmonella enteritidis [NCBI] · taxon 149539

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Enterobacterales

Genbank protein accession

WPJ72496.1 [NCBI]

Genbank nucleotide accession

OR464144.1 [NCBI]

CDS location

range 20410 -> 23625
strand +

CDS

ATGGCACTTAAAACTAAAATTATTGTACAGCAGATTCTGAACATAGATGACACTACAACTACTGCTAGTAAGTATCCTAAATATACAGTAGTTTTAGGTAATTCTATTAGTTCTATTACTGCTGGTGAACTAACAGCGGCTGTTGAAGCCGCCGCAGAGTCTGCTGCTGCTGCTAAAGATTCTGAAATAGCAGCTAAAGACTCTGAAAATAAAGCTAAAGATTCGGAAATTCAAGCGGGTATTCATGCTGGTGCTTCTGAGGCTTCAGCAACCCAGTCTGCTGCTTCTGCTGCTGAATCTGAAAGACAAGCTAACTTATCTCAAGGTAGTGCGGAAAACTCTGCTGCTTCTGCTTTAGAATCTAAGAATTTTAAAGATGCTTCGGAACTTGCTGCTCAAAATGCAGAGCAGAGTAAGATTTTAGCAGAGCAAGCTCAAAGAGCGGCAGAAGCTGCCCAGTCTGGTGCTAAAGCTTCTGAAAATAAAGCATCAGCATTTGCTACACAAGCTGCTGCATCTTCAGCTTCCGCAGGAGATTTTGCTGCAGCCGCTAAACAATCTGAATTAAATGCTAAAACTTCTGAAACCAATGCCGCAACATCAGAAGTGGAAGCGGAAACCCAAGCTGAAACTGCTACTACTGAGGCAAATCGTGCTAAGGCTGAAGCCGATCGCGCAGCTCAGATTGTAGATAGTAAGTTAGATAAAGAAGATATATCTGGCTTTATCAAAGTCTACAAGACTAAAGAAGAAGCGGACGCCGACGTTAGTAGCCGCGTACTAGGTGAAAAGATCCTAGTGTGGAACCAAACTGACTCAAAATATGGATGGTATAAAGTAGCTGGAACTGCTGAGGCTCCAGTATTAGAGTTAGTAGAGACAGAGCAAAAGCTAGTTTCTATTAATAACGTTCGTGCAGATGACGCAGGTAACGTACAGATTACTCTTCCTGGTGGTAATCCTTCCTTATGGTTGGGTGAAGTTACTTGGTTCCCTTATGACAAAGATTCAGGTGTTGGCTATCCTGGTGTTCTCCCTGCTGATGGCCGCGAAGTCCTTCGTGTAGACTATCCAGATACGTGGGAGGCTATCGAAGCCGGTCTGATTCCTTCTGTTACTGAAGAACAATGGCAAGCTGGTGCAACTCTCTACTTCTCCACTGGTAATGGTACTACTACTTTCCGCCTACCTGATATGATGCAGGGCCAAGCATTCCGTGCTGCTGCAAAAGGAGAGGAAAACGCTGGTAATATTAAAGAGCAAATCCCGTACATCACTATGATTAATGGTAAAGCTCCTGCTGACGATGGTACAATTACTTTAGGTAATGCTGCGGATAAAAACGTATGGAATGGTATTGATGGTGAAGTACTGTTAAGAGGTGCTTTTGGTCTTGGAGGTACTGGTTTAATTCTTAATGAACCTGATGCTGTTTCCTTCTTTAAAGCAATGCGTGCTTTTGGTTCAGGATATTATAGAAATGACTCTGAAAGTAACCCAGTAATCCCTAAATACTCTGCAGGATTCTACTCCAAAACTGCCGACACTCATACTTTTATCTGTTCTGCTTATGGTAATGGTGTTACTTTCGCAGCTACTATAAATGATGCATTATTAGATGGAGAAAATCCTACTGTACATACAAATATTCTTTATGGTACAGCAAATAAACCTGATCTGAATACCGATACTCAAGGAGTTTTAGGAGTAGAGAAGGGCGGTACTGGTGCTACTACGCAGAAAGGTGCTAGACTAAATCTGGATACTCCTGTAGGCAGCAGAGCTATTGGAATGCCTAATAACTCTGATGTACTAGCTTTCATGAAATCTTCCGCAGAAAGCGGATATTATTCCTCTGGTAATATAGTTACTGGAGTTCCAGAAACTGCAGGATGGTATATGTTCGATCTCCATGTACATGGTAAGAATGCTGCGGGAGAAATGGAGTATGGTAATGTATACTGTACAACAAGTGCTGGTGCTATTTGGTACACCTTAATGGAGGTTGGTGTATGGCAGCCATGGAGACGTTTGACCACAGAACATGGTATTATTCCTATTACTTCAGGGGGTACTGGTACAAATAATGCAAATGACGCAAGAATAAATCTAGGTCTTGGTCCTATAAATGCACCTACTTTTAGTGGTATGACTCTTCAGGGTACTAATGAAACTACTTCAGGTATAGCGGTTTTTAGTAATAGAAATGCGGAAGGGACTCAACTTTCCTATTCTAGAATGTACCATGAAATTCAGAGTGGTGTTGGTAAAACTACTATTCAGACTACAAGAGAGGGCGGGGCGACTAACTATTTCCAAATTGATGAGTATGGTAATATTGGGAATATTAACTCAATTATTGCATATGGATACATGGGATTAGGTGCTGCTAATGCTATGGGAAACGCCTCTATTGCGATTGGTGACTCTGACTCTGGGCTAAAATGGAATAGTGATGGTAACATAAGTACTGTAGCAGATGGTGTAAAAATAGCCACATGGACACCTCATGGATTTTATACACATAAAATAATAAGCTCAGATGTTGCTAATACCGAAAGAGGGATGTATGTAAACGGGGTTAGGACTACCGGTGCCTCCGCTCTTGTAGCTGGGGTTATAGAAGCTGGATCTCATGTTGGTTGGAGAGATAGAGCTTCAGGTATGCTTGTTGAATTGAATACTAGAGGAGCTGCTGCCAATATCTGGAAAGCAACTAGATGGGGTGACCAACATGCTGGTGCATCTGACATCGTTATTTATGATGATGGATCTCCTTATTATAGAACTCTTGTAGGCGGTGGTGAATTTGGGTTCAATGGCCTTGGACAAGCTACCTGTACTTCTTGGATCAGTACATCTGATATTAGGCTTAAGGCACAGCTAAAAGAGATAGTATCTGCTAAAGATAAGGTAAAATCCCTACAGGGGTACACTTATTTTAAACGTAATAGTTTGGTTGAAGATGAGCATTCCTTTTATTGTGAAGAGGCAGGATTAATCGCACAAGATGTTCAAACTGTACTACCTGAAGCTGTATATAAAATAGCTAACTCAGATCTTCTCGGTGTTAATTACTCTGGTGTTACCGCATTATTGGCTAACGCAGTAAAAGAGATGTTGGCGGATGCGGAGGCTCAGGAAGCTCGTATCAGTAATCTAGAAGAAGAACTGGCAGAGTTAAAAGCTCTAATAGCCACTCTGGTAAATAAGTAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)