Phage RBP Database

Genbank accession

WBF04345.1 [GenBank]

Protein name

tail fibers protein

RBP type

TF

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,97

Protein sequence

MANKPTQPLFPLGLETSESSNIKGFNNSGTIEHSPGAILTFPEDTEVAGLPSSVRYNPDSDEFEGYYENGGWLSLGSGGIRWETLPYAPSSNLLEGRGYLINNTTGTSTVVLPSPTRIGDSVTICDAYGKFATYPLTVSPSGNNLYGSTEDMAITTDNVSATFTWSGPEQGWVITSGVGLGQGRVYSREIFTQILASETSAVTLNTPPTIVDVYADGKRLAESKYSLDGNVITFSRSLPASTELQVIEYTPIQLGNGGGSGSSTITWVYNGGSAIGGETEITLDIVVDDVPAIDINGSRQYKNLGFTFDPLTSKITLAQELDAEDEVVVIINGTPNIYNQIDYTLREVARVTNVKDTEVIYFSVGAVLSGYKVIYDKVTQRSYFIPELPTGTTAVSLSSSAVLVHSAGSVDLGALAVSREEYVTLSGSFDSGAVINVKNELLTHTDGKYRWDGALPKTVDAGSTPASTGGIGVGKWLSVGDAALRTNLASYNGFSLIGVCPDVITLRTLSVPIGKKVLLLGYHSDHPGTGGGTLYASSDTSLADDGVRVFVTSDGTRLVRETNGELYASWAGAVGDWNGTTGTDNKEAIERLITASGTEFKWVIDLTNIGVSSVVIDNKNNWNGHINGSVINISAKPAAGAVDRKDQDGGLLPTIKITNSDGWKLTGSFVDNRYREAFYVEYCDNFELGCANLGSGINNNLAANHFRYCNHFKLNGWKVEKSGVIPLAGYYDWVQAIRMWDCSGFIIDGLTSHMNAGNGIYIASNCKDYVVTNFDITENAMSGIQLAWSGFGVMPIRGVISNGTITGNRADSIDVNNTSGIKARLDLIISGVINANNGYNSDGTVTADGSGLGTFINVSHFIVDECSSTSPARSGVAISNCSNFRVKGIIKKDQPSNSDGHGVYIENSADGEIDVDCITDSANANMYSIRTYGALENIHLSGKYVGYTLFGDDATYVNCSLDKASIISPTTVANRFPWENVNVVVSGSNAVDIKSTVNSCRFVSNNGHGGVLSSGNNDISDSEFYGTDGGLYCADNIGQVRVRGGVAQGGSAAGLRISGGEKHIIEGLTTKSTSGNSCVITNASKVIYIGNDDSANPTNFTGTTFTLQN

Physico‐chemical properties

protein length:	1109 AA
molecular weight:	117524,85860 Da
isoelectric point:	4,71090
aromaticity:	0,08476
hydropathy:	-0,12940

Domain architecture

WBF04345.1

1 1109 aa

ATT 335–491 · STR 618–963 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

G3DSA:3.30.2020.50
ATT

G3DSA:3.30.2020.50 G3DSA:2.10.10.80 IPR011050 IPR006626 IPR006626 IPR006626

IPR040775
RBD

IPR040775 IPR012334

IPR006626
Unmapped

IPR006626 IPR006626 IPR006626

WBF04345.1

11109 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_1946
ATT

DC_1946 DC_0586

WBF04345.1

11109 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	335	420	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
IPR040775	RBD	DC_0821	416	481	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	421	491	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR011050	STR	IPR011050	618	846	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	692	963	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR006626	Unmapped	-	742	764	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	766	787	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	795	817	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	873	907	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	1014	1035	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	1037	1059	InterPro	Parallel beta-helix repeat	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

WBF04345.1

1 1109 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	580	580	0,9957
Central domain	581	1098	519	0,9946
C-terminal	1099	1109	10	0,2404

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Salmonella phage PST-D24 [NCBI] · taxon 3003695

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Salmonella sp. [NCBI] · taxon 599

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Enterobacterales

Genbank protein accession

WBF04345.1 [NCBI]

Genbank nucleotide accession

OP978318.1 [NCBI]

CDS location

range 128110 -> 131439
strand -

CDS

ATGGCCAACAAACCAACACAGCCTCTTTTCCCTTTGGGTTTAGAAACTTCTGAGTCTTCGAACATAAAAGGCTTCAACAACTCCGGCACCATAGAGCATTCCCCTGGTGCAATATTGACGTTCCCTGAAGATACTGAAGTTGCAGGTCTTCCATCTTCTGTACGTTACAATCCTGATAGTGATGAATTTGAAGGTTATTACGAAAACGGTGGTTGGTTGTCTTTGGGTAGCGGCGGAATACGCTGGGAAACGCTCCCTTACGCTCCCTCTAGCAATTTGTTAGAAGGTCGCGGCTATCTCATTAATAATACGACAGGGACATCTACAGTGGTTCTCCCTTCCCCTACGCGTATTGGGGATTCCGTTACTATTTGTGATGCTTATGGGAAATTTGCCACTTACCCATTGACCGTGTCTCCTTCTGGAAATAATTTGTATGGCTCCACTGAAGACATGGCTATAACAACTGATAACGTATCAGCAACGTTCACTTGGTCTGGACCTGAACAAGGTTGGGTTATCACATCCGGCGTCGGTCTTGGCCAAGGCCGTGTCTACAGTCGTGAAATCTTTACACAAATTTTGGCGTCTGAAACAAGTGCTGTCACTCTCAATACTCCACCAACAATCGTGGACGTGTATGCTGACGGAAAACGTCTTGCGGAATCCAAATATTCACTAGATGGAAATGTAATCACTTTCAGTCGTTCTTTGCCAGCCAGCACAGAACTTCAGGTGATTGAATATACTCCTATTCAATTGGGTAATGGCGGTGGTTCTGGTTCTTCTACGATTACCTGGGTCTATAATGGGGGTTCAGCGATTGGCGGTGAAACCGAAATCACGTTAGACATCGTTGTTGATGATGTTCCGGCCATTGATATAAACGGAAGTCGCCAGTATAAAAATCTGGGGTTCACATTCGATCCATTAACCAGTAAAATCACTCTTGCGCAAGAACTGGATGCGGAGGATGAAGTTGTTGTAATTATCAATGGAACGCCAAACATCTATAATCAAATTGATTATACTTTGCGGGAAGTGGCTCGTGTAACCAATGTTAAAGATACAGAGGTCATTTATTTTAGTGTTGGTGCTGTGTTAAGTGGATATAAAGTTATCTATGATAAAGTAACACAGAGATCATATTTTATTCCAGAGCTACCGACTGGAACCACGGCAGTCAGCCTTAGTTCTTCGGCTGTACTTGTGCATTCTGCTGGTAGTGTTGATCTGGGCGCATTAGCTGTATCTCGTGAAGAATATGTTACATTGTCTGGTTCATTTGATTCTGGTGCTGTCATCAATGTTAAAAATGAATTACTTACTCATACAGATGGTAAGTATCGTTGGGATGGGGCATTACCTAAAACTGTCGATGCTGGATCAACGCCTGCATCAACTGGTGGCATCGGCGTAGGGAAGTGGTTAAGCGTTGGCGATGCGGCATTACGAACTAATTTAGCTTCTTATAATGGTTTTTCCCTGATTGGTGTGTGTCCTGATGTAATCACGTTGCGAACGCTTTCCGTACCAATTGGTAAGAAAGTATTGTTGCTCGGATATCATTCAGATCATCCTGGCACTGGCGGCGGAACCCTTTACGCCTCAAGTGATACATCACTAGCTGATGATGGTGTACGTGTTTTTGTCACATCAGATGGAACCCGTTTGGTAAGAGAGACTAATGGGGAGTTATATGCCTCATGGGCAGGTGCTGTTGGTGACTGGAACGGAACTACTGGCACAGATAATAAGGAAGCAATAGAACGGCTTATCACAGCATCAGGGACTGAATTTAAATGGGTTATTGATTTAACGAATATTGGCGTAAGTTCTGTCGTCATTGATAACAAAAATAACTGGAATGGGCATATAAACGGCAGTGTAATCAATATTTCAGCTAAGCCAGCTGCCGGTGCCGTAGACAGAAAAGATCAGGATGGTGGATTGCTACCAACCATTAAAATTACAAACTCTGATGGCTGGAAATTAACAGGTTCTTTTGTCGACAATCGTTATCGTGAGGCTTTCTATGTAGAATACTGCGATAACTTTGAACTAGGCTGCGCAAACCTTGGTAGTGGAATTAACAATAATCTTGCGGCTAACCATTTCAGATACTGTAACCATTTTAAGTTAAATGGATGGAAGGTTGAAAAGTCGGGGGTTATTCCACTTGCAGGTTATTACGATTGGGTTCAAGCTATAAGGATGTGGGACTGCTCTGGATTTATCATTGATGGATTAACATCACACATGAATGCAGGTAATGGTATTTATATCGCCAGTAACTGCAAAGACTATGTTGTTACTAACTTTGACATAACAGAAAACGCCATGTCAGGAATACAGCTCGCTTGGTCAGGTTTTGGTGTAATGCCAATTAGAGGTGTTATCTCTAACGGAACCATCACTGGAAACAGGGCTGACAGTATAGACGTTAACAATACCAGCGGTATCAAAGCGAGACTTGATCTGATAATTTCCGGTGTTATAAATGCAAACAATGGTTACAACTCTGACGGAACGGTAACTGCCGACGGTTCTGGTTTGGGTACATTTATTAATGTTTCCCATTTCATAGTTGACGAGTGCTCTTCAACATCGCCAGCCCGCTCTGGAGTAGCTATAAGTAACTGCTCCAATTTCAGAGTAAAAGGTATTATAAAAAAAGACCAGCCATCTAATAGTGATGGACATGGGGTATACATTGAAAACAGCGCTGATGGTGAAATAGACGTTGACTGTATTACTGACTCTGCTAACGCAAACATGTACTCCATACGAACTTACGGGGCGCTTGAAAACATACACCTTTCAGGCAAATATGTTGGATATACCTTGTTTGGAGATGATGCAACTTATGTTAACTGCTCTCTTGATAAAGCGTCAATAATTTCCCCGACTACAGTCGCAAATCGTTTCCCATGGGAAAATGTGAACGTAGTTGTTTCTGGTTCAAATGCTGTTGATATCAAATCAACAGTGAATAGTTGCCGATTTGTTTCTAACAATGGTCATGGGGGTGTGTTGTCTTCAGGTAACAACGATATTTCTGACTCAGAATTCTATGGAACAGATGGTGGACTTTACTGTGCTGACAACATTGGTCAGGTTAGGGTTAGAGGTGGTGTAGCCCAGGGTGGCTCAGCAGCAGGACTACGAATTAGTGGTGGTGAAAAGCATATCATTGAAGGGTTAACCACAAAATCAACATCAGGCAACTCCTGTGTTATCACCAATGCTTCCAAAGTGATATACATTGGAAATGATGACTCTGCTAACCCAACAAACTTTACAGGAACAACATTTACACTTCAGAACTAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)