Phage RBP Database

Genbank accession

WMM95392.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,86

TSP

Evidence RBPdetect2

Probability 0,66

Protein sequence

MSNARDKANIPVLNFQSKGIDDNATSTVLTITSGTDVQIGSTNSGVGGTIDLSIGNTSSSGGITLWSTTTSSHSIGFADGYTGTDRYRGYLEYTHSGDSMRFGTASSEKMRLNSTGLGIGTSSPLATLHVDTSNSAVAPNAEADDFFVEGNSHSGITIGSGSSHRSSIYFANSSDNDIARIVVSHAEGSMRFNNNASERMRITSGGNLIIGDTTEADARTGKLKVRNDVDYSSTEFEDDATILVQNETNNNSASIVFHSNNASGSSKRSAIIGGFIKDTDTAIGFYGAIENKTTSSNPDVIINSSGQVGIGTSSPSKPLEIVSSAQTTLLHLNSTAGTTSAITFENTGSNDSITIGAENDDLKLRTDDGVIKFFTNENSEKMRIDSSGNVGIGTTSPTPPTAYGGLHINSQYPVLKLSSTTSGTGVADGFTVRINSADDAQLWHYENKNMSFATNNAERMRITSDGRFGMNGRTNPQYTLEFGDSGTGNGWSINAENNVHKIRTRASAGDTQTHVQWENTNGIVGSVKTNGSATQYNTSSDYRLKENVSYDFDATTRLKQLKPARFNFIADDTDTLVDGFIAHEVSTIVPEAVSGAKDSMFAEVLYEEGDELPEGKNVGDVKTSAQIDPQGIDQSKLVPLLVKTIQELEARITTLEANNP

Physico‐chemical properties

protein length:	660 AA
molecular weight:	70091,45560 Da
isoelectric point:	4,83486
aromaticity:	0,06364
hydropathy:	-0,46697

Domain architecture

WMM95392.1

1 660 aa

CHP 540–659 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR030392
CHP

IPR030392

IPR030392
CHP

IPR030392

WMM95392.1

1660 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_1386
STR

DC_1386 DC_1815

DC_1367
RBD

DC_1367

WMM95392.1

1660 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR030392	CHP	DC_0088	540	659	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	540	593	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

WMM95392.1

1 660 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0038
Central domain	11	209	200	0,0482
C-terminal	210	660	450	0,9482

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Pelagibacter phage HTVC134P [NCBI] · taxon 3072836

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Candidatus Pelagibacter sp. HTCC7211 [NCBI] · taxon 439493

Pseudomonadota Alphaproteobacteria Candidatus Pelagibacterales Candidatus Pelagibacteraceae Candidatus Pelagibacter

Genbank protein accession

WMM95392.1 [NCBI]

Genbank nucleotide accession

OR420744.1 [NCBI]

CDS location

range 35534 -> 37516
strand +

CDS

ATGAGTAACGCAAGAGATAAAGCTAACATACCAGTATTAAATTTTCAATCTAAAGGTATAGATGATAATGCTACAAGTACAGTATTAACAATTACAAGTGGTACAGATGTTCAAATCGGTTCAACTAATTCTGGTGTAGGTGGTACAATAGATTTATCTATAGGAAATACATCTTCATCTGGTGGTATAACTTTATGGTCTACTACAACTTCGTCTCACTCTATTGGATTTGCTGATGGATATACTGGAACAGATAGATACAGAGGTTATTTAGAATACACACATAGTGGCGATAGTATGCGATTTGGTACAGCAAGTTCAGAAAAAATGAGATTAAATTCTACTGGATTAGGTATTGGTACAAGTTCTCCATTAGCTACACTTCATGTTGATACTTCTAATAGTGCTGTAGCACCTAATGCCGAAGCAGATGATTTCTTTGTAGAAGGTAATAGTCACTCAGGAATAACCATTGGCTCTGGTTCAAGTCATCGTTCTAGCATTTATTTTGCAAACTCAAGTGATAATGATATTGCTAGAATTGTAGTTTCTCATGCTGAAGGTAGTATGAGATTTAATAATAATGCTTCAGAACGTATGCGTATCACATCAGGTGGTAATTTAATAATTGGAGATACTACAGAAGCAGATGCAAGAACAGGAAAATTAAAAGTACGAAATGATGTGGATTATTCCTCAACTGAATTTGAAGATGATGCAACAATTTTAGTTCAAAATGAAACAAACAACAATTCTGCATCTATAGTATTTCATTCTAATAATGCTTCTGGTAGTTCCAAACGTTCTGCAATTATTGGTGGATTTATAAAAGATACTGATACTGCTATTGGTTTTTATGGAGCTATTGAAAATAAAACAACATCTTCAAATCCAGATGTAATTATCAACAGTTCTGGTCAAGTTGGCATCGGAACGTCATCGCCATCGAAACCATTAGAAATTGTTAGTTCTGCACAAACAACTTTATTACATTTAAATTCTACAGCAGGAACAACTTCAGCTATAACTTTTGAAAACACAGGCTCTAACGACAGTATTACTATTGGTGCTGAAAATGATGATTTAAAATTAAGAACTGATGATGGTGTTATAAAATTCTTTACTAATGAAAATAGTGAGAAAATGCGTATAGACAGTTCTGGTAACGTAGGTATTGGTACAACTTCTCCAACACCACCAACTGCTTATGGTGGATTACATATTAACTCTCAATATCCAGTATTAAAATTAAGTTCAACCACTTCTGGTACTGGTGTTGCAGATGGTTTTACAGTTAGAATTAATAGTGCTGATGATGCACAGTTATGGCATTACGAAAATAAAAATATGTCATTTGCTACTAATAACGCAGAACGTATGCGTATTACTAGTGATGGAAGATTTGGAATGAATGGTAGAACAAATCCTCAATATACTTTAGAATTTGGAGATAGTGGTACTGGAAATGGGTGGTCTATAAATGCTGAAAATAATGTACACAAAATAAGAACAAGAGCATCAGCAGGGGACACTCAAACTCATGTTCAATGGGAAAATACTAATGGTATTGTTGGTTCAGTTAAAACAAATGGAAGTGCCACTCAATATAACACTTCTTCCGATTACAGATTAAAAGAAAATGTATCTTATGACTTTGATGCAACAACAAGATTAAAACAATTGAAACCTGCAAGATTTAATTTTATAGCAGATGATACAGATACTCTTGTTGATGGTTTTATAGCACATGAAGTATCTACTATAGTGCCTGAAGCTGTTAGTGGTGCAAAAGATAGTATGTTTGCTGAAGTTCTATATGAAGAAGGTGATGAATTACCTGAGGGTAAAAATGTTGGTGATGTCAAAACATCTGCACAAATAGACCCACAAGGTATCGACCAATCTAAATTAGTACCTTTACTGGTTAAAACAATTCAAGAATTAGAAGCTAGAATAACAACACTAGAAGCTAATAACCCATAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)