Phage RBP Database

Genbank accession

XHB26124.1 [GenBank]

Protein name

endopeptidase

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence RBPdetect

Probability 0,54

TF

Evidence RBPdetect2

Probability 0,89

Protein sequence

MTTFLDHKDNEFEAQAVVKTTNAVNGERSLSGTIYTNEEVLNKVDKGWKLEFDDEYYKIIYAKPTDTGNKIQVEFDAVHQFFYDFDKSSLHKQLNDGSHTFQAYLNFIFNGSGYTYSLEVVVKSFEKQSFGYKSRLDLFNDIIKSAGVEFFVRGKVVRILQKTGTDLSTIVRKNFNMNEIIIEKKINDFITYQKGFGAWTDQEDHSKGRLEVEYESPLAKEYGRIEGEPVVDERYTNADNLKSVLKQNVDSSYNIAVKIDIEDLTKAGYQYTQPIAGDYIMAINETLGFKEKIRIVSFESEYDVTGQLINHKVICNDIGTIKKQTVAVSQLSSKINNNQEILDNAVFKANQALASADGKNTNYYGTEMPVDDPKGTLRKGDLLFLTVGDTTRMYFWNGAEWIINSFSDDIDFVKKEITNKIIEVNAAMKLADEQLTEKYNAIVAKNVSQDELINQAKNLSDSAKKDATEALTNLISESKKLTDKMSALSKTEVEHYSTTNLQLTQLDGTVKGLQTSYEALLKKDGDITQTLANYKQTIDQNSTSITANKKTVDGTLSSLQTQVTQTANEITTRLSQTNIEALITSKSAVIADNKVKETADSFSREITRVNNTIDNLKIGTVNLLSGTKNWTKNWFNRNNWQSDDDNLTIGNFSLTVLKRKAMWSGISQLYAVKSGENYVFSAYAKSSMDNDVVNLYLLPNGQSPQAKISISFKSITLNTDWQRIVIKFNVTSDGYILPRFERFNENGWLYIAGYQLEHGNVASDYSEAPADQEDKMTVEFNKINDTVNSHSQLIGKQNESLTATIQKVDNIQSTVSNVDGRLSRVTQTADGIVTTVSQLDNNILPGTKNFTGWQIEGAVLEDVTQSSYPFVFKKWISGNKVSPLIEYDVKKNQEYTFTAYIAREQAGNLYFYLYDLWNHHITSATPRETIIRDVNSSVIRFRITFIPNRDGKIRPRFAMLASDQGWFMVGGFMLSKGTADLPWSESKQDIKDNVTAINTIVAQTANSWAIKNLTSNGTVLSQLNLTDGNVKLEGKLIHLSGQSIIDNGIITNAMIKDLTADKITAGTIDANRINVINLDASNITSGRMSADLIRSGVLISQNGAMLTDLNTGQIEFYTDNPAIKRITAGYPNQFVKFATGNVEGKGAAGVTVIGSNRWGSESSNDGGFVGIRAWNGKDIDTLDLVGDSIHLASSAYTNADGWEIITLPNQLSIDARNINHRVTSKVKVGDIWLWKNTSTYVSMKDTINMIIDNLQLLHNNKTTEKGYSYTIPGKI

Physico‐chemical properties

protein length:	1275 AA
molecular weight:	142455,07710 Da
isoelectric point:	5,56507
aromaticity:	0,09020
hydropathy:	-0,40549

Domain architecture

XHB26124.1

1 1275 aa

STR 79–164 · ENZ 165–301 · STR 621–757 · RBD 1010–1196 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

G3DSA:3.55.50.40
STR

G3DSA:3.55.50.40 Coil G3DSA:2.60.120.260 IPR012892

IPR010572
ENZ

IPR010572 IPR008979

XHB26124.1

11275 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_1353
STR

DC_1353 DC_0171

DC_0171
RBD

DC_0171

XHB26124.1

11275 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:3.55.50.40	STR	G3DSA:3.55.50.40	79	164	Merged direct domain	G3DSA:3.55.50.40	Central	Low	Positional only	63 proteins / 63 hits
IPR010572	ENZ	DC_0675	83	301	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
Coil	Unmapped	-	464	484	Coils	Coil	-	-	-	-
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	621	757	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	626	756	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
IPR012892	RBD	DC_0453	1010	1196	InterPro cluster	Gp58-like	C-terminal	Low	Positional only	116 proteins / 119 hits

Proteins with similar domain architecture

Phage

Streptococcus phage phiGBSVK-C_GBSInt4 [NCBI] · taxon 3345062

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Streptococcus agalactiae [NCBI] · taxon 1311

cellular organisms Bacteria Bacillati Bacillota Bacilli Lactobacillales

Genbank protein accession

XHB26124.1 [NCBI]

Genbank nucleotide accession

PP758848 [NCBI]

CDS location

range 32174 -> 36001
strand +

CDS

TTGACAACTTTTTTAGATCATAAAGATAATGAGTTTGAAGCTCAAGCTGTTGTTAAAACAACTAATGCAGTTAACGGAGAAAGGTCTTTATCAGGAACAATTTATACTAACGAAGAGGTACTAAACAAGGTCGATAAAGGTTGGAAACTTGAGTTTGATGATGAGTATTACAAGATTATTTATGCTAAACCTACTGATACTGGTAACAAAATTCAAGTTGAATTTGATGCAGTTCATCAATTTTTTTATGATTTTGATAAATCATCACTACATAAGCAATTAAATGATGGTTCACATACTTTCCAAGCATATTTGAACTTTATTTTTAATGGCAGCGGGTATACTTACAGTTTAGAAGTAGTTGTCAAATCTTTCGAAAAGCAATCGTTTGGATATAAATCGCGACTTGATTTATTTAATGACATCATTAAGAGTGCAGGAGTTGAATTTTTTGTTCGTGGCAAGGTTGTTCGAATTCTACAAAAAACAGGAACAGATTTATCAACAATCGTACGTAAAAATTTCAATATGAATGAAATCATAATTGAAAAGAAAATCAATGATTTTATTACATATCAGAAGGGTTTTGGAGCGTGGACTGACCAAGAGGATCATTCCAAAGGAAGGCTCGAAGTAGAATATGAAAGTCCACTTGCAAAGGAATATGGACGAATTGAGGGTGAGCCTGTTGTTGATGAGCGGTACACTAACGCTGACAATTTAAAATCAGTACTAAAACAAAATGTAGATTCGTCTTACAATATCGCTGTAAAAATTGACATTGAAGATCTTACAAAAGCAGGTTATCAGTACACTCAACCTATTGCCGGTGATTATATTATGGCTATCAATGAGACACTAGGATTTAAGGAAAAAATCCGAATAGTATCGTTTGAAAGTGAGTATGATGTAACAGGTCAGCTGATTAACCATAAAGTCATTTGTAACGATATTGGTACAATCAAAAAACAAACTGTAGCTGTTAGCCAATTATCAAGTAAGATTAATAATAACCAAGAAATACTAGATAATGCAGTATTTAAAGCAAATCAAGCACTAGCATCAGCTGATGGTAAAAACACTAACTACTATGGTACGGAGATGCCAGTAGATGATCCAAAAGGCACGCTAAGAAAGGGTGATTTGCTTTTTTTAACTGTTGGCGATACTACCAGAATGTATTTCTGGAATGGTGCTGAATGGATTATCAATTCTTTTAGCGACGATATTGATTTTGTAAAGAAAGAAATTACTAATAAAATCATAGAGGTTAATGCAGCAATGAAACTTGCTGATGAACAGTTAACTGAAAAATATAATGCAATTGTTGCTAAAAATGTTAGCCAAGACGAATTAATTAATCAAGCAAAGAATTTGTCTGATTCTGCCAAAAAAGATGCTACAGAAGCATTGACAAACCTTATTAGTGAATCTAAAAAACTGACGGATAAAATGTCTGCGTTATCTAAAACAGAAGTTGAGCATTATTCAACAACTAATCTGCAACTGACACAACTTGATGGTACAGTCAAAGGATTACAAACTAGCTACGAGGCATTGTTAAAAAAAGATGGAGATATCACTCAAACACTCGCTAATTATAAGCAGACGATTGATCAAAATAGTACAAGTATTACTGCTAACAAAAAGACTGTTGATGGTACGCTTAGCAGTCTACAGACCCAAGTCACACAAACGGCTAATGAAATTACAACGAGATTATCTCAAACAAATATTGAAGCGTTGATTACAAGTAAGTCTGCTGTTATCGCTGATAATAAAGTCAAGGAAACTGCAGATAGTTTTAGCAGAGAAATAACTCGTGTTAATAATACTATTGATAATTTAAAGATAGGTACAGTTAATCTACTATCTGGTACTAAAAATTGGACTAAAAATTGGTTTAATCGTAATAACTGGCAATCTGATGACGATAACTTGACTATTGGTAATTTTAGCTTAACAGTGCTAAAGCGCAAAGCAATGTGGAGTGGTATATCACAATTGTATGCTGTAAAAAGCGGAGAGAATTACGTTTTTAGTGCATACGCTAAATCGAGCATGGATAATGACGTTGTGAATTTATATTTATTACCAAACGGTCAATCGCCGCAAGCAAAGATAAGTATTAGTTTCAAGTCAATCACTCTAAACACGGATTGGCAACGTATCGTTATTAAATTTAATGTAACTTCTGATGGCTATATCTTACCGCGTTTTGAACGTTTTAACGAAAACGGATGGTTGTATATTGCAGGCTATCAGCTAGAACATGGAAACGTTGCAAGTGACTATTCAGAGGCACCAGCCGATCAAGAAGACAAAATGACTGTTGAATTTAATAAAATCAACGATACAGTTAACAGCCATAGTCAATTGATTGGTAAACAGAACGAGAGTCTGACGGCTACAATACAAAAAGTTGATAATATACAATCAACAGTATCTAATGTTGATGGACGTTTGTCACGAGTTACACAAACTGCCGACGGTATAGTCACAACAGTTAGTCAGCTTGATAATAATATTTTACCTGGCACAAAAAATTTTACAGGATGGCAAATAGAAGGTGCAGTACTAGAAGATGTAACACAATCATCTTATCCATTTGTCTTTAAAAAATGGATAAGCGGCAACAAGGTATCGCCCTTAATCGAATATGATGTTAAAAAAAATCAAGAGTACACATTTACTGCATACATTGCTAGAGAACAAGCAGGTAATCTATATTTCTACTTGTACGATCTTTGGAATCATCATATCACAAGTGCAACCCCTCGCGAAACCATTATAAGAGACGTTAATTCTAGTGTAATACGATTTAGAATAACATTTATTCCAAATAGAGACGGTAAAATCAGACCACGGTTCGCAATGTTGGCCAGTGATCAAGGCTGGTTTATGGTTGGTGGTTTTATGTTATCTAAAGGTACCGCTGATCTACCCTGGTCTGAATCCAAGCAAGATATCAAAGATAATGTTACTGCGATTAATACAATAGTCGCACAAACAGCGAACAGTTGGGCTATTAAAAATTTGACTTCTAACGGTACTGTATTGAGTCAGCTTAATTTGACTGATGGTAACGTAAAACTGGAAGGTAAGTTAATACATTTGTCAGGTCAATCTATTATTGATAATGGCATTATTACTAATGCGATGATAAAAGATTTAACTGCAGATAAGATTACAGCAGGAACAATTGATGCTAATCGTATAAATGTCATTAATTTAGATGCTAGTAATATTACCAGTGGAAGAATGTCAGCGGACCTGATACGTAGCGGCGTTTTAATATCGCAAAACGGTGCAATGTTAACCGATCTTAATACAGGACAAATTGAATTTTACACAGATAATCCAGCTATCAAACGTATTACTGCAGGTTATCCTAACCAATTCGTTAAATTTGCAACAGGTAATGTTGAAGGAAAGGGCGCGGCTGGCGTAACGGTTATAGGTTCTAATCGATGGGGAAGTGAATCGTCAAACGACGGTGGCTTCGTTGGTATTCGCGCTTGGAATGGTAAAGACATCGATACTCTTGATTTAGTTGGCGATAGTATTCACTTAGCAAGCTCTGCGTACACTAACGCTGATGGTTGGGAAATCATTACTTTGCCAAATCAGCTATCAATAGATGCACGTAACATAAATCATCGTGTAACGTCTAAGGTAAAAGTAGGAGATATTTGGCTATGGAAAAATACATCAACTTATGTAAGCATGAAAGATACAATTAATATGATTATTGATAACTTGCAGCTACTACACAATAATAAAACCACTGAAAAAGGCTACAGTTATACTATTCCAGGAAAGATTTAG

Protein

Domains

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)