Phage RBP Database

Genbank accession

UZO33491.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,79

TF

Evidence RBPdetect2

Probability 0,52

Protein sequence

MADLAKIQFLRSTVAGKTPTTSQLADGELAINMADYAIYTKNGSSIVQLAGKGIPETNTKKLTVDGPSALNDTVTVAEGKTITFTNADLSGGMVRHITGRNALNDGWYIGSGGESNKGFLEIGTIDDGDEEIRFVSRGSGDTVRRTLKLIDSGGNTRVPGNIYIDEAMGGGGSAFISKNKAYFGAGGADIYMRNTAGGATNQLTITDGGELLFQAKPVYWDGRKPTLTELGIGRVENARQLEQDNFPVTTGNETRWIKVALLKDPGSGQSRLQLMVTNGGNYGNTRSSIDFIDCSARSIPSTLTSGNVRSYLQVRRLGDTAIDYTNQMRYSLVRTSEGLELWFTQRAFIGGVKVALLSIAGGAATEYYLPTGYTISATAPEGLVESTVIRIYDEMNKPNLDDGTDGILSVAKGGTGASTAAAARTNLGLGTAATRDVGTGSGQVMLVGAYGLGGKGTSYTVSNARDYLKQLRTDGSQFMRNTLGTEINYGMGASFYSSVSDVHAVISVDWNTGRVKVGATNDANLNSDTGKISSQELYGTAFKPTPDDVGAVARTGDGMTGDLSITKVSPGFHLNAESGNSVIWFKYKGVESGAVWALPNTASSGEVRIRARTSGGTTGGEFSFKSDGTFTSPGNINITSGAFNGKSVNTQYANFNNTSSTTTEQTVSISGSQHTPLLLNRPTNSNLSIGFKLSGMNMKRLGVDVNGDIRYGEAENQTQNAWLLSSDTINRWVVNFGRDINVAGVVNSTGGFTGPVAAYDLTGVTQDLDALTLNYTEPGTVKVYSCRSMGGGDNITNKPSGVGGNFIVIVECLRKVSDTDYTNRQVLRASDNKRSWERWFTVSGTAKAWTPWRMNVISGNDDDVSFKSVTTTTGNLNSGNDLIVANNARVGGNLGLGGASSTKYTDKGVVIGSGSALLESTDGRVIIGSSGGGRAVELRPGGPTQTNNLIKVTATAGSGGDTAIEYAQGAKIRSNNGGALIISAKAGQAIYLRPQGDTSSANETRIDSNGSITVNGNINANGNMSATGTLTVSGATTLNNTLTVNNVGPIEKRGIRTYTEGSVTVNETDGITMFGAGSNLGTLRFTERVGNSAFIGLQSTAGDNTGWFEFHTNGMFRANHAELTTGLRVKGSPIVQPTSDNNAWASINFRHTDGNTTRGILFADAAGNIGFSNINGKNVIWNTGNYFIIQQGELNVGVNNGGTGENNEDRNKANFYNKGSIDCAGTRAYQDANAGNRWVREVRGVRHLMQGTDLGSENIFVERVGERHFHMLHVFGANSNGWFEFRNNGDMSCNGTLYAQDVYITSDKRHKRNITKVESSEEILSKMSAYNYEVRDPTADDAWTKATGLIAQEVQEVLPTAVDDSDPEHIRLNYNAIVAVLVEQVNKLTAKVNELERKLN

Physico‐chemical properties

protein length:	1400 AA
molecular weight:	148698,93290 Da
isoelectric point:	6,13744
aromaticity:	0,07286
hydropathy:	-0,35829

Domain architecture

UZO33491.1

1 1400 aa

CHP 1306–1399 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR030392
CHP

IPR030392 Coil

IPR030392
CHP

IPR030392

UZO33491.1

11400 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_1942
ATT

DC_1942 DC_1921 DC_1202

DC_1942
ATT

DC_1942 DC_2180

UZO33491.1

11400 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR030392	CHP	DC_0088	1306	1362	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1306	1399	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1378	1398	Coils	Coil	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

UZO33491.1

1 1400 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	358	358	0,0448
Central domain	359	557	200	0,2805
C-terminal	558	1400	842	0,6996

Note: Constraints were applied during segmentation.
Fixed 42 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Klebsiella phage pR7_1 [NCBI] · taxon 2994963

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Klebsiella pneumoniae [NCBI] · taxon 573

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Enterobacterales

Genbank protein accession

UZO33491.1 [NCBI]

Genbank nucleotide accession

OP684128.1 [NCBI]

CDS location

range 133232 -> 137434
strand -

CDS

ATGGCTGATTTAGCAAAAATTCAATTCCTACGTAGCACAGTTGCGGGGAAAACACCTACTACAAGTCAGCTTGCAGATGGTGAACTGGCGATCAACATGGCTGATTATGCCATTTACACGAAAAATGGTTCTTCGATCGTTCAGTTAGCGGGTAAAGGTATCCCAGAAACAAATACCAAAAAATTAACAGTTGATGGGCCTAGTGCTCTTAATGATACCGTTACCGTAGCGGAAGGTAAAACTATTACTTTCACCAACGCGGATTTGAGCGGGGGTATGGTTCGTCATATCACTGGTCGAAACGCTCTTAACGATGGTTGGTACATTGGTTCTGGTGGTGAGAGTAATAAAGGGTTTTTAGAAATCGGTACAATTGATGACGGTGATGAAGAGATCCGTTTCGTTTCCCGTGGTTCTGGTGATACTGTTCGCCGTACTCTGAAACTTATTGATTCCGGTGGTAACACTCGCGTACCAGGTAACATCTATATTGATGAAGCTATGGGCGGTGGTGGTTCTGCTTTTATTTCAAAAAACAAAGCATATTTCGGCGCTGGCGGTGCTGATATCTATATGCGTAACACGGCTGGCGGTGCAACAAATCAGTTAACGATCACTGATGGCGGTGAATTGCTGTTTCAAGCAAAACCTGTATACTGGGACGGTCGTAAACCGACTTTAACCGAACTGGGGATCGGGCGGGTTGAAAACGCGCGTCAACTTGAGCAAGATAATTTCCCTGTAACTACAGGCAACGAAACTCGTTGGATTAAAGTTGCTCTGTTAAAAGATCCTGGCTCAGGTCAGAGTCGCTTGCAACTGATGGTGACTAACGGCGGTAACTATGGCAATACGCGCAGTTCTATTGACTTTATCGATTGTAGCGCTCGAAGCATTCCATCGACATTAACAAGCGGTAACGTTCGTTCTTACCTGCAAGTTCGACGTTTAGGAGATACTGCAATTGATTATACTAACCAGATGCGTTATAGCCTGGTTCGTACCTCCGAAGGTTTAGAACTGTGGTTTACTCAACGCGCATTCATTGGTGGTGTTAAAGTTGCTCTGCTGTCTATCGCTGGCGGTGCTGCTACTGAATATTATCTGCCTACTGGTTACACAATCTCTGCAACTGCTCCGGAAGGGTTAGTTGAGAGTACGGTTATTCGTATCTATGACGAAATGAACAAACCTAACCTTGACGATGGTACTGATGGTATTCTGTCTGTTGCTAAAGGTGGTACAGGCGCAAGTACAGCGGCTGCTGCTCGCACAAACTTAGGTTTGGGTACTGCTGCAACCCGTGATGTTGGTACAGGTTCCGGACAAGTAATGCTTGTTGGTGCTTACGGTTTAGGCGGTAAGGGTACATCATACACCGTTTCTAACGCTCGCGACTATCTGAAACAACTGCGTACTGATGGTTCTCAGTTCATGCGAAATACGCTTGGTACTGAAATTAACTATGGTATGGGCGCAAGTTTTTATAGCTCTGTATCAGATGTTCATGCGGTGATCTCGGTTGATTGGAATACTGGACGCGTTAAAGTTGGTGCAACTAATGATGCTAACTTAAACTCAGATACCGGAAAAATCAGCTCTCAGGAACTGTACGGTACTGCATTTAAACCAACTCCGGATGACGTAGGGGCTGTTGCTCGTACTGGTGATGGTATGACAGGTGATCTGTCTATTACCAAAGTGTCTCCCGGATTCCATTTAAATGCTGAGAGCGGAAACTCCGTAATTTGGTTTAAGTATAAAGGGGTTGAAAGTGGTGCTGTGTGGGCGTTGCCTAACACTGCCTCTTCTGGTGAAGTTCGCATTCGTGCCAGAACGAGTGGTGGAACTACTGGTGGAGAATTCTCGTTTAAATCAGACGGTACATTTACATCACCTGGTAATATCAATATTACTAGCGGCGCTTTCAACGGTAAAAGTGTCAATACTCAGTATGCGAACTTTAATAACACAAGTTCAACCACAACCGAACAAACCGTTTCTATTAGTGGTTCGCAGCACACTCCGCTGTTACTGAATAGACCGACTAACTCGAACTTGTCTATCGGGTTCAAACTTTCCGGAATGAACATGAAACGTTTGGGTGTTGATGTAAACGGTGATATTCGTTACGGTGAAGCAGAAAACCAGACACAAAACGCATGGCTGTTGTCTTCGGATACAATAAACAGATGGGTAGTTAACTTCGGGCGTGATATTAACGTTGCTGGTGTGGTTAATTCAACTGGTGGATTTACTGGCCCTGTTGCTGCGTATGATTTGACTGGGGTAACTCAGGATCTTGATGCTTTAACATTGAACTATACCGAACCGGGTACTGTTAAAGTTTATTCGTGCCGTAGTATGGGTGGCGGTGATAACATCACCAATAAACCTTCTGGCGTCGGTGGTAACTTTATTGTTATTGTTGAATGTCTCCGTAAAGTAAGCGATACAGATTACACTAACCGTCAAGTATTACGCGCATCGGACAATAAACGCAGTTGGGAACGTTGGTTCACTGTTAGCGGTACTGCTAAAGCATGGACACCGTGGAGAATGAACGTCATTAGCGGAAACGATGACGATGTATCATTTAAATCTGTTACCACGACTACAGGAAACCTGAACAGCGGAAATGATCTGATTGTTGCTAACAACGCTCGCGTAGGTGGCAACTTAGGGTTAGGTGGTGCTTCTTCCACGAAGTACACTGATAAAGGTGTTGTGATCGGTAGTGGTAGTGCTCTGTTAGAAAGTACTGATGGTCGCGTGATTATTGGTAGTTCTGGTGGTGGTCGTGCTGTTGAATTGCGTCCTGGTGGCCCAACTCAAACCAACAACTTGATCAAAGTAACTGCTACCGCTGGAAGTGGTGGTGATACCGCGATCGAGTATGCACAAGGGGCTAAAATTCGTTCCAATAATGGCGGCGCGTTGATTATTTCTGCTAAAGCAGGTCAAGCAATTTATCTGCGACCGCAAGGTGATACATCCAGCGCAAACGAAACCCGTATTGATTCAAACGGTAGTATCACGGTTAACGGCAATATTAACGCTAACGGAAATATGTCTGCTACTGGTACGTTAACTGTTTCTGGTGCTACTACATTAAACAACACATTAACGGTTAATAATGTAGGGCCAATCGAGAAACGGGGGATCAGGACGTATACAGAAGGTTCTGTTACTGTCAACGAAACCGACGGCATTACGATGTTTGGTGCTGGTTCTAATTTAGGAACTCTGCGATTTACAGAACGTGTAGGAAATAGCGCATTCATTGGATTACAATCAACAGCAGGAGATAATACTGGATGGTTTGAATTTCATACAAATGGAATGTTTCGAGCAAACCATGCGGAACTGACAACAGGTCTTCGTGTTAAAGGTTCTCCGATTGTTCAGCCAACAAGTGACAACAACGCCTGGGCGTCTATTAACTTTAGGCATACGGACGGTAATACAACCCGTGGTATTTTGTTTGCTGATGCTGCTGGTAATATCGGATTTAGTAACATAAACGGTAAAAACGTTATATGGAACACTGGTAACTACTTTATCATTCAGCAAGGCGAACTGAACGTTGGTGTTAACAACGGTGGTACTGGCGAAAACAACGAAGACAGGAACAAAGCTAACTTCTACAACAAAGGCTCTATTGATTGCGCAGGTACACGCGCATATCAGGATGCTAACGCAGGAAACCGCTGGGTTCGTGAAGTTCGTGGCGTAAGACATCTTATGCAAGGAACCGACCTCGGTTCTGAGAATATATTTGTTGAACGTGTAGGCGAACGTCATTTCCATATGCTTCATGTGTTTGGGGCTAACAGTAACGGTTGGTTTGAATTCCGTAATAATGGTGATATGTCGTGTAACGGTACGTTGTATGCACAGGATGTTTATATAACTTCCGATAAACGACACAAACGTAATATCACTAAAGTTGAAAGCTCCGAAGAAATTTTGAGCAAAATGTCAGCTTATAATTACGAAGTTCGAGATCCTACAGCAGATGATGCATGGACAAAAGCAACGGGGCTTATTGCTCAGGAAGTTCAGGAAGTTCTTCCTACTGCTGTTGATGATTCAGATCCTGAACATATTCGCTTGAACTATAATGCGATTGTTGCGGTTCTGGTAGAACAGGTCAACAAGTTAACTGCTAAAGTTAATGAACTTGAAAGAAAACTTAATTAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)