Phage RBP Database

Genbank accession

YP_001111100.1 [GenBank]

Protein name

tail protein

RBP type

TF

Evidence Phold

Probability 1,00

TF

Evidence RBPdetect2

Probability 0,97

Protein sequence

MKRLHAEGGLKRIYGAKGGGGGGGSSESPDSLHSIARAKVLDVISAGPIVGLVNGLQSVYLDGTPIQNADGSLNFQNYTVDARTGTQDQDYISGFPAVEREAGVGVPLTSDAPWVRQIQNTQLTAVRVRFGVPALQRQDTSNGNITGYRVDYAIDLSVDGGSYAQVLAGAFDGKTTSLYERSHRIELPRAKNGWLIRVRRITPNAHTATIADAINIEAITEIIDRKLRYPMTALVGMTFDARSFSSVPVRSYHVRGMIFRVPTNYDPETRTYSGTWDGTFKAAWTNNPAWVYYGLLLDKLNGLGDRVDASMVDKWALYAIARYCDELVSDGKGGKEPRFTCNCVLQTRADAFKVVQDLASVFRGISYWGAGSVVASADMPSDPVYLYTAANVVGGSFKYVGSERKTRYTVALVSYNDPTNQYKQAVEPVQDDDGIARYGVIKTEVTAFGCTSQAQAHRLGRWLLLTSRYETGTVSFQVGLDGTLCAPGQVIAVADPKKAGRRIGGRIRAAAGERITLDKAPTIAAGDRFTAILPSGIAQARAVKSVDGDTVTLAERFDADPVAGAVWMIESRELAAQQYRVVSVQESDDDGQIVYTINATQYEPGKYAAIDDGAQIQQRPITIVPPSVQPPPSNVRLSTYSVVDQGISKTTMVIAWDAANHATSYVVEWRKDNGEWVKVPSTGGLQVEVPGIYQGKYLARVCAENALGVTSIPAYGVDTQLTGKTTPPPSVVSLTAAGIVYGIDLKWAFPGDGSAGDTQRTEIWYSRTPNRDDATKFSDFAYPQASTSYQGLAVGQVFYFWARLVDTSGNVGPWFPAKGPGVQGQPSTDQSDYEKYFAGQIGKSALGTELRAPIDLITPPMAGDATIYAGDERLNAGVWSLQAAIAEGDMAVAKKVETVAAQLHSGSNLLNAAVQKETIARVEADRAMAQDITTVQAQVDDNVAAVQTVAKSYADLNGRVAASYQIKVQTTADGHKYMASIGVGIDNENGVVESQVLVSAKRFAVIDEDGSGVIGAPFVVQGGQVFLRQALIGAGWITNAMIGSYIQSDNYIAGRQGWRLDKTGWFEMNAADGSGNRLVMDGSSVRVYDGNGVLRVRMGMW

Physico‐chemical properties

protein length:	1101 AA
molecular weight:	118342,52530 Da
isoelectric point:	5,82318
aromaticity:	0,08719
hydropathy:	-0,18774

Domain architecture

YP_001111100.1

1 1101 aa

ATT 98–225 · ATT 350–508 · STR 629–729 · RBD 945–1083 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR053171
Unmapped

IPR053171 IPR015406

IPR055385
ATT

IPR055385 IPR032876 IPR036116

IPR013783
STR

IPR013783

IPR003961
STR

IPR003961

IPR003961
STR

IPR003961

YP_001111100.1

11101 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0014
STR

DC_0014

YP_001111100.1

11101 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR053171	Unmapped	-	12	900	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	98	225	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	350	508	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR036116	STR	IPR036116	629	716	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	630	718	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	631	729	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	647	709	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR015406	RBD	DC_0135	945	1083	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Proteins with similar domain architecture

Phage

Burkholderia phage phi644-2 [NCBI] · taxon 2881400

Uroviricota Caudoviricetes Stanholtvirus

Host

Burkholderia pseudomallei [NCBI] · taxon 28450

cellular organisms Bacteria Pseudomonadati Pseudomonadota Betaproteobacteria Burkholderiales

Genbank protein accession

YP_001111100.1 [NCBI]

Genbank nucleotide accession

NC_009235 [NCBI]

CDS location

range 17130 -> 20435
strand +

CDS

TTGAAAAGGCTTCATGCTGAAGGGGGGCTGAAGCGGATCTACGGCGCGAAGGGCGGCGGCGGCGGTGGTGGCAGCAGCGAATCGCCTGACAGCCTGCATTCGATTGCGCGCGCGAAGGTGCTCGACGTGATCTCGGCGGGGCCCATCGTGGGGCTGGTGAATGGCCTGCAGTCGGTCTATCTCGACGGCACGCCGATCCAGAACGCGGACGGCTCGCTGAATTTCCAGAACTACACCGTCGACGCGCGAACCGGCACGCAGGATCAGGACTACATCTCGGGTTTTCCGGCCGTCGAGCGTGAGGCCGGCGTCGGCGTGCCGCTGACGTCCGACGCGCCGTGGGTGCGCCAAATCCAGAATACGCAACTGACTGCGGTGCGCGTGCGCTTCGGTGTGCCGGCGCTACAGCGTCAGGACACGTCGAACGGCAATATCACGGGCTATCGCGTCGACTATGCGATCGACTTGTCGGTCGACGGCGGGTCGTATGCGCAGGTGCTGGCCGGTGCGTTCGACGGCAAGACGACGTCGCTCTATGAGCGCTCGCATCGGATCGAGCTGCCGCGCGCAAAAAATGGTTGGTTGATCCGCGTGCGCCGCATCACGCCGAACGCGCACACGGCGACGATCGCCGACGCGATCAACATCGAGGCGATTACCGAGATCATCGATCGGAAGCTCCGCTATCCGATGACGGCGCTTGTCGGTATGACGTTCGACGCACGTTCGTTCTCGAGCGTGCCAGTGCGTTCGTATCACGTGCGAGGGATGATCTTCCGAGTCCCGACAAACTACGACCCGGAGACGCGTACGTACTCGGGTACATGGGACGGTACGTTCAAGGCAGCATGGACGAACAATCCGGCGTGGGTCTACTACGGCCTACTTCTCGACAAGCTCAACGGATTGGGTGACCGTGTCGATGCTTCGATGGTCGATAAGTGGGCGCTGTACGCAATCGCGCGTTACTGCGACGAACTCGTGTCCGACGGGAAGGGCGGCAAGGAGCCGCGCTTCACCTGCAACTGCGTGCTTCAGACGCGCGCGGACGCATTCAAGGTGGTACAGGATCTCGCGAGCGTCTTTCGCGGCATTTCGTACTGGGGCGCCGGGTCGGTGGTCGCGTCGGCCGATATGCCGTCCGATCCGGTCTACCTGTACACGGCCGCGAATGTCGTCGGTGGTTCATTCAAGTACGTCGGCAGCGAACGCAAGACGCGTTACACGGTCGCGCTCGTCAGCTACAACGATCCGACGAACCAGTACAAGCAAGCTGTCGAGCCCGTGCAGGACGACGACGGGATCGCGCGATATGGCGTCATCAAGACGGAGGTCACGGCGTTCGGCTGCACGTCGCAGGCGCAGGCGCACCGGCTCGGGCGCTGGCTGCTGCTGACGTCGCGGTACGAGACCGGGACGGTGTCGTTTCAGGTCGGGCTCGACGGGACGCTTTGTGCGCCGGGACAGGTGATCGCCGTTGCCGACCCAAAGAAGGCCGGCCGCCGGATCGGCGGGCGCATCCGCGCAGCGGCTGGCGAAAGGATCACGCTCGACAAGGCGCCGACAATCGCCGCCGGCGATCGCTTCACGGCGATTCTGCCGTCGGGTATTGCCCAGGCGCGCGCAGTCAAGTCGGTCGACGGCGACACGGTCACGCTCGCCGAGCGCTTCGACGCCGATCCGGTGGCGGGCGCTGTGTGGATGATCGAAAGCCGCGAGCTCGCGGCGCAGCAGTATCGCGTGGTGAGCGTGCAGGAAAGCGACGACGACGGCCAGATCGTCTACACGATCAACGCGACGCAGTACGAGCCGGGGAAGTACGCGGCGATCGACGACGGCGCACAGATTCAGCAACGGCCGATCACGATCGTTCCGCCATCGGTGCAGCCGCCGCCGTCGAACGTCCGCCTCTCGACATACTCGGTGGTCGATCAGGGTATTTCGAAAACAACGATGGTGATCGCGTGGGATGCAGCGAACCACGCGACAAGCTACGTCGTCGAATGGCGGAAGGATAACGGCGAGTGGGTGAAGGTGCCGTCGACAGGCGGCCTGCAGGTCGAGGTGCCGGGAATCTATCAGGGCAAGTACCTCGCGCGGGTGTGCGCCGAGAACGCGCTCGGCGTGACGTCGATTCCGGCGTACGGCGTCGATACGCAACTGACCGGGAAAACCACTCCGCCGCCGTCGGTCGTGTCGCTGACTGCGGCGGGCATCGTGTACGGGATCGATCTGAAATGGGCGTTTCCGGGTGACGGATCCGCTGGCGACACGCAGCGAACGGAGATCTGGTACAGCCGCACGCCGAATCGCGACGACGCGACCAAGTTCTCCGACTTCGCGTATCCGCAGGCGTCGACGTCGTATCAGGGGCTCGCGGTCGGGCAGGTGTTTTATTTCTGGGCGCGCCTGGTCGACACGTCCGGCAACGTCGGGCCGTGGTTCCCGGCGAAGGGGCCGGGCGTGCAGGGGCAGCCGAGCACGGATCAAAGCGACTACGAGAAGTATTTCGCCGGCCAGATCGGGAAGTCGGCGCTTGGCACGGAGCTGCGCGCGCCGATCGACCTAATCACCCCGCCGATGGCCGGCGACGCAACGATCTACGCGGGCGACGAAAGGCTCAATGCTGGCGTGTGGTCGCTGCAGGCGGCGATCGCCGAGGGCGATATGGCGGTCGCGAAGAAAGTCGAAACAGTCGCGGCCCAGCTGCACTCGGGCTCGAATCTGCTGAACGCCGCGGTGCAGAAGGAGACGATTGCGCGTGTCGAAGCTGATCGTGCGATGGCGCAGGACATCACGACGGTGCAGGCGCAGGTGGACGACAACGTGGCTGCGGTGCAAACCGTTGCGAAGTCCTACGCCGACCTGAACGGACGTGTCGCGGCTTCGTATCAGATCAAGGTACAGACGACCGCCGACGGCCACAAATACATGGCGTCGATCGGTGTGGGCATCGACAACGAAAACGGCGTCGTCGAATCGCAGGTGCTCGTGTCGGCGAAGCGGTTCGCCGTGATCGACGAGGACGGCTCCGGTGTGATCGGTGCGCCGTTCGTCGTGCAGGGCGGGCAGGTGTTCTTGCGTCAGGCGCTGATCGGTGCGGGCTGGATTACGAACGCGATGATCGGCAGCTACATCCAGTCCGACAACTACATCGCGGGGCGGCAGGGATGGCGGTTGGATAAGACCGGTTGGTTCGAAATGAACGCAGCGGACGGCAGCGGAAATCGGCTTGTGATGGATGGTAGCAGTGTCCGTGTCTACGACGGTAACGGCGTGCTGCGGGTGCGCATGGGGATGTGGTGA

Protein

Domains

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)