Phage RBP Database

Genbank accession

YP_009859395.1 [GenBank]

Protein name

virion structural protein

RBP type

TF

Evidence RBPdetect

Probability 0,68

Protein sequence

MASRKEMMGMDTETLRMLGLEAGLSFEPGLSKSKMVIQLETHQASGWLDVNSQLLHADAEGGFDHMQGFTGHEEQSISDAARVAQSLAGAGYTETFHSIMGGGRDHHVDALHQYMQKLGVSADDVWMHMPKANPNIPPQNFNMLKGYLNNHWDDYQDIMPPLEGHYAGDIMGEYATNKGSVADSYNHLASMYLNKAAYNNPHAYEKDASIVATRLASAMGNQFLEVGYAAATGAKVGYHSILPQLGSDVVRGTQYPREPLNAAGLPLGATGSAVQGNRAHYSLVASLLGRPEGADEASSAIRQEVSSTMKSLASSHKGGGETGMNPYRHETSEHDLLLDSATRYVGIEEARSGYANLDDTSYNRNNIQAVIENSWDKMDAQAASAPSGVPNPDLRLPRRAEIGTQWSADLNEPMSWNAARSRREGAAIADLDAAHANFRDVADGNRGASPIKYHNMEQGSDEWFKFREQYDITGSTVGGFLGSNSYTRPWAQFMDKLGVTRNETAPNSFQEKMFAMGHKREDEARIRVSKELGQDIQQVGAITNDMFPGMMYSPDGLIGDDTLWEHKAPERAGKFADLNAGDHPDYMDQVQLGMLLSGRKKTLFSQTIGQQTQNQWIEQDPDWYNRNQTRLDSVLNRMQAGRDFLSNHADLPQDELKAGVRKAVTGEGIWKDVRQKSDRGYSPNAGTEADPFLIGGRRSYNDAAQGGSDYEPNFVTSANTGLVPVGGNGAETGMALAVKQGVLAAREEVKRGEASGNAAGFDAGGADADFDDLGMPRGFSRRAFDRANSDGAGGGGGNGGGRNGAGPGAFDNFGNGIASGLASGSLHGLQGGFQRELANMGPVGQTLLAGIGAASIGGEVISTMNDYLGNSQDFGSTNPIQFDAQQQGLEMLGLNKGQAQRANETVHSIYNRMANGDPSGAAQISVATRGLLTLADVRESGGDPIKLAAMFKSKAQARGWSPERIAGAAEMSGLGGFARAANTSDEIQAAAEGLDDTRGRQDTSDFASSVRRDNAVRAAVSPDYFIQRYGAQDYNALVGGLSGGMAKAYGAMDKAEQLTHANSLAEATQMLESNGRDYDDKGNPLTSPTGAKYSMQVLPSTARDPGYGVKPAQSDTPEEYNRVGRELLDKMVGKYAGDYDKAAAAYTDGSGTVDRAVKQWGNDWLKHMPAQAQKRVADLHKLAAGANGFAGGSTGPSVGTIQVNVNATVNGKQATATATVGGQSQTHTINVGGAVSQKR

Physico‐chemical properties

protein length:	1239 AA
molecular weight:	132124,17690 Da
isoelectric point:	5,38631
aromaticity:	0,07103
hydropathy:	-0,57595

Domain architecture

YP_009859395.1

1 1239 aa

STR 443–646 · RBD 1051–1063 · STR 1064–1164 · RBD 1165–1182 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR011604
STR

IPR011604 G3DSA:1.10.530.10

IPR011335
Unmapped

IPR011335 IPR023346

cd00254
ENZ

cd00254

IPR008258
ENZ

IPR008258

YP_009859395.1

11239 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0169
ATT

DC_0169 DC_0159 DC_0800

YP_009859395.1

11239 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR011604	STR	IPR011604	443	646	Merged direct domain	PD-(D/E)XK endonuclease-like domain superfamily	Central	Low	Positional only	46 proteins / 46 hits
IPR011335	Unmapped	-	452	638	InterPro	Restriction endonuclease type II-like	-	-	-	-
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1051	1182	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR023346	STR	IPR023346	1064	1164	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
cd00254	ENZ	DC_0010	1082	1159	InterPro cluster	cd00254	C-terminal	High	Text match	100 proteins / 142 hits
IPR008258	ENZ	DC_0010	1086	1160	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits

Proteins with similar domain architecture

Phage

Pantoea phage vB_PagM_SSEM1 [NCBI] · taxon 2721760

Uroviricota Caudoviricetes Chaseviridae Loessnervirus Loessnervirus SSEM1

Host

Pantoea agglomerans [NCBI] · taxon 549

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Enterobacterales

Genbank protein accession

YP_009859395.1 [NCBI]

Genbank nucleotide accession

NC_048875 [NCBI]

CDS location

range 39788 -> 43507
strand +

CDS

ATGGCTAGCAGAAAAGAAATGATGGGCATGGATACGGAAACTCTCCGTATGCTTGGTCTTGAGGCCGGATTATCTTTTGAGCCCGGACTCTCGAAGTCCAAAATGGTTATACAACTGGAAACTCATCAAGCTTCCGGTTGGTTAGATGTGAACAGCCAACTTCTTCATGCAGATGCGGAAGGCGGCTTTGACCACATGCAGGGCTTTACAGGTCACGAAGAACAATCCATTTCTGACGCTGCAAGAGTTGCACAATCGTTGGCTGGTGCTGGTTACACTGAAACATTCCATTCAATCATGGGTGGCGGTCGTGACCATCATGTTGATGCACTTCATCAATACATGCAGAAACTTGGTGTCTCTGCTGATGATGTTTGGATGCACATGCCAAAGGCGAATCCCAATATTCCGCCTCAGAATTTCAACATGCTGAAAGGTTATTTAAATAACCATTGGGATGATTATCAGGATATTATGCCTCCACTTGAGGGGCATTATGCTGGTGATATCATGGGCGAGTATGCTACGAATAAAGGCAGTGTTGCTGATTCGTACAACCATCTTGCATCCATGTATTTAAATAAAGCTGCTTACAACAATCCACATGCCTATGAAAAGGATGCGTCAATTGTTGCAACGCGTTTGGCTTCGGCAATGGGAAATCAATTCCTCGAAGTTGGCTATGCTGCTGCAACTGGTGCGAAGGTTGGATATCATTCTATTCTTCCACAACTTGGCTCTGATGTTGTTCGTGGTACTCAGTATCCTCGCGAACCTTTGAATGCTGCTGGTTTACCTTTGGGTGCAACTGGTTCTGCTGTTCAGGGAAATCGTGCACATTATTCTTTGGTTGCTTCTTTGCTCGGTCGTCCAGAAGGTGCTGATGAAGCATCAAGTGCGATTCGTCAGGAAGTAAGCTCAACAATGAAGTCTCTGGCATCGTCACATAAAGGCGGTGGTGAAACAGGAATGAATCCTTATCGCCACGAAACGTCAGAGCATGACTTATTGCTTGATAGTGCGACACGTTATGTTGGTATCGAAGAAGCTCGTTCAGGTTATGCAAACTTGGATGACACCTCATACAATCGCAACAACATTCAAGCTGTAATCGAAAACAGTTGGGACAAGATGGATGCTCAGGCAGCGTCTGCACCATCTGGTGTTCCCAATCCAGACCTGCGTTTACCACGTCGTGCGGAGATTGGTACTCAATGGAGTGCTGATTTAAACGAACCAATGTCGTGGAATGCTGCTCGCTCTCGTCGCGAGGGTGCCGCCATTGCAGATTTGGATGCTGCTCATGCAAACTTCCGTGATGTTGCTGATGGAAATCGTGGTGCAAGCCCGATTAAGTATCACAACATGGAACAAGGAAGTGATGAGTGGTTCAAGTTCCGTGAACAATATGATATTACCGGCTCAACAGTTGGTGGTTTCTTAGGTTCAAACAGTTATACCCGTCCGTGGGCACAGTTCATGGACAAACTTGGAGTGACAAGGAACGAAACAGCTCCCAATTCATTCCAAGAAAAGATGTTTGCCATGGGACACAAGCGAGAAGATGAAGCTCGCATCCGTGTTTCCAAAGAACTCGGTCAGGATATCCAGCAAGTTGGTGCAATAACCAACGACATGTTCCCCGGAATGATGTATTCACCAGATGGATTAATTGGTGATGACACTTTATGGGAACACAAAGCTCCTGAACGTGCTGGCAAGTTTGCAGATTTGAATGCAGGCGACCATCCAGACTACATGGACCAAGTTCAATTGGGCATGTTGCTTTCTGGACGCAAGAAAACTTTGTTCTCGCAGACGATTGGACAGCAAACACAGAATCAATGGATTGAACAAGACCCGGATTGGTACAACAGAAACCAAACTCGTCTTGATTCTGTGCTCAACCGTATGCAAGCTGGTCGTGACTTCCTCTCAAACCATGCTGACCTTCCTCAAGATGAATTGAAAGCCGGTGTTCGTAAAGCTGTAACAGGCGAAGGAATCTGGAAAGATGTTCGTCAGAAATCAGACCGTGGCTATTCTCCAAATGCTGGTACAGAAGCTGACCCATTCTTAATTGGCGGTCGTCGTTCTTATAATGACGCTGCTCAAGGTGGCTCAGATTACGAACCTAACTTTGTGACTAGTGCCAATACTGGCCTCGTACCAGTGGGCGGTAACGGCGCTGAGACGGGCATGGCGCTTGCGGTTAAGCAGGGCGTACTGGCGGCAAGGGAAGAGGTAAAACGCGGCGAGGCTTCGGGTAACGCGGCAGGATTTGATGCTGGTGGTGCCGATGCGGACTTTGACGATTTGGGTATGCCTCGCGGCTTCTCGCGTCGGGCGTTCGACCGGGCCAACAGTGATGGTGCTGGCGGTGGCGGTGGAAACGGCGGTGGACGCAATGGCGCTGGCCCAGGTGCGTTTGACAACTTCGGCAATGGGATTGCATCGGGTTTGGCAAGCGGCTCACTGCATGGGCTACAGGGCGGATTCCAGCGTGAGCTAGCAAACATGGGGCCGGTTGGTCAAACCCTATTAGCTGGTATCGGAGCGGCGTCAATTGGTGGTGAAGTCATTTCAACAATGAATGACTATCTTGGAAACTCGCAGGACTTTGGTTCTACGAATCCAATCCAGTTTGATGCTCAACAGCAAGGACTTGAAATGCTCGGCCTTAACAAAGGTCAGGCACAACGAGCAAATGAAACTGTTCATTCGATTTACAACAGGATGGCGAACGGCGACCCAAGTGGTGCTGCTCAAATCTCAGTTGCAACTCGCGGGCTGTTAACTCTTGCTGATGTTCGAGAAAGTGGTGGCGACCCAATCAAGCTGGCTGCGATGTTTAAGTCGAAAGCTCAAGCTCGTGGTTGGAGTCCAGAACGAATTGCCGGTGCTGCTGAAATGTCAGGACTCGGTGGATTTGCTCGCGCTGCTAACACCAGTGATGAAATCCAAGCTGCTGCCGAAGGTCTTGATGATACTCGTGGTCGTCAGGATACAAGCGACTTCGCTTCATCTGTTCGTAGGGATAATGCTGTTCGTGCTGCTGTATCTCCTGACTACTTTATTCAAAGATATGGTGCTCAGGATTACAATGCGTTGGTTGGTGGTTTGTCTGGTGGCATGGCGAAAGCTTATGGCGCAATGGATAAAGCTGAACAACTTACTCATGCAAACTCGCTTGCAGAAGCAACACAAATGCTTGAGTCAAATGGTCGTGATTATGATGATAAAGGTAATCCGTTAACCAGTCCTACTGGTGCCAAATACTCAATGCAAGTTCTTCCTTCTACTGCACGTGACCCTGGTTATGGAGTTAAGCCTGCTCAAAGTGATACGCCAGAAGAATACAATCGTGTTGGTCGAGAACTTCTCGACAAGATGGTTGGTAAGTATGCTGGTGATTATGACAAGGCGGCTGCTGCATATACTGATGGTTCAGGTACTGTAGACAGGGCTGTTAAACAGTGGGGCAATGACTGGCTTAAACATATGCCAGCACAAGCTCAGAAACGAGTTGCTGATTTACATAAATTGGCGGCTGGTGCAAATGGATTTGCTGGTGGTTCTACTGGACCATCTGTTGGAACCATTCAAGTTAATGTCAATGCAACTGTTAATGGCAAACAGGCAACTGCAACTGCAACTGTCGGTGGTCAATCTCAGACGCACACTATTAATGTTGGTGGCGCTGTTTCTCAGAAGCGTTAA

Title	Authors	Date	PMID	Source
Complete genome sequence of Pantoea agglomerans bacteriophage vB_PagM_SSEM1	Truncaite,L., Alijosius,L., Petrauskaite,E. and Simoliunas,E.	2012-05	—	GenBank

Protein

Domains

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Literature