Phage RBP Database

Genbank accession

YP_009007943.1 [GenBank]

Protein name

virulence associated protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MAQNTNLNVTPYYDDFDKDRNFYRVLFRPGFPIQARELSTMQSILQNQVESVGSHLFKDGAMVIPGQVGYDLNVQAILLQESFLGSDVETYRTQLTGTIIEGLTTGVKAKVLYSISASESERGYVTLYVKYIDSGDTTSESALNTFQINEQLIASKEITFGTTLIEIGTPFAQLLPVNATAVGSTAYISDGVYFIRGHFVNVPSSYLILNQYDTNPSYRIGLEILESIITPEDDESLNDNAAGTSNYSAPGAHRFKIGTQFVKRLITDEADKNFIELLRINNSNVESFVERTAYSELEKSMARRTYEESGDYVIDTFDVTPREHLNDGFNNGVYSANQTSSNGNLATDSKVALEVSPGTAYVRGYRTEFITPQYIDVDKPRDFDTRQNGIINFNLGNFLKVYDVYGWPEVSGDGVTDAYQILDLYDDYAANATSSVKAGANRIGRCRTVQLQKSSTALAATSPFGISPNITGGVYDLWVFDVQMFTVLNIANAVTPYTAGTRIVGKTSGAAGYIADTGNGSHYIYLEQVNGVFINSEILEVNGRTVGTLEAAWSYQLSDTRSCFGKDSGSNIIFGSNFILNDSRPVEASTVDIDDTTDDEITGFRTRFEKDLRPGDVVTPTISDFEGVNTHRILRVDPTAIATTAANKKSTVSAGNEIFDFAEQTAKIDGSLLNGTVTDGEYSELIRLRPFIFQKDYQNGELSFDLPEDTMKSLDDESFFVYRNFSSKTVTTGSITFTVPETESFAALSSDNYVLTVVSNGGSGTYSNGQNIDIDAEVDAANLTASFGANNQSFTVSGLGSVATVTLTALVSKNTVSKKLKTASKMQALKVFKTVEDLVEQPTGLTFSALYGTRVEDEDLSFGIQDVYRVHAVYESYDENDASAPYVVLTESVFFAGGTLIIGKTSGARGRVISFSNADLKLYYVGLNDIPFVQGETINGFNSANEDITGIIDDSDSSIFAGSKVVTNQFELEAGQKTNYYDVSRLRRLSTAVPPTRRLLVIFDYFAHASSGDYFSSQSYSGINFKEIPNYKLDGSIKFIRDQIDFRPGIKNLRNGSGTISAPYFVNCTTFDFVSRVFDNTGSTIFDIMQVNSSFRADYAWYLPRIDKLFLSHDGALRIAKGVSGYYLIPPADVQNSMLLATIEYKPYVFDPERDILITPEVLRRYTMKDIGDIEQRLTHVEYYTSLSMLESQADNTKTYDENGFDRLKNGYVVDDFTDHTTGDVLNVDYKCSLDFREGQLRPQHYTTNVGLRYNPTASTNVVRTNGNVVMLPFDDVAIVTQPYASRTENVNPFNVFTFIGRVDLTPASDDWIDIERLPARVENVEGDFSAVSRDLNVDQNGFAPIQWQSWQTTWKGETIRSRNRFTSRSGTYGVGRQLGRAGHGQRRQGLFYLHERRTIRVVNNQARQGIRTRVIPKIEQKSLGDTILSRTVIPWIRSRNIGFNVDRMKPRTRFYAFFDGDNVTNYITPKVVELIKNSTTDNRTNETPFVVGETVTGQTSGCQLKVVAPDDGYKTNPYGKGTETLPTSYSSQTVYLNHDITEISENISPNHFGNVQVGELLVGQTSGAIAVVKDRRILTDNVGNVQGTLFIPSPKNDANPRWATGTRSLRFTTSETNLKTPGTVDSSAQTTYSATGTLQTVRENILAVRNAEIVTDTVSEERVVQTTRTETRQVGWYDPLAQSFIIEEEGGMFLTGVDIFFNTKDANIPISMQIRTMENGYPTKTILPFSDVTITPDDIEISESAAVPSRFSFKAPVYIKSSVEYCFVLLSDSNEYQVWISRMGDVDVTGTRTISEQPYAGVLFKSQNASTWTADQYEDLKFTIYRANFTSTTGTVTLENAPQGKGNNGIHRLIENPIQTIKPKQVLSLGPAVTQYTFSQGARLLQQTTAAQATIISTTTSSSVSDTLTINDASGSWLQGTANTYLVRSSESLATIVAGSSSGTLEVGDIVTGATSNSVGIVKTWDGSTNLVLHYITGAFTDTETLSEPGGWTATVTSSAESGDSYGAYLTAAPTFDSDQTEVLVYHQNHGMYNRSNNVSVEGVISEISPTTLTGALAAGATSISVLDANTFHTTVNGSVVSGSNPGYIRINSELIQYSAISSDGKTITVATSGRGSNSTTDTTHPSGSVVECYNLDGIPLIDINKTHTSVSCPWLDTYMLHITGVANSGIRGGGINVYASQNIQFETLTPSVSVMDLPETDITARVNTTSATSIGDGSTSVDQASFVNDGSYVPVTLNDLNLFNNPRMICSEVNELAKLSGQKSFTMKVDLSTEKDTLSPVVDLDRCSLITTSNRINQWPGGPDAYGQQSQIDTSQDVSTLPFGDRNDAVYITRLARLIRESRSLRIDLQMSRPPEADVRIYYRAFSSGTNDDFDSIGWTLIDTPLQYDASPNEEILWKDYYYEVSGLNFNAFQIKIVMRSSNQARVPLIADLRCIALAT

Physico‐chemical properties

protein length:	2442 AA
molecular weight:	268414,81880 Da
isoelectric point:	4,79002
aromaticity:	0,09623
hydropathy:	-0,27854

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR032096	STR	DC_0487	12	67	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
DC_0414	STR	DC_0414	80	1327	Novel HMM	DC_0414	Central	Low	Positional only	88 proteins / 88 hits
IPR032096	STR	DC_0487	185	388	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
IPR032096	STR	DC_0487	1040	1316	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
DC_0082	RBD	DC_0082	1316	2442	Novel HMM	DC_0082	C-terminal	Low	Positional only	104 proteins / 104 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009007943.1

1 2442

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	1504	1504	0,8778
Central domain	1505	1715	212	0,2369
C-terminal	1716	2442	726	0,1382

Note: Constraints were applied during segmentation.
Fixed 39 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-1504

Central
1505-1715

C-terminal
1716-2442

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-MbCM100 [NCBI]	1340812	Uroviricota > Caudoviricetes > Pantevenvirales > Acionnavirus > Acionnavirus monteraybay
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

YP_009007943.1 [NCBI]

Genbank nucleotide accession

NC_023584 [NCBI]

CDS location

range 77502 -> 84830
strand +

CDS

ATGGCACAAAATACCAATCTAAACGTTACACCTTATTACGACGACTTCGATAAGGATAGGAATTTTTATCGAGTTCTGTTCCGCCCTGGATTTCCAATTCAGGCGAGGGAACTTAGCACAATGCAGAGTATTCTGCAAAATCAAGTCGAATCGGTTGGTTCTCATCTATTTAAAGATGGTGCTATGGTCATCCCTGGACAAGTGGGATATGACTTAAATGTACAGGCAATTTTGCTGCAAGAATCTTTTCTTGGTAGTGATGTTGAGACATACAGAACTCAATTGACTGGTACTATCATTGAGGGTTTGACGACAGGTGTTAAGGCAAAAGTATTGTATAGCATCTCTGCCTCTGAATCTGAGAGGGGATATGTCACACTATATGTAAAGTATATTGATTCTGGGGATACAACTTCCGAATCTGCATTGAATACTTTCCAAATCAATGAACAGTTGATTGCAAGTAAGGAAATTACTTTTGGTACGACGCTGATTGAAATTGGCACTCCATTTGCTCAATTGTTGCCTGTTAATGCAACTGCAGTCGGATCGACAGCATACATTAGCGATGGTGTTTATTTCATTAGAGGTCATTTTGTTAATGTACCTTCTAGTTATTTGATTCTGAATCAATATGATACTAACCCTTCTTATAGAATTGGTTTAGAAATTTTAGAATCTATTATCACCCCCGAAGATGATGAATCTTTGAATGATAATGCTGCTGGAACATCAAATTATTCTGCACCTGGTGCCCATAGATTTAAAATTGGTACTCAGTTTGTAAAACGATTAATTACTGATGAGGCAGATAAAAACTTTATTGAACTTCTCAGGATCAATAACAGTAATGTAGAAAGTTTTGTTGAGAGAACAGCATATAGCGAACTTGAGAAGTCGATGGCTCGTAGGACTTATGAAGAGTCTGGCGATTATGTCATTGATACTTTTGATGTAACTCCTCGCGAGCATCTCAATGACGGATTTAATAATGGTGTGTATAGTGCGAACCAGACTTCTAGTAATGGAAACCTTGCTACAGATTCTAAGGTAGCATTAGAAGTTTCTCCTGGAACTGCATATGTTAGGGGTTATAGAACAGAGTTTATTACACCTCAATACATTGATGTTGATAAACCAAGGGATTTCGATACTCGTCAAAATGGAATTATCAACTTTAACCTTGGCAATTTCCTGAAAGTTTATGATGTTTATGGTTGGCCAGAAGTTTCTGGTGATGGAGTAACAGACGCATATCAGATTCTAGATCTTTATGATGATTATGCTGCGAATGCAACATCATCAGTAAAGGCAGGTGCTAATAGAATTGGTAGATGTAGAACTGTTCAGTTACAGAAGTCTTCTACTGCTCTTGCTGCAACGTCACCATTTGGAATTAGTCCTAATATAACTGGTGGTGTTTATGATCTATGGGTATTTGATGTTCAGATGTTCACCGTTCTGAACATTGCTAATGCTGTAACACCATATACAGCAGGAACTAGAATTGTAGGTAAAACATCTGGAGCAGCTGGTTACATTGCTGATACTGGAAATGGTAGTCACTACATTTATCTTGAGCAGGTCAATGGAGTATTCATTAATAGTGAAATTCTAGAAGTAAATGGAAGAACAGTTGGTACTCTTGAAGCAGCATGGTCTTATCAGTTAAGTGATACTAGATCGTGCTTTGGTAAGGATAGTGGCAGTAATATTATCTTTGGTTCTAATTTTATTCTGAATGACTCTCGACCTGTTGAGGCATCTACAGTTGATATTGATGATACAACAGATGATGAAATTACTGGTTTCAGAACTAGGTTTGAAAAAGATCTTCGTCCTGGAGACGTTGTTACTCCAACAATTTCTGATTTTGAGGGAGTAAATACTCATCGCATTTTAAGAGTTGATCCTACTGCTATTGCAACAACAGCAGCTAATAAGAAATCTACAGTTAGTGCTGGAAATGAAATCTTTGATTTTGCAGAGCAAACTGCAAAAATTGATGGCAGTCTGTTGAATGGTACAGTAACTGATGGAGAATATAGCGAACTAATTAGATTGCGTCCGTTTATCTTCCAAAAAGATTATCAGAATGGAGAACTTTCATTCGATCTTCCAGAAGATACTATGAAGTCTCTTGATGATGAATCATTCTTTGTATATAGAAACTTCTCTTCAAAAACAGTAACCACTGGTTCTATTACCTTTACTGTTCCTGAAACCGAATCTTTCGCAGCATTATCTTCTGATAATTATGTCTTAACTGTCGTTAGTAATGGTGGTTCTGGCACATATAGTAATGGTCAAAATATTGATATTGATGCTGAGGTAGATGCTGCAAATCTAACTGCTTCTTTTGGTGCTAATAATCAATCATTTACGGTTAGTGGATTAGGTTCAGTTGCAACAGTCACTCTGACCGCATTGGTTTCTAAGAACACTGTTTCTAAGAAACTGAAGACTGCTTCTAAGATGCAGGCATTAAAAGTATTCAAAACAGTAGAAGACTTAGTAGAACAACCTACAGGACTTACATTTAGTGCTCTATACGGAACCAGAGTTGAAGATGAAGATCTCTCGTTTGGTATTCAAGATGTATATAGAGTTCATGCAGTATATGAATCGTATGATGAGAATGATGCGTCGGCACCATATGTAGTTTTAACTGAATCAGTCTTCTTTGCAGGTGGAACATTAATTATTGGTAAGACTTCTGGTGCTAGAGGTCGTGTAATTTCATTCTCTAATGCAGATTTGAAGTTGTACTATGTTGGACTAAATGACATTCCATTCGTTCAGGGTGAAACTATTAATGGTTTCAATTCTGCTAATGAAGATATTACTGGTATTATTGATGACTCGGATTCTTCAATTTTTGCTGGTAGTAAAGTAGTTACAAATCAATTTGAACTTGAAGCGGGACAGAAAACTAATTACTATGATGTTTCACGATTAAGAAGATTAAGTACTGCTGTACCTCCGACAAGAAGACTGCTGGTAATCTTTGATTATTTCGCACATGCATCTTCTGGTGATTACTTCTCATCACAATCTTATAGTGGAATTAATTTCAAAGAGATTCCTAACTATAAATTAGATGGTTCTATTAAGTTTATTAGAGATCAAATCGATTTCCGTCCTGGTATTAAGAACTTAAGAAATGGATCAGGCACAATCAGTGCTCCATACTTTGTAAATTGTACTACGTTTGATTTTGTATCCAGAGTATTTGATAATACTGGATCAACAATCTTCGATATCATGCAAGTCAATTCTTCATTCCGTGCAGACTATGCTTGGTATCTTCCTAGAATTGACAAACTATTCTTATCGCATGATGGAGCACTTAGAATTGCTAAGGGTGTTTCTGGTTACTACTTGATTCCACCAGCAGACGTTCAAAATTCAATGCTTTTAGCGACTATTGAATACAAACCATACGTCTTTGATCCTGAAAGAGATATTCTGATTACTCCAGAAGTTCTCAGACGTTATACAATGAAGGACATTGGTGATATTGAGCAGAGATTGACTCATGTTGAATACTATACATCATTGTCTATGCTTGAGTCTCAAGCAGATAATACTAAGACCTATGATGAAAATGGTTTCGACCGTCTGAAAAATGGTTATGTTGTTGATGACTTTACTGATCACACCACTGGCGATGTATTAAACGTCGATTATAAGTGTTCTTTAGACTTTAGAGAAGGTCAGTTGCGTCCTCAGCACTATACTACTAATGTAGGACTTAGATATAATCCTACAGCATCTACTAATGTCGTTAGGACTAATGGTAATGTAGTAATGCTTCCCTTTGATGATGTTGCAATTGTTACACAACCATATGCATCTAGAACTGAGAACGTCAATCCATTCAACGTCTTTACCTTTATTGGTCGTGTTGATTTAACACCTGCATCTGATGACTGGATTGATATTGAGCGTCTTCCTGCTCGTGTTGAAAACGTTGAAGGTGATTTCTCTGCTGTTTCTAGAGATCTCAATGTTGATCAGAATGGTTTTGCTCCTATTCAATGGCAGTCTTGGCAGACAACTTGGAAGGGTGAGACAATTAGATCTAGAAATAGATTTACATCTAGATCTGGTACATATGGTGTTGGTCGTCAGTTAGGTCGTGCAGGTCACGGTCAGCGTCGTCAAGGTCTATTCTATCTTCACGAACGTCGCACTATTCGTGTTGTTAATAATCAAGCACGTCAGGGTATTCGTACTAGAGTTATTCCTAAGATTGAACAGAAGTCTTTGGGAGATACAATCCTGTCACGTACAGTAATTCCTTGGATTCGCTCTCGTAATATCGGTTTCAACGTTGATCGTATGAAACCCCGTACAAGATTCTATGCATTCTTTGACGGTGATAATGTCACTAACTACATCACACCAAAAGTTGTTGAACTTATCAAAAACTCCACCACTGATAATAGAACCAACGAAACTCCTTTTGTTGTAGGTGAAACTGTTACTGGACAAACCTCTGGTTGCCAACTTAAAGTTGTTGCACCTGATGATGGATATAAAACTAATCCATATGGTAAGGGTACAGAAACTCTTCCAACTTCATACTCATCCCAAACAGTATATCTAAATCATGATATCACTGAAATTTCTGAGAATATATCACCAAATCATTTTGGTAATGTTCAGGTTGGGGAACTTTTAGTTGGTCAAACGTCAGGTGCAATTGCGGTGGTAAAAGATCGTCGCATCCTCACTGATAACGTTGGTAATGTTCAGGGTACATTATTCATTCCTTCCCCTAAGAATGATGCCAACCCACGTTGGGCAACAGGTACTCGCTCTTTGCGTTTCACAACTTCGGAAACTAATCTGAAGACACCTGGTACTGTAGATTCTTCTGCACAAACAACGTATTCGGCAACAGGTACTCTTCAAACTGTTCGTGAAAATATTTTGGCAGTTAGAAATGCTGAAATTGTTACCGATACTGTTAGTGAAGAAAGAGTTGTCCAGACAACTAGAACAGAGACTCGTCAGGTTGGTTGGTATGACCCTCTGGCACAGTCCTTCATTATTGAAGAAGAAGGTGGTATGTTCTTAACTGGTGTTGATATTTTCTTCAATACTAAGGATGCGAATATTCCTATCTCCATGCAGATTCGTACCATGGAAAATGGATATCCAACTAAGACTATCCTTCCTTTCTCTGATGTAACAATTACACCAGATGATATTGAGATCTCAGAAAGTGCTGCTGTTCCTAGCAGATTCTCTTTCAAAGCACCTGTTTATATTAAGTCTTCAGTAGAATATTGTTTTGTTCTACTTTCCGACTCAAATGAATATCAGGTTTGGATTTCTAGAATGGGTGATGTTGATGTAACTGGAACTAGAACAATCTCCGAACAACCATATGCTGGTGTTCTGTTTAAGTCTCAGAACGCATCTACCTGGACTGCTGACCAGTATGAAGACTTGAAATTCACGATTTATCGTGCAAACTTCACTTCGACTACAGGTACAGTAACTTTAGAGAACGCACCTCAAGGTAAAGGTAACAATGGTATTCATAGATTGATTGAAAATCCAATTCAAACAATCAAACCAAAACAAGTTCTGTCTCTTGGACCTGCTGTAACTCAATACACATTTAGTCAAGGTGCTCGTCTTCTACAGCAAACTACTGCTGCTCAAGCTACTATCATATCAACGACAACTTCGAGTTCCGTTTCTGATACTTTGACTATCAATGACGCATCTGGGTCTTGGTTACAAGGAACTGCCAACACATATTTGGTAAGATCTTCCGAATCATTAGCAACAATTGTTGCTGGCAGTTCTTCTGGAACATTGGAAGTTGGTGATATTGTTACTGGTGCAACTTCAAACTCAGTCGGTATTGTTAAGACTTGGGATGGTTCTACTAACTTAGTTCTTCATTATATTACTGGCGCATTCACGGATACAGAAACTCTTTCTGAACCTGGTGGATGGACTGCTACTGTCACTTCTTCTGCTGAGAGTGGTGACTCTTACGGTGCATATTTGACTGCAGCACCTACATTTGATAGCGATCAAACTGAAGTCTTGGTTTATCATCAAAACCATGGAATGTACAACAGATCTAATAATGTAAGTGTTGAGGGTGTTATTTCTGAAATTTCACCAACTACTCTGACAGGTGCATTAGCAGCGGGTGCTACTAGTATATCTGTTCTTGATGCTAATACTTTCCATACTACAGTAAATGGATCAGTTGTCAGTGGTTCAAATCCTGGATACATTCGCATTAATAGTGAATTAATTCAGTATTCGGCAATCTCTAGTGATGGTAAGACAATCACTGTAGCAACTTCTGGTAGAGGTTCAAATTCAACTACAGATACTACACATCCATCAGGTTCTGTTGTTGAATGTTACAACTTGGATGGCATTCCACTGATTGATATTAATAAGACTCATACATCTGTGTCTTGCCCATGGTTAGATACTTACATGCTACACATCACTGGTGTTGCAAATAGTGGAATCCGAGGTGGTGGTATCAATGTTTATGCATCTCAGAATATTCAATTTGAAACTCTGACACCTAGTGTCTCGGTCATGGATCTTCCAGAAACCGATATCACTGCTAGGGTAAATACTACTAGTGCAACATCTATTGGAGATGGAAGCACCAGTGTAGATCAAGCATCATTTGTTAATGATGGTTCATATGTTCCAGTAACATTAAATGATCTGAACTTGTTCAATAATCCAAGAATGATTTGTTCTGAGGTTAATGAACTTGCTAAATTGAGTGGTCAAAAATCATTCACGATGAAGGTAGATCTTTCTACAGAAAAAGATACACTTTCACCTGTAGTTGATTTGGATAGATGTTCATTAATCACAACTTCAAATAGAATCAATCAGTGGCCTGGTGGTCCTGATGCATATGGTCAGCAATCACAGATTGACACATCGCAAGATGTATCTACTCTGCCTTTCGGTGATCGTAATGACGCGGTTTATATCACTCGTCTTGCAAGATTGATCAGAGAATCTAGATCTCTGAGAATTGATTTACAAATGTCTCGTCCTCCTGAGGCAGATGTTAGAATCTACTACAGAGCATTTAGTTCTGGTACAAATGATGATTTTGATTCTATTGGTTGGACTCTAATAGACACTCCACTGCAATATGATGCTTCTCCTAACGAAGAAATTCTTTGGAAGGATTACTATTATGAAGTCAGTGGTTTGAATTTCAATGCATTCCAAATTAAAATTGTAATGAGATCTTCAAATCAGGCAAGAGTACCATTAATTGCAGACCTTCGCTGTATCGCCCTTGCTACCTAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence