Phage RBP Database

Genbank accession

YP_007675157.1 [GenBank]

Protein name

structural protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MANRIQLRRDGAQQWANVNPILAQGELGIELDTSRLKIGDGVTPWNSLKYERPLETESNTANTLVKRDADGNFEAGAITASIIGNAATATRLANARSFTLTGDMSGSASFDGSANINITAELNYQPGLPHYDPNNLSATAQYTRLTIDSRGRVTTGDNPTTLAAYGIADAQPADPELQALADMTGFGIIARTGAGTLANRQIAVSAGRLLVSNGTGQNGNPLLDLADTPVVVGTYNGVGNLDTPLVSVTSGDETVNTTNFTVDRYGRLTYAQTSAIATATQGSEVAAFNNGSNYARNDKVKNTSDKLYQAILPINSGGGEPTHTDTSDTGSWRYLGSALAPQKGLASFNQEDFDVTQWDAGSNYEGGFVTIADAGVDNHQLQNSRIGFADGNTVENFDLDQELTAVTGYRGFNYLNYTKVNDTTGNLLVGANNTGNGSSGNQQAVQNVVVTLGTDTVGGQSTGVFYLDGVESPTNFPLKKGIKYIFNQDDSTNETYGGANHPLMVSSGADGDHNGHGHYMMGITYKLDGSVVDMAGYVSGFNAATTRRMEWLVQAEAPASLYYWCHHHTGQGDSFAITEGGAGEFDINVRSYFSHPDITLDGAISQTLDKTGDGDLYFQLTQNTASNRNLNILSTNAGAGNATILIQSENDITINASNVSNRVNVEGFQFQDDTLSSTAATMILDPGDDDAATGKVQIRGDLQVDGTTTTVNSTVVTIDDPIFTLGGDTAPGSDDNKDRGIEFRYYDTQARVGFFGWDEDYADSNIWSGTGGFRFLYNATNTSEVFSGTDAPLIVGNLRLTTNTGSTSTTTGTLVVTGGLGLSENAHIGGTVTIAGQSEVNNNVIFKADNKSFSIQNAAGVNKFSVDYDNGNTVIEGTLDVQLETEITDNLIIKADNKKFDIQTAAGVSVFDVDTDNGNTHTDGTLDVDGGTTLNNTLDVDGATTLNDILDVDGNSTFHNNITLDTTGKNFKITNGSQDKFTVLSTNGNTDIRGTLDVGSAVVFENNFNANGNNVTLGNANTDVLTVNSVATFTDNVTVNGTVDFDTTLNVDGQADFNSTVVIDGQTTIYDSVIIQSDNEVFNINNASAQTQFSVDSDNGNTVIGRNGLGTNSVGLLTVHGDTLLNRDLTVDGNTTIGDANTDTLTVNSESTFNADVTIAGTNNLQVTGNAIVDGNLTVHGTTTTVNSTVVTLDDPIITLGGDTAPGSDDGKDRGVEFRYYSGAAKIGWFGWDNDAGRFALYDDATNSSEVFSGTRSGIDAGSLKLFDTTNATNSSSGALIVGGGAGIGLDLHVGDDLTVVDDASIGGNLDVTGTFDVTDDLAVNNTKFTVDAGTGNTVIQGTVQVDGNATIGNGSGDQHTVTGTVTFNQAITSTDITADNIQIGVSGATEIDTTSGNLILDSQGGTVNVTDDLDVDNNLNVDGNAKVDGTLTVDGNTTIGNASGDSHSVTGTVQFNQAITSTDITADDIKIGVDAANEISTTSGNLVLDSDGGKVHITDNAEIDGTLQVDGNATIGDNSSDQHEFTGTVTFNQAITSTDITADNIRIGVAASSEIDTTSGALTLDSNTGETIIDDNLTINGTLDVDALTVITDALTVKADNKLFSVQTGSAATIFSVDTDNGNTDIQGTLNVEGATTIDDTFNVTQATDLDGTLNVDGVATFQNDVVLNADNKNFKIQLDNGTDKFTVASASGNTDIQGTLDVNGAANVTNTLGVTGLTSLTNNTNPTSLSANAALMVTAGGATIDEDLYVGSDLFLGPNAGTTITLNGGTGNATIGGTLGVTGQTTLTTVSATSLTTSAGVTMDGSLIINTSKFTVAGATGNTAVDGTLDVNGATTITDNLNVTGAVDFDTTLNVDGNSTFSGTITQNSTSLFKDNVVLRGSTKTLKLQNGSGTDKITLNSTSGAATFTGLTTTNTLDVTSNTTIGGTLGVTGQITGDVTGDLTGNADSATLVSVTETASSNLTYYPAFVSSTSGNTEIRTDSTNLSYNPGTNTLTVNNFTSTTDFTVQGNLTITGNIQYNQSQVGSIANHTTDALAEGAGNLYYTEERVDDRVAALISGGTGISATYNDAGNLLTLSADFGEFDTDDVNEGTSNKYHTQARVRNSFTYGTGIEHDGSGGIQVTQADIDTDNVTEGSTNLFTTAARTRGHISVSGDLGYNASTGVLSYTTPTTIASLSNHDTDDVAEGSTNLYYTDERVDDRINALIIAGTGVTKVYDDAANTYTLSVTQADINSDNVTEGSTNLFHTTARARASISATGSLSYNSGTGVISYTTPTTIASLSNHDTDDLAEGSNLYYTDARADARIAAADTGDLSEGSNLYYTDARARASISENSTQLAYNSTTGVLTYTQGDTDTVAEGSSNLYYTDARADARIAAADTDDLSEGSTNLYYTDARADARVSAGITGKLDASAVSTFGGTLIDDADAAAARTTLGLGTAAVAATGDFATAAQGTKADDAAPLASPGLTGTPTAPTAAQATNTTQVATTAFVQSNLTAALLRTALGIVSAANDAGSGLASGEMYFNTTSNTYVLVA

Physico‐chemical properties

protein length:	2538 AA
molecular weight:	262606,84260 Da
isoelectric point:	4,05003
aromaticity:	0,06068
hydropathy:	-0,24984

Domains [InterPro]

InterPro ID	Start	End	Source	Name
SSF69349	4	141	SUPERFAMILY	None
IPR041352	5	43	InterPro	Major tropism determinant, N-terminal domain

	Name	Taxonomy ID	Lineage
Phage	Cyanophage P-RSM6 [NCBI]	929832	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Prochlorococcus marinus str. NATL2A [NCBI]	59920	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Genbank protein accession

YP_007675157.1 [NCBI]

Genbank nucleotide accession

NC_020855 [NCBI]

CDS location

range 81832 -> 89448
strand -

CDS

ATGGCAAATAGAATACAATTAAGACGTGACGGAGCACAGCAGTGGGCTAACGTCAACCCAATACTTGCTCAGGGTGAGTTAGGTATCGAACTTGATACTTCTCGACTGAAGATAGGAGATGGTGTAACTCCATGGAACTCACTTAAGTACGAACGTCCTTTAGAAACAGAAAGTAATACTGCTAATACCCTTGTTAAGAGAGATGCCGACGGTAACTTTGAGGCAGGTGCCATTACTGCGTCAATTATCGGTAACGCTGCTACTGCTACGAGACTTGCTAACGCTAGATCATTCACCCTAACAGGTGACATGTCAGGATCTGCATCCTTTGACGGATCTGCAAACATCAACATCACTGCTGAACTAAACTATCAACCAGGTCTCCCACACTACGACCCTAATAATCTATCTGCCACTGCACAATACACTCGTCTGACTATTGACTCTCGTGGTCGTGTTACTACTGGTGACAATCCCACGACTCTTGCTGCTTATGGTATTGCTGATGCTCAACCTGCTGACCCAGAATTGCAAGCATTAGCAGACATGACTGGTTTCGGTATCATTGCAAGAACTGGAGCTGGTACATTAGCAAATAGACAGATTGCTGTATCTGCAGGTAGACTTTTAGTATCCAACGGTACTGGACAAAATGGAAACCCTCTACTCGACCTTGCTGATACTCCTGTTGTTGTTGGTACTTATAATGGTGTAGGTAACTTAGATACTCCATTAGTCTCTGTGACCAGTGGTGATGAGACTGTTAACACAACCAACTTCACGGTTGATAGATATGGTCGTCTTACCTATGCACAGACTTCTGCTATTGCCACTGCAACACAAGGTAGTGAGGTAGCAGCATTTAATAATGGATCGAATTATGCACGAAACGACAAGGTTAAGAATACGTCTGATAAGTTGTATCAGGCTATCCTTCCTATTAACTCTGGGGGCGGTGAGCCTACACACACGGACACCAGTGATACAGGATCTTGGAGATATCTCGGATCTGCTCTAGCACCTCAGAAAGGTCTAGCATCATTTAACCAAGAAGATTTTGATGTAACACAATGGGATGCAGGTAGTAACTATGAAGGTGGTTTTGTAACCATTGCAGACGCAGGTGTTGACAATCATCAATTACAGAACTCTCGTATAGGTTTTGCTGATGGTAATACAGTAGAGAACTTTGATCTTGATCAGGAATTAACTGCTGTTACTGGTTACAGAGGATTTAATTACCTTAACTATACAAAGGTAAACGATACAACTGGAAATTTATTAGTAGGTGCTAACAATACTGGTAATGGTTCTAGTGGTAATCAACAAGCAGTACAGAACGTTGTTGTCACACTCGGTACAGATACAGTAGGTGGACAATCAACAGGTGTATTTTACTTAGATGGTGTAGAAAGTCCTACAAACTTCCCACTTAAGAAAGGTATTAAGTATATCTTTAATCAAGATGATTCTACCAATGAAACATATGGTGGTGCAAATCATCCTTTAATGGTTAGTTCAGGTGCTGACGGTGATCACAATGGTCATGGTCATTACATGATGGGTATCACCTATAAGTTAGATGGTTCTGTTGTTGATATGGCAGGGTATGTTAGCGGATTTAATGCTGCTACTACTCGTAGAATGGAATGGTTGGTGCAAGCAGAAGCACCTGCTAGTCTTTACTATTGGTGTCATCATCACACAGGTCAAGGTGATAGTTTTGCTATTACTGAAGGCGGTGCAGGTGAATTTGACATTAACGTAAGATCATACTTCAGTCATCCTGATATCACTTTAGATGGTGCTATATCTCAGACACTTGATAAGACTGGTGATGGAGATCTATATTTCCAACTTACTCAAAACACTGCATCAAATAGAAACTTAAACATTCTTTCTACTAACGCAGGAGCTGGTAATGCTACCATTCTCATACAATCTGAGAATGATATTACAATCAATGCTAGTAACGTTTCTAATAGAGTAAACGTAGAAGGTTTCCAATTCCAAGATGATACTCTAAGTAGCACTGCTGCTACTATGATATTGGATCCAGGTGATGACGATGCTGCAACTGGTAAGGTTCAGATTCGTGGAGATCTACAGGTAGATGGTACAACGACCACGGTAAATTCTACTGTTGTTACCATTGATGATCCTATATTCACACTGGGTGGTGATACTGCTCCAGGTTCAGACGATAATAAAGACCGTGGTATAGAATTTAGATATTATGACACACAAGCAAGAGTCGGGTTCTTTGGGTGGGACGAAGATTATGCAGACTCTAACATATGGTCTGGCACTGGCGGGTTTAGGTTCCTCTACAACGCCACTAACACCTCTGAAGTTTTCTCTGGTACTGACGCTCCTCTCATTGTTGGTAACCTCAGGCTCACAACCAACACAGGATCAACCTCAACCACGACGGGTACGTTGGTGGTCACGGGGGGATTAGGTCTTTCTGAGAACGCACATATTGGTGGAACTGTTACTATTGCAGGACAGTCAGAAGTTAATAATAATGTAATCTTTAAGGCAGACAATAAGTCATTTAGTATACAGAACGCAGCTGGTGTAAATAAATTCTCTGTTGACTATGACAATGGTAATACAGTAATAGAAGGTACATTAGATGTTCAGTTAGAAACTGAAATTACTGATAACCTTATTATAAAAGCAGATAATAAAAAGTTTGATATCCAAACTGCTGCAGGTGTCAGTGTATTTGATGTAGATACTGACAACGGAAATACCCACACAGATGGTACTCTTGATGTAGATGGTGGGACAACCTTAAACAATACATTAGATGTTGATGGTGCTACAACCCTCAATGACATTCTTGATGTTGATGGCAACTCAACATTCCATAATAATATTACTCTTGATACAACTGGTAAGAACTTTAAGATCACTAATGGATCTCAGGATAAGTTTACAGTACTATCAACCAATGGTAATACAGATATTAGAGGAACCTTAGATGTAGGTTCTGCAGTCGTATTCGAAAATAACTTTAATGCAAACGGTAATAACGTTACTCTTGGTAATGCAAATACTGATGTGCTTACTGTTAATTCAGTTGCAACATTCACTGATAATGTCACAGTCAATGGTACAGTTGATTTCGACACTACACTTAATGTAGATGGTCAAGCAGACTTTAATAGCACTGTAGTTATAGATGGGCAAACTACAATCTATGATTCAGTAATTATTCAGTCTGATAACGAAGTATTTAATATTAATAACGCTAGTGCCCAGACACAATTCTCTGTCGATTCTGACAATGGTAACACTGTCATTGGTAGAAATGGTCTAGGTACTAACTCAGTAGGTCTCTTAACAGTTCACGGAGACACTCTACTAAACCGTGATTTGACTGTTGATGGAAACACCACTATAGGTGATGCTAACACAGATACACTAACTGTCAACTCTGAGTCAACATTTAATGCAGATGTAACAATCGCAGGTACTAATAACCTCCAAGTTACTGGTAACGCAATCGTTGATGGAAACCTCACAGTTCATGGAACTACAACCACAGTCAATTCTACTGTAGTTACATTAGATGATCCTATCATTACATTGGGTGGTGACACTGCTCCTGGTTCTGATGATGGTAAGGATCGTGGTGTGGAGTTCAGATATTATAGTGGTGCTGCTAAGATAGGTTGGTTTGGTTGGGATAATGATGCAGGTAGATTTGCATTATATGATGATGCAACAAACTCTTCTGAAGTATTTTCAGGAACAAGATCTGGTATTGATGCAGGTAGCCTAAAACTATTTGATACAACTAATGCTACAAACTCATCTTCAGGTGCTTTAATCGTTGGTGGTGGTGCAGGTATAGGTTTAGACTTACATGTTGGTGATGATTTAACAGTTGTTGATGACGCTTCTATTGGTGGTAACTTAGATGTCACAGGAACATTTGATGTAACTGATGACTTAGCTGTTAACAATACTAAATTTACTGTTGATGCAGGAACTGGTAATACAGTCATTCAGGGAACTGTTCAGGTAGATGGTAATGCTACTATTGGTAATGGATCTGGGGATCAGCATACTGTTACTGGTACAGTAACCTTTAACCAAGCAATAACTTCTACAGATATCACTGCTGATAACATTCAGATCGGTGTATCTGGTGCAACAGAAATTGATACAACCTCTGGAAATCTAATTTTAGATTCACAAGGTGGTACTGTTAATGTCACAGACGATTTAGATGTTGACAATAACCTTAATGTTGATGGAAATGCTAAGGTTGATGGCACCCTTACAGTTGATGGGAATACTACTATCGGTAACGCATCTGGAGATTCACACTCTGTTACTGGTACTGTTCAGTTTAACCAAGCAATAACTTCTACAGACATCACTGCTGATGACATTAAGATTGGTGTTGATGCTGCTAATGAAATTAGCACTACTTCTGGAAATCTAGTATTAGATTCTGATGGTGGTAAAGTTCATATCACAGATAATGCTGAGATAGATGGAACTCTACAAGTAGATGGCAATGCTACTATCGGTGATAACTCTAGTGATCAACATGAATTTACTGGTACTGTAACATTTAATCAGGCAATCACTTCTACAGATATTACTGCTGACAACATCAGAATTGGTGTTGCTGCTTCATCTGAAATTGATACAACCTCTGGTGCTCTTACCTTAGATTCTAATACTGGTGAGACTATTATTGATGATAATTTAACTATCAACGGAACATTAGATGTTGATGCGTTAACAGTTATTACTGATGCTCTAACAGTTAAGGCAGACAATAAATTATTCTCTGTACAGACTGGATCTGCTGCTACTATCTTCAGTGTTGATACTGACAACGGTAACACTGATATACAGGGTACTCTTAATGTAGAGGGTGCGACAACTATTGACGATACATTTAATGTCACTCAGGCAACTGATTTGGATGGCACTCTAAATGTTGATGGTGTTGCTACTTTCCAAAACGATGTTGTATTAAATGCTGACAATAAGAACTTTAAGATTCAGTTAGATAATGGCACAGATAAATTCACTGTTGCTTCAGCATCAGGTAACACAGATATACAAGGAACTCTTGATGTTAACGGGGCAGCAAATGTTACCAACACATTAGGAGTAACAGGACTTACATCTCTTACAAATAACACTAACCCAACATCTCTATCTGCTAACGCTGCTTTGATGGTTACTGCGGGTGGTGCTACTATCGATGAAGATCTTTATGTTGGTTCTGATCTCTTCCTTGGTCCTAACGCAGGTACTACGATCACCTTAAATGGTGGTACTGGTAACGCAACTATCGGAGGCACACTGGGTGTCACTGGACAGACAACATTAACAACAGTCTCTGCTACAAGTTTGACAACTTCTGCAGGTGTCACAATGGATGGTTCTCTAATCATCAACACCTCGAAGTTTACAGTTGCAGGTGCTACTGGTAACACTGCTGTTGACGGTACATTGGATGTCAATGGTGCTACTACTATCACTGATAACCTCAATGTAACAGGTGCAGTTGACTTTGATACTACTCTAAATGTAGATGGCAACTCAACCTTCAGTGGAACTATCACACAGAACAGTACATCACTCTTTAAAGATAATGTTGTACTAAGAGGATCTACTAAGACATTAAAACTTCAGAATGGATCTGGCACAGATAAGATTACTCTTAACTCTACTTCTGGTGCTGCAACATTCACAGGATTAACAACAACAAATACTCTTGACGTAACAAGTAACACTACTATCGGTGGCACACTCGGTGTAACGGGACAGATTACGGGTGACGTAACGGGTGACCTAACTGGTAATGCTGACAGTGCAACTCTTGTTAGTGTAACTGAAACTGCTTCTTCTAATCTTACTTACTACCCTGCGTTCGTTTCATCTACCAGTGGTAATACTGAAATTAGAACTGACTCAACTAACCTTTCATATAATCCAGGTACAAACACATTAACAGTTAATAACTTTACCTCAACAACTGACTTTACAGTTCAGGGTAACTTAACTATTACTGGTAACATTCAGTACAACCAGTCACAGGTTGGTAGTATTGCGAACCATACAACTGATGCTCTTGCTGAGGGTGCAGGTAATCTTTACTACACTGAAGAAAGAGTTGATGATCGTGTTGCTGCATTGATCTCTGGTGGTACTGGTATTTCTGCTACCTACAATGATGCAGGTAACTTACTAACTCTATCTGCTGACTTCGGTGAGTTTGATACTGACGATGTTAATGAAGGAACTAGCAACAAGTATCATACTCAAGCAAGAGTTCGTAACTCCTTTACATACGGTACTGGTATTGAGCATGATGGTAGTGGTGGAATACAGGTAACTCAGGCAGACATCGATACTGATAACGTTACTGAAGGATCTACAAACCTATTCACAACTGCTGCTAGGACTCGTGGACATATCAGTGTTAGTGGAGATTTAGGATATAACGCTTCTACTGGTGTTCTTTCTTACACCACTCCTACAACTATCGCATCTCTATCTAATCATGATACAGATGATGTAGCAGAAGGATCAACCAATCTATACTACACAGACGAGAGAGTTGATGACAGAATCAATGCTCTTATCATTGCAGGTACAGGTGTTACTAAGGTCTATGATGACGCTGCTAACACATATACATTATCTGTTACTCAGGCAGACATTAACTCTGACAATGTAACTGAAGGATCTACAAATCTATTCCATACAACTGCTAGAGCAAGAGCATCTATCAGTGCAACTGGATCTCTATCATACAACAGTGGTACTGGTGTTATCTCATACACTACACCAACTACTATTGCATCACTATCTAACCATGATACTGATGATCTTGCTGAAGGATCTAACCTTTACTATACAGATGCTAGAGCAGACGCAAGAATCGCTGCTGCTGACACTGGAGACCTTAGTGAGGGTAGTAACCTTTACTATACAGATGCTAGAGCAAGAGCTTCTATCTCTGAGAACAGCACACAACTAGCATATAACTCCACTACTGGTGTATTGACATATACTCAGGGTGATACTGATACAGTTGCTGAAGGATCAAGCAATCTTTACTATACAGATGCTAGGGCAGACGCAAGAATTGCTGCTGCTGATACCGATGATCTATCTGAAGGATCAACCAACCTTTACTACACTGATGCTCGTGCTGATGCTCGTGTATCAGCAGGTATAACTGGAAAACTTGATGCTTCTGCTGTTAGCACCTTCGGTGGAACTCTAATTGATGACGCAGACGCTGCTGCTGCCAGAACTACTCTTGGACTTGGAACTGCTGCTGTTGCTGCTACAGGTGACTTCGCTACTGCTGCACAAGGTACTAAAGCAGATGATGCAGCACCATTAGCATCTCCTGGATTAACTGGAACTCCAACAGCTCCAACTGCAGCTCAAGCAACTAACACAACTCAAGTTGCTACCACAGCATTTGTACAGTCTAACTTGACTGCTGCATTGCTTCGCACTGCTCTTGGTATTGTATCAGCAGCTAACGATGCTGGCTCTGGTCTTGCATCTGGAGAGATGTACTTTAATACCACTTCTAACACATATGTACTTGTAGCATAA

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage P-RSM6	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature