Phage RBP Database

Genbank accession

YP_007673829.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,67

Protein sequence

MALTRLKNVFTSKTGRCLYVNSDDFDASDSFDNRGNSPNRPFKSIQRALIEAARFSYKSGQFNDTFESFSIVLYPGDYVIDNRPARDYSQNTQDGRAFIPANLSELSASSDVDLVDENGNVNPNNVLYKFNSVDGGVIVPRGTSIVGMDLRKTKLRPLYVPDPTAATASSAIFRVTGGCYFWQFSFFDGITSGVYNNAANTASTLPPTFSHHKLTCFEYADGKNNITSVKQNDALPGATPSDFSVSDLQLYYQKVAKAWEDIPDSTSVISADELQARVEENRIVGPNTAGPKTIGSVVTDFVSTNVFTTTAEVTTSDAHGFSVGTPVLVEGITGTDAARFNGSFFISAIPTPTTFRYIIRNPANGAPSGNPTAGGSTVKVEVDNVDSSSPYIFNISLRSTWGMQGMHADGSKATGFKSMVVAQFTGVSLQKDDNAFIKWDGSAYIAGSHVDGDSIYKADYRNFHVKASNDSVIQAVSVFAVGFADHFVAESGGDQSITNSNSNFGSCALRAKGFKAAPFTQDKAGTITHVIPPQKLARTYALISGTTFTTTYDNVTVTATNNSHGIVAGDYVRFETSDNIESYLVTTVNPTSGDLTLNRGYRNLHGATSGSGKAAYKGTISEIPVGYVALDVQKIQDNASQGNAAWTINQSGISVGDSRTNGGNAYLATAVGGSGSTAGAGSGPTHTSGVAVDNEVTWAYIGAVNTRLYLYGYTSIATKPPYKLQGFSIGARKQDKIYVSLIDGSTQTTFAALISPDGTASPVDSAYTNITQQQFTPGDTNHPLQYDTYHQNWYLRVTPATSGDSGVNGVTGYGGIHYHLGNETFYANSLFTGSSYTQRIADNRSSRDRTYRMRYTVDNSASLSREPINGYVFQVRNSVTNYNNVYYIYDIQVAQELKQSVQDGIYYLTVLKGSISPTNGNLTQFSFAQNINNLYPTLDKDNPTEDPNAATSIASNITVGLVETTDGSGVEDLSLSITKEAVNTYIEEGNNSYTNSGGAGNPAQTNYITLEARDGDASEVDKTLRMVQVNNTGGTATELRRPSILRSGNHTFEYVGFGPGNYSTGLPSVQNRVLTEAETLLAQSQKEDGGIAFYSGLNSNGDLFIGNTRISAVTGEEASLDTPSLSIVGETANLRPVFDEIIVRDKITVENTQLTSVFKGSVEVNEDVIVTKGLESADITIKGEASNNQATKKFDVTVGTPSTSNAANTGDISFLGNIGNGTNLGYYWTGAAWAKFGLTDTGNLEITGGSASGSTWTDGAGDLQLKNGLGLDIQSGGALNVANGNSTLGGNLSVSGTLTVTSTSEFNNTVDVDANFAVRSGTTDKFTVASSSGNVSTDGTLTVAGQTDLNGHVNLGDGTGDNITISGRVDSDIDPDTSATYDLGSSSLKWRNAQFSGTVTAPTLAGNVDIGSGTSTFNNVTVNGTLSAGNLTGNADTATDLAINATQQLVIQTANNATSTLSSGTNNYILTSNGSGAAPSWQQNFNGNADTATQVYVTETTTNSNYPIVFTDGSTTSNSANRGLQKDNSTLYFNPSTNILTCTSIQATTFGTSSQNAYGARTVSNGNPSGGSNGDIHYKI

Physico‐chemical properties

protein length:	1580 AA
molecular weight:	167095,37970 Da
isoelectric point:	4,81718
aromaticity:	0,08861
hydropathy:	-0,32810

No domain architecture available.

No domain annotations available.

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0066
STR

DC_0066

YP_007673829.1

11580 aa

InterPro domain annotations

No domain annotations available.

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

YP_007673829.1

1 1580 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	80	80	0,8897
Central domain	81	313	234	0,9400
C-terminal	314	1580	1266	0,5389

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Prochlorococcus phage MED4-213 [NCBI] · taxon 889956

Uroviricota Caudoviricetes Eurybiavirus

Host

Prochlorococcus [NCBI] · taxon 1218

Bacteria Cyanobacteria Prochlorales Prochlorococcaceae

Genbank protein accession

YP_007673829.1 [NCBI]

Genbank nucleotide accession

NC_020845.1 [NCBI]

CDS location

range 86924 -> 91666
strand -

CDS

ATGGCACTTACTAGACTAAAAAACGTCTTTACATCAAAAACAGGACGTTGCTTATACGTCAACTCTGATGACTTTGATGCATCAGATAGTTTTGACAATAGAGGTAACTCTCCTAACCGTCCTTTTAAGAGTATACAAAGGGCGTTAATTGAAGCAGCGAGATTTTCATATAAAAGTGGACAGTTTAACGATACGTTTGAGTCATTTAGTATTGTATTATATCCTGGTGACTATGTTATTGACAACAGACCAGCTAGAGATTATAGTCAAAATACTCAAGATGGACGAGCATTTATTCCCGCCAATCTTTCCGAATTAAGTGCATCTAGTGATGTTGATCTAGTAGATGAAAATGGTAATGTAAATCCAAACAACGTATTATATAAATTTAACTCAGTAGATGGTGGTGTAATAGTTCCTAGAGGTACATCTATCGTAGGTATGGACTTACGTAAGACTAAATTACGTCCTCTATATGTTCCTGATCCTACAGCTGCTACTGCTAGTTCTGCAATATTCAGAGTTACTGGTGGATGTTATTTCTGGCAATTCTCATTCTTTGATGGTATAACATCTGGTGTATACAACAATGCTGCGAACACAGCTTCAACTTTACCCCCAACATTTTCTCATCATAAACTTACATGTTTTGAGTATGCCGATGGTAAGAATAATATAACTTCTGTAAAACAAAACGATGCTCTTCCTGGAGCAACCCCAAGTGATTTTTCAGTTAGTGACTTACAACTATACTATCAAAAGGTAGCAAAAGCATGGGAAGACATACCTGATAGCACAAGTGTTATATCTGCTGACGAATTACAGGCAAGAGTAGAAGAGAATAGAATCGTAGGTCCTAACACAGCAGGTCCTAAAACAATAGGTAGTGTTGTTACTGACTTTGTTAGCACAAACGTATTCACAACCACAGCAGAGGTCACAACATCTGATGCTCACGGGTTCTCCGTTGGAACTCCCGTATTAGTTGAGGGTATTACAGGAACTGATGCTGCAAGATTTAATGGATCGTTCTTTATTAGTGCAATACCAACACCAACAACATTTAGATATATTATTAGAAACCCTGCTAATGGTGCACCATCTGGTAACCCAACTGCGGGTGGATCAACGGTGAAAGTAGAAGTTGATAACGTTGATAGTTCATCACCATACATCTTTAACATATCTCTACGTTCTACATGGGGTATGCAGGGTATGCATGCTGATGGTAGTAAAGCAACTGGATTCAAATCTATGGTTGTTGCACAGTTTACTGGTGTATCACTACAGAAAGATGACAATGCATTTATTAAGTGGGACGGATCTGCATATATTGCAGGATCACACGTTGATGGAGACAGTATATACAAAGCAGACTATAGAAACTTCCATGTAAAGGCATCTAATGACTCAGTTATACAGGCTGTCTCAGTGTTTGCTGTTGGATTTGCTGATCACTTTGTTGCTGAGTCTGGTGGTGACCAATCTATCACCAACTCTAATAGTAACTTTGGTTCATGTGCATTAAGAGCAAAAGGATTCAAAGCAGCACCATTTACACAGGATAAAGCTGGAACTATAACACACGTCATACCTCCACAAAAACTTGCAAGAACATATGCACTTATAAGTGGAACTACATTTACTACTACGTATGATAATGTTACTGTAACAGCAACAAACAATTCTCATGGTATTGTAGCGGGTGACTATGTAAGATTTGAAACCTCTGATAACATAGAATCATATCTAGTTACCACAGTTAATCCTACAAGTGGAGACTTAACCTTAAACAGAGGATATAGAAACTTACATGGTGCAACATCTGGTTCTGGTAAAGCAGCATATAAGGGAACTATCAGTGAAATACCTGTTGGTTATGTTGCACTTGACGTTCAGAAAATACAAGACAACGCATCACAAGGTAATGCTGCATGGACAATTAACCAATCTGGTATATCAGTCGGTGACTCTAGAACAAATGGTGGTAATGCATATCTAGCAACTGCGGTAGGTGGATCTGGATCCACAGCAGGAGCAGGATCAGGACCTACTCATACATCTGGTGTTGCTGTTGATAATGAGGTCACATGGGCATATATTGGTGCAGTCAACACAAGATTATATCTTTATGGTTACACATCTATTGCAACCAAACCTCCATATAAATTACAAGGTTTCAGTATTGGTGCACGTAAACAAGACAAAATATATGTGTCATTGATTGATGGGTCTACACAAACTACATTTGCAGCTCTAATTTCTCCTGATGGAACTGCGTCACCTGTTGACTCAGCATATACAAATATAACACAACAACAATTTACACCTGGCGACACTAACCACCCACTACAGTATGATACTTATCATCAAAACTGGTATTTAAGAGTAACTCCTGCCACATCTGGAGATAGTGGAGTTAATGGAGTCACAGGATATGGGGGTATTCATTATCATCTAGGTAATGAGACATTCTATGCTAACTCATTATTCACTGGATCATCATATACTCAACGTATTGCTGACAATAGATCATCTAGAGATAGAACATATAGAATGCGTTACACTGTAGATAACTCTGCAAGTTTGTCAAGAGAACCTATTAACGGTTACGTATTCCAAGTAAGAAACAGTGTTACAAATTACAATAATGTTTACTACATTTATGATATACAAGTAGCACAAGAACTTAAACAGTCAGTGCAAGATGGTATTTACTACTTGACAGTATTGAAAGGTAGTATATCACCGACAAATGGTAACTTAACTCAGTTCTCATTTGCACAGAATATTAATAACTTATATCCTACCTTAGACAAAGATAACCCAACTGAAGATCCTAACGCTGCAACATCTATTGCAAGTAATATCACTGTTGGTTTAGTTGAGACTACTGACGGATCAGGTGTAGAGGATCTATCTTTATCAATTACAAAAGAAGCAGTAAACACATATATTGAGGAAGGAAACAACTCATATACAAACTCTGGTGGAGCAGGAAACCCTGCACAGACAAATTATATTACTCTTGAAGCAAGAGATGGTGATGCATCTGAAGTTGATAAAACCTTACGTATGGTACAGGTCAACAACACAGGTGGTACAGCAACTGAACTTAGACGACCTAGTATCCTAAGATCTGGTAACCACACATTTGAATACGTTGGTTTCGGACCAGGTAACTATTCAACTGGTCTACCTTCAGTTCAGAACAGAGTTCTTACTGAAGCTGAGACACTACTAGCACAGTCACAGAAAGAAGACGGTGGTATCGCATTCTACTCTGGTCTTAACAGTAATGGTGACTTATTCATTGGTAATACTAGAATCTCTGCTGTTACTGGTGAGGAAGCATCACTTGATACACCATCACTATCAATTGTTGGTGAGACTGCAAACTTACGTCCTGTATTTGATGAGATCATCGTTAGAGATAAGATTACAGTTGAAAATACACAGTTAACCAGTGTATTCAAGGGTAGTGTTGAAGTCAATGAGGATGTAATAGTAACTAAAGGTTTAGAATCTGCTGATATTACAATCAAAGGAGAAGCATCTAATAACCAAGCAACTAAAAAGTTTGACGTTACAGTAGGAACACCAAGCACTTCTAACGCTGCAAACACAGGAGATATATCATTCTTAGGAAATATTGGTAATGGAACTAATCTTGGTTACTACTGGACAGGTGCAGCATGGGCAAAGTTTGGACTAACTGACACAGGTAACTTAGAAATTACAGGTGGTAGTGCATCTGGTTCCACATGGACTGATGGTGCAGGAGACTTACAACTTAAGAATGGATTAGGACTAGACATACAATCTGGTGGTGCACTTAATGTTGCCAATGGTAATTCTACACTTGGTGGTAATTTAAGCGTCAGTGGAACTCTAACTGTTACAAGCACATCTGAATTTAATAATACAGTTGATGTTGATGCAAACTTTGCAGTCAGATCTGGAACAACTGATAAGTTTACAGTCGCATCAAGTTCTGGTAATGTATCTACAGATGGAACATTAACAGTTGCAGGACAGACTGATTTAAACGGACATGTTAATCTTGGTGATGGAACAGGTGATAACATAACAATCAGCGGTAGAGTAGATTCAGATATAGATCCAGATACATCTGCAACATATGATTTAGGTTCTAGTTCATTAAAGTGGAGAAATGCTCAGTTCTCAGGTACAGTCACTGCACCTACACTAGCTGGTAACGTAGATATAGGATCTGGAACATCTACATTTAATAATGTAACAGTAAATGGAACATTATCTGCAGGAAACTTAACTGGTAACGCTGATACAGCAACTGATCTTGCTATCAATGCAACACAGCAACTTGTTATTCAAACAGCTAATAATGCAACATCTACATTATCATCTGGAACTAATAACTATATCCTAACATCTAACGGATCAGGAGCAGCACCATCATGGCAGCAAAACTTTAATGGTAATGCTGATACAGCGACACAAGTATATGTTACTGAAACAACTACTAACAGTAACTATCCTATTGTCTTCACTGATGGCAGCACTACATCAAACTCTGCTAATAGGGGACTACAGAAAGATAATTCTACCTTGTATTTCAATCCTAGCACTAATATACTTACTTGCACCAGTATACAAGCAACAACATTTGGAACATCATCACAAAACGCATATGGTGCAAGAACCGTATCCAATGGTAATCCTAGTGGTGGAAGTAATGGAGATATCCACTATAAAATCTAA

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage MED4-213	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Literature