Genbank accession
AGG54570.1 [GenBank]
Protein name
hypothetical protein
RBP type
TF
Evidence RBPdetect
Probability 0,82
TF
Evidence RBPdetect2
Probability 0,57
TF
Evidence Phold
Probability 1,00
Protein sequence
MATTEHFYTGNNSTTSFAFTFPYLSNSDVKVELDNVVKTENSSGQTNNDYTINNTNIVFNSAPGTGVAIHIYRTTNVDSAQAQYAAGSSIRAADLNNNQTQLLYSAQEASGQLIRQGDLKDSIINSAKIVDGSVATGDLADGLITTVKIAADAVTGAKIADDQINSEHYIDASIDTQHIADSQITTAKIANSNVTTAKIADSNVTTAKIAADAITGAKIADDQINSEHYVDGSIDTAHIANSQITSAKIADGTIIAGDLASNAVTTAKITDLNVTTAKIAADAITGAKIADDQINSEHYVDGSIDTAHIGNNQVTTAKIAADAVTNAKIADDQIDSEHYVDGSIDTAHIGGSQVTDAKLASNSVTTSKIADGQVTTVKISNGDVTLAKLANDLKQTTISDSDTQLPTSGAVVDYVAAQLQPFGGFEAVATEVAFPNTQPVSGVAISISDAGGVVVNGSGVSTTGRTVGGSTITINGFPSSLYNETLVAGVGLIVTSTGSSQTYNYHKILGKEDDIKQLSDDINDFNARYRVGSSNPSSALDSGDLFFNTSTGKLLVYNGTNSAWEEAQSIGNYYINTISSYSGTGGNSASFNGSAYRFVLSNPGTTAEQHIVSVNGVVQKPNSGTSQPGEGFAIDGSSIIFSSAPASGSDFFIITIGSTVNIGTPSDNTVTTAKLTSGAVTTVKIADDAVTAAKIADNLDLPDGNKIRFGTGNDLSIEHDGNHSYINEQGTGDLFVQSNGGSISFQKFGTLERLANFITDGAVELFHDSSKKIETTSWGAQVSGNFVATGLIDLADGNGTSTSTIALGDSDDLKIYHDGSHSYIKNGTGNLNIRTGGTLWIDNSAGTETYIKAIENEAVQLYYDNSKKFETTNLGAQITGELSLTTHLKLLDNQKVVCGNGEDLLIYHDGTHNYVNFVTGALIFQNNGTSVAYFHNTDGHFLPWTTNTFDLGSSGNRWRNVYTNDLHLSNEGSSNDVDSTWGDWTIQEGESDLFLKNNRSGKKYKFNLTEVL
Physico‐chemical
properties
protein length:1012 AA
molecular weight: 106303,56780 Da
isoelectric point:4,54424
aromaticity:0,07016
hydropathy:-0,24447

Domains

Domains [InterPro]
AGG54570.1
1 1012
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Prochlorococcus phage P-SSP3
[NCBI]
382273 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Prochlorococcus marinus
[NCBI]
1219 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGG54570.1 [NCBI]
Genbank nucleotide accession
HQ332137 [NCBI]
CDS location
range 9545 -> 12583
strand -
CDS
ATGGCGACAACTGAACATTTTTATACAGGCAATAACTCCACAACGAGTTTTGCCTTTACATTTCCATATTTATCAAACAGCGATGTCAAAGTAGAACTTGACAACGTTGTAAAAACTGAAAACTCAAGTGGTCAAACAAACAATGACTACACCATAAACAATACAAACATTGTATTTAATAGTGCTCCGGGAACTGGAGTAGCTATTCATATTTATAGAACAACTAACGTAGACTCAGCTCAGGCACAATATGCAGCTGGTTCATCAATACGTGCAGCTGACTTAAATAATAACCAAACACAATTACTGTACTCAGCTCAAGAAGCTAGTGGACAATTAATAAGACAAGGAGATTTAAAAGATTCTATAATAAACTCTGCAAAAATAGTTGATGGTTCTGTTGCAACAGGAGACTTAGCAGATGGTCTTATAACAACTGTTAAGATTGCTGCTGATGCAGTAACTGGAGCTAAGATTGCAGATGATCAGATTAACTCTGAGCATTATATTGATGCTTCTATTGATACTCAACATATAGCTGATAGTCAGATAACAACTGCAAAAATAGCTAACAGTAATGTAACCACAGCTAAGATTGCTGACTCAAATGTAACTACAGCCAAAATAGCTGCTGATGCTATTACTGGTGCAAAGATAGCTGATGACCAGATAAACTCTGAGCATTATGTAGACGGAAGTATAGATACTGCTCATATAGCTAATAGTCAAATTACTTCAGCTAAAATTGCAGACGGTACTATTATTGCTGGAGATTTAGCAAGTAATGCTGTTACTACAGCTAAAATTACTGATTTAAATGTTACTACAGCCAAAATAGCAGCTGATGCAATTACTGGAGCTAAAATTGCTGACGATCAAATTAACTCAGAACATTATGTTGATGGGTCAATTGATACAGCACATATTGGAAACAATCAAGTTACTACAGCTAAGATTGCAGCAGATGCAGTTACAAATGCAAAAATAGCTGACGATCAAATTGATTCTGAACATTACGTAGACGGATCTATTGATACAGCTCATATAGGTGGTTCTCAGGTTACAGATGCAAAGCTTGCGTCTAACTCAGTAACAACATCTAAAATTGCTGATGGTCAAGTAACTACAGTTAAGATATCTAACGGAGACGTAACCCTTGCTAAACTAGCGAATGATCTAAAACAAACAACTATATCTGATAGTGATACACAGTTACCAACATCCGGAGCTGTTGTTGATTATGTTGCTGCACAATTACAACCATTTGGTGGATTTGAAGCAGTAGCTACAGAAGTAGCATTTCCTAATACACAACCAGTTAGCGGTGTAGCTATATCTATATCAGATGCTGGAGGAGTAGTAGTTAATGGTTCTGGAGTTAGTACAACTGGTAGAACAGTAGGCGGCTCAACCATAACTATTAATGGATTTCCATCTAGTTTATATAACGAAACATTAGTAGCTGGAGTAGGTTTAATAGTTACTTCTACAGGATCTAGTCAGACATATAATTACCATAAAATACTTGGTAAGGAAGATGATATTAAACAACTTAGTGATGATATAAATGACTTTAACGCAAGGTATAGAGTTGGGTCGTCAAACCCTTCAAGTGCTCTTGATAGTGGTGATTTATTCTTTAATACTAGCACAGGTAAATTACTTGTATATAATGGAACTAATAGTGCATGGGAAGAAGCACAAAGTATAGGTAATTATTATATAAATACAATATCCAGCTATTCTGGTACAGGAGGAAATAGTGCATCATTTAATGGTTCTGCTTACAGATTTGTTCTTTCCAATCCGGGAACTACAGCAGAACAACATATTGTTTCTGTCAATGGAGTCGTTCAGAAACCTAACTCAGGTACAAGTCAACCCGGCGAAGGATTTGCTATTGATGGTAGTTCTATCATATTTAGCTCCGCTCCTGCTAGTGGTTCTGATTTCTTCATCATTACAATCGGATCAACAGTAAATATTGGTACACCAAGTGATAATACAGTTACAACTGCTAAACTTACAAGTGGTGCAGTAACTACAGTTAAGATTGCAGATGATGCAGTTACAGCAGCTAAGATTGCAGATAATTTAGATCTTCCAGATGGTAATAAAATTAGATTTGGTACTGGTAATGATTTATCTATCGAACATGATGGAAACCATAGTTACATAAATGAACAAGGAACTGGAGATTTATTTGTTCAAAGTAATGGTGGTTCAATATCTTTTCAAAAATTTGGAACACTTGAAAGACTAGCAAATTTTATTACAGATGGAGCGGTTGAGCTCTTTCATGACAGCAGTAAAAAGATAGAAACAACCAGTTGGGGTGCTCAAGTAAGTGGCAATTTTGTTGCAACTGGACTTATAGATTTAGCAGATGGTAATGGTACTAGTACTTCTACAATTGCTCTTGGAGATAGTGATGACCTAAAAATTTATCACGATGGAAGCCATAGTTATATAAAAAATGGTACTGGTAATCTAAATATCCGAACTGGCGGTACTCTATGGATAGATAACTCTGCAGGAACTGAAACATATATTAAAGCTATTGAAAATGAGGCCGTACAGTTATATTACGACAACAGTAAAAAGTTTGAGACAACTAACTTAGGAGCACAAATTACTGGAGAGTTATCATTAACAACTCATCTAAAACTTCTTGATAATCAGAAAGTTGTTTGTGGAAATGGAGAAGATCTACTTATCTACCATGATGGAACCCATAATTATGTAAATTTTGTAACTGGAGCATTAATATTTCAAAATAATGGTACAAGTGTAGCATATTTTCATAATACCGATGGTCATTTCTTACCTTGGACAACTAATACATTTGACTTAGGTTCATCAGGTAATCGTTGGAGAAACGTCTACACCAATGACCTTCACTTATCTAACGAAGGTTCATCTAATGATGTTGATTCAACTTGGGGTGACTGGACAATACAGGAAGGAGAATCAGACTTGTTCTTAAAAAATAACCGTTCTGGTAAAAAGTATAAATTTAATTTAACGGAGGTATTATAA

Tertiary structure

PDB ID
67acbce3b862e0f240327238eeb51d1968fb386ce55bac221a07d2335c965f0f
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,6304
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Prochlorococcus phage P-SSP3 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank