Genbank accession
AGN12240.1 [GenBank]
Protein name
hypothetical protein
RBP type
TSP
Evidence DepoScope
Probability 0,58
TF
Evidence RBPdetect2
Probability 0,74
TF
Evidence Phold
Probability 1,00
Protein sequence
MPLNKLENFIKNSEGRILYVNPNDLDATDGIENQGNSLTKPFKTLQRALIESARFSYLRGNDNDLVEKTTILLFPGEHLIDNRPGFGIKSVSGTATAISPSSAESGAQNTLTLTLNSNFDLTQEDNILYKFNSTEGGVIVPRGTSIVGLDLRKTKVRPKYVPNPTDDNVKSTAIFRVTGACYFWQFSIFDGDESTTVYTDPTNFSSSNRSKPVFSHHKVTCFAYADGVNKLDQFDGLTDLDVYYSKLSNAYNRASIRDIDEKYPATPGGFSKQRPEYEIVGAFNSDRLQVTSIISGDGATPGQVVTVTTSVPHELTGGTPIKIEGVNELTYNISTKVSSVLSDTQFTYLLPYVPPNLKAGPAGGLSAGSAEVSVEVDTVTGASPYIFNCSLRSVYGMQGMNADGAKATGFRSMVVAQFTGISLQKDDRAFVKYNKNSRSYDGISYQRQTGELLSSESSSLNAATVYHLDKDAVYRDGWKTAHITIQNDAILQIVSVFAIGYHIHFLGKSGGDASITNSNSNFGQFALAADGFKKESFDKDNKGFISAIIAPKAVVSTEANIELNQLDTSVHTAYKTADTSTNKILSRSKLFLLGQTNENLVPSEIAQGYRIGARVGEKFYIDLANGTKVQATICMSNKEIVGGNASTVTSSVQVTSEKEYEGTHNDTTQGSASIEHKIVLNNLRSIGAKHDLNNGESIRIIAEDADLPEGLDPHRIYYAITNEKNSSRQDGISLDDYTIQIASSKTNADRTTPQYIKTVSNPAAGKLKIISRVSDKKPGDLGHPMQFDSTVTVQLEGGGTSTGNWFIHVDGTSDNTAATYNTVWDNFANLDADDEDIPYIQRLNDSRSLDDKLYKFRYVIPKELENARDPNDSFIIQDSSSTNVRALADFTRTSLEAKDYDFNRNTRFISYLDYNSTTKIVTIRSDKSHNLNAGEQIILKNIICTVNASGAADKGYNGTFLVNSIINDKVFTYKTTDILGNVHNVGTYGNDTHTRTLSLPRFERNNNQENLFIYRTETILPYVEGAQDGVYHMYVLNGSNTIEEEFAAGKYNQNVVNLYPELDRDNVNDNPQEASSYAKRFPIGDVVTNDLKKSITRETANKLINSFGVANTISDVTDNTTSAVLTLTREHDLGGLKYGGTLAGGGGHTDGTYYNVKLFDDASAPASAVWKGATAKVVVSGGAVTEYEITEPGSAYKSTLSPLYFDSSLVAQGGIGGAPSSNIAITDANISLANSGYVQVTGISTGTDQYFRVNDATDINKININKTASETILNGQTVVSVGPIVEVSTSSGTDTTTFNCSTAHGLLKGNRFRVLNASDANLGDFIVTEVVDVDSFTALTPGGLTSPKYILKHGLSANDGNSGKQGESLGVRGVAFYDNESLVLNDTITSVTDEIKVTLPGGGTTAASIQARFPLGSFIQVDSEIMRVVDETIGSGTTLKVIRGALGTIVDNHVLNSQIKKIKPLSVELRRPSILRASGHTFEYLGYGPGNYSTGLPQVQLKSLTEREEFLSQSQETSCGTVVYTGMNDKGDFYIGNTKISSDSGEQITFDIPIPTVTGEDPSTLSVVFDEVIIKDRLLVEGGSSNTILSQFNGPVTFNGNVRFNKDLKVATNLTVDGIVKFNNETVASSTCGVTPTGSLVVKGGVSIGDKVSASGAVSLNVLDGIVRICENAASTSSTTGALIVGGGVGIAGQLSLGGVLDVTGSINAGGGLHLPDNVKLTAGGTTSGPYFSIEHDVVGGVRNNIIKDESLSNIYLRSDANIEIGNKDGTEQGLIYTAGAGIKLRHGTTLRFETNTSGAKVHGALEVTDDITAYSTSDARLKNDVKPIQDSLAKVNSISGNTFTWNEASKKEGQEDTGVIAQEISAIGLPGTVTIREDGTYAVDYEKLVPLLLEAIKELSNKVDTLS
Physico‐chemical
properties
protein length:1908 AA
molecular weight: 204892,13440 Da
isoelectric point:5,12491
aromaticity:0,07495
hydropathy:-0,28464

Domains

Domains [InterPro]
AGN12240.1
1 1908
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Prochlorococcus phage P-SSM5
[NCBI]
536454 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGN12240.1 [NCBI]
Genbank nucleotide accession
HQ632825 [NCBI]
CDS location
range 52719 -> 58445
strand -
CDS
ATGCCACTTAATAAGTTAGAGAATTTCATAAAGAATAGTGAGGGTCGCATTCTTTATGTTAATCCAAATGATCTTGATGCCACTGATGGAATAGAAAATCAGGGTAACTCATTAACAAAACCATTTAAGACCTTACAAAGAGCACTTATCGAATCCGCTAGATTTTCATATCTAAGGGGAAATGATAATGATTTAGTAGAGAAGACAACAATATTACTGTTTCCAGGTGAACACTTAATAGATAACCGTCCAGGTTTTGGTATAAAAAGTGTTAGTGGAACTGCTACTGCTATTAGTCCAAGTAGTGCAGAATCAGGTGCTCAAAATACACTTACATTAACTCTTAATTCTAACTTTGATTTAACGCAAGAAGATAATATACTTTATAAGTTCAATAGTACTGAAGGTGGTGTTATAGTTCCTAGAGGAACTTCTATTGTTGGATTAGACCTAAGAAAAACAAAGGTTCGTCCTAAGTATGTTCCAAATCCTACTGATGATAATGTAAAATCTACTGCTATCTTTAGGGTTACTGGTGCTTGTTATTTCTGGCAGTTCTCTATTTTTGATGGGGATGAATCTACAACAGTATATACAGACCCTACTAACTTTAGTAGTAGTAACAGATCAAAACCAGTATTCTCTCATCATAAGGTAACTTGCTTTGCGTATGCTGATGGTGTTAATAAGTTAGATCAATTTGATGGATTGACTGATCTAGATGTCTATTATAGTAAATTATCAAATGCATATAATAGAGCATCGATTAGAGATATTGATGAAAAGTATCCTGCTACTCCAGGTGGATTTTCAAAGCAAAGACCTGAGTATGAAATAGTTGGTGCATTTAATTCTGATAGACTTCAAGTTACAAGTATTATTTCAGGTGATGGTGCAACACCAGGTCAGGTTGTTACTGTAACTACATCTGTTCCTCATGAACTGACTGGTGGCACACCAATTAAGATTGAAGGTGTAAATGAATTAACTTATAATATTTCAACTAAAGTTAGTAGTGTTTTAAGTGATACTCAATTTACATATTTACTTCCATATGTTCCACCTAATCTAAAAGCTGGTCCTGCTGGTGGATTAAGTGCTGGTAGTGCAGAAGTAAGTGTAGAAGTTGATACTGTTACTGGTGCATCTCCTTATATCTTTAACTGTTCATTAAGATCAGTTTATGGTATGCAGGGTATGAACGCTGATGGTGCTAAGGCAACTGGATTTAGATCTATGGTTGTTGCTCAGTTTACTGGTATATCACTACAGAAAGATGATCGTGCATTTGTAAAATATAATAAGAATAGTAGATCTTATGATGGTATTAGTTATCAGAGACAAACTGGTGAATTGCTATCATCAGAATCATCATCTTTAAATGCTGCTACTGTCTATCACTTAGATAAAGATGCTGTTTATAGGGATGGGTGGAAGACAGCACATATTACAATTCAGAATGATGCAATCTTACAGATTGTTTCTGTGTTCGCTATTGGTTATCATATTCATTTCTTAGGTAAATCTGGTGGTGACGCATCGATTACAAACTCTAACTCTAACTTCGGTCAGTTTGCTCTTGCTGCTGATGGATTTAAGAAAGAATCCTTTGATAAAGATAATAAAGGATTTATATCTGCTATTATCGCACCTAAAGCAGTTGTCAGTACAGAGGCTAATATTGAGTTGAATCAGCTTGATACTTCCGTTCATACTGCATATAAAACTGCTGATACTTCAACAAATAAGATTCTTAGTAGAAGTAAGTTATTCTTATTAGGTCAAACTAATGAGAACTTAGTACCATCTGAAATTGCACAGGGATATAGAATCGGTGCGAGAGTTGGTGAGAAGTTTTATATAGATTTAGCAAATGGAACTAAGGTTCAGGCTACCATTTGTATGTCCAATAAGGAAATTGTTGGTGGCAATGCTTCAACAGTAACTTCATCTGTACAAGTTACTTCAGAGAAGGAGTATGAAGGTACTCATAATGATACTACTCAAGGAAGTGCATCTATAGAACATAAGATAGTTCTTAATAATTTACGCTCTATTGGTGCTAAACATGATCTTAATAATGGTGAGTCTATAAGAATTATTGCTGAAGATGCTGACTTACCAGAAGGTTTAGATCCTCATAGAATTTATTATGCGATTACTAATGAGAAAAACTCTTCAAGACAAGATGGTATTAGTTTAGATGATTATACAATCCAGATTGCATCATCAAAAACTAACGCTGATAGAACTACACCACAATATATTAAGACTGTTTCTAATCCTGCTGCTGGTAAATTAAAAATTATTAGTAGAGTTTCTGATAAAAAACCAGGTGACTTAGGACACCCAATGCAGTTTGATTCCACAGTAACAGTTCAACTAGAAGGTGGTGGTACTTCAACAGGTAACTGGTTTATTCATGTTGATGGTACTTCTGATAATACTGCTGCAACTTATAATACTGTATGGGATAATTTTGCTAATCTAGATGCTGATGATGAGGATATTCCTTACATCCAAAGATTAAATGATAGTAGAAGTTTAGATGATAAACTCTATAAGTTTAGATATGTAATTCCAAAAGAATTAGAAAATGCTAGAGACCCTAACGATAGTTTCATCATTCAAGATTCTAGTTCTACTAATGTAAGAGCATTAGCAGATTTTACTAGAACCTCTCTAGAGGCAAAAGATTATGATTTTAATAGGAATACACGATTTATTTCTTATCTTGATTACAATAGTACTACTAAGATAGTTACTATTAGATCTGATAAGTCACATAACTTAAATGCTGGTGAACAAATTATCCTTAAGAATATAATTTGTACTGTTAATGCTAGTGGTGCAGCAGATAAAGGATATAATGGAACATTCTTAGTTAATAGTATTATTAACGATAAAGTTTTTACCTATAAGACAACTGATATTTTAGGTAATGTTCATAATGTAGGAACTTATGGTAATGATACCCATACTAGGACTCTTTCATTACCTAGATTTGAGAGGAATAATAACCAAGAAAACTTATTCATCTATAGAACCGAAACAATTTTACCGTATGTTGAGGGAGCACAAGACGGTGTTTACCATATGTACGTTCTGAATGGTAGTAATACTATAGAAGAAGAATTTGCTGCTGGTAAGTACAATCAAAATGTTGTTAATCTTTATCCAGAATTAGATCGAGATAATGTAAATGACAATCCACAGGAAGCATCTAGTTACGCTAAGAGATTCCCTATTGGTGATGTAGTTACTAATGATCTTAAGAAGAGTATCACTAGAGAAACTGCCAATAAACTAATTAATAGTTTTGGTGTTGCAAATACAATTAGTGATGTAACTGATAATACTACTTCTGCTGTTCTAACACTTACAAGAGAACATGATCTCGGTGGTTTGAAGTATGGTGGAACATTAGCAGGTGGAGGTGGACATACTGATGGAACTTACTATAACGTAAAATTATTTGATGATGCTTCTGCTCCTGCTTCTGCTGTATGGAAAGGTGCTACTGCTAAAGTTGTTGTTAGTGGTGGAGCAGTTACCGAGTATGAGATAACTGAACCAGGATCAGCATATAAGAGTACATTATCCCCACTATACTTTGACTCTTCATTAGTAGCTCAAGGTGGTATTGGTGGAGCTCCTAGTTCTAATATTGCTATTACTGATGCAAACATTAGTTTAGCAAATAGCGGATATGTTCAAGTAACTGGTATTAGTACAGGAACAGATCAATACTTCAGGGTTAATGATGCTACGGATATTAATAAAATCAATATTAATAAGACTGCAAGTGAAACAATTCTGAATGGTCAAACTGTTGTTAGTGTAGGACCTATTGTTGAAGTTAGTACTTCTAGTGGAACTGATACAACTACATTTAATTGTAGTACAGCACACGGATTACTTAAAGGAAATCGTTTCAGAGTATTAAATGCTTCTGATGCTAATCTTGGAGACTTTATTGTTACTGAAGTTGTGGATGTAGATAGTTTTACTGCATTAACTCCAGGTGGATTAACATCTCCTAAGTATATTCTTAAGCATGGATTATCTGCTAATGATGGTAACTCTGGTAAGCAAGGTGAAAGTTTAGGAGTAAGAGGAGTTGCTTTCTATGATAATGAATCTCTAGTTCTGAATGATACTATTACTTCAGTTACGGATGAAATTAAAGTTACTCTACCTGGTGGAGGTACGACTGCTGCATCTATTCAGGCAAGATTCCCATTAGGTTCATTCATTCAAGTTGATAGTGAAATAATGAGAGTTGTTGATGAAACTATTGGTAGTGGAACAACACTTAAAGTTATTCGTGGTGCATTAGGTACTATTGTTGATAACCACGTTCTTAATTCTCAGATTAAGAAGATTAAACCTCTTTCTGTTGAACTAAGAAGACCATCTATTCTAAGAGCATCTGGTCATACATTTGAATACCTTGGTTATGGTCCAGGTAACTATTCAACTGGTTTACCTCAAGTTCAACTTAAATCTCTAACTGAGAGAGAAGAGTTCTTATCACAATCACAAGAAACTTCTTGTGGTACTGTTGTTTACACAGGTATGAATGATAAGGGTGATTTCTATATTGGAAACACTAAGATTTCATCTGACTCTGGTGAACAGATAACATTTGATATTCCAATTCCAACTGTAACAGGTGAAGATCCAAGTACGCTTAGTGTTGTATTTGATGAAGTAATCATTAAAGATAGACTACTTGTTGAGGGTGGAAGTTCTAATACAATTCTATCTCAGTTTAATGGACCTGTAACATTCAACGGTAATGTAAGATTCAACAAGGATCTTAAAGTTGCAACCAACTTAACTGTTGATGGTATAGTTAAATTTAATAATGAAACAGTAGCATCATCTACTTGTGGTGTGACTCCTACAGGATCATTAGTGGTTAAAGGTGGAGTTTCTATTGGTGATAAGGTAAGTGCTTCTGGTGCAGTATCCTTAAATGTACTAGATGGTATTGTTAGAATTTGTGAAAATGCTGCATCAACTAGTTCTACTACAGGTGCTTTAATAGTTGGTGGTGGTGTTGGTATTGCTGGTCAACTTTCTCTTGGTGGTGTTTTAGATGTTACTGGCAGCATAAATGCTGGTGGTGGTTTACATTTACCTGATAATGTTAAATTAACTGCTGGTGGAACTACTTCTGGACCATATTTCTCTATTGAACATGATGTTGTTGGTGGTGTTCGCAATAATATTATTAAAGATGAATCACTCTCTAACATATACTTGCGAAGTGATGCGAATATTGAAATAGGTAATAAGGATGGCACAGAGCAAGGTTTAATTTATACTGCTGGAGCAGGTATTAAATTACGTCATGGCACTACCTTAAGGTTTGAGACTAATACTTCTGGTGCTAAAGTTCATGGTGCTTTAGAAGTAACTGATGATATTACTGCATACTCAACTTCTGATGCAAGATTGAAGAATGATGTTAAACCAATACAAGATTCTCTTGCTAAGGTTAATTCAATTTCAGGTAATACCTTTACTTGGAATGAGGCATCTAAGAAAGAGGGACAGGAAGATACTGGTGTGATCGCACAAGAAATTTCTGCTATCGGATTACCTGGCACAGTAACCATCAGAGAAGATGGAACCTATGCTGTTGATTATGAGAAGTTAGTTCCACTTCTATTGGAAGCAATCAAGGAATTATCTAATAAGGTTGATACTTTATCATAA

Tertiary structure

PDB ID
5541fadf3975e45bd7f582704febd14e4a0dd0140c2f5d9955a013471b3ee05e
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,8334
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Prochlorococcus phage P-SSM5 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank