Genbank accession
AIR93428.1 [GenBank]
Protein name
hypothetical protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TF
Evidence RBPdetect2
Probability 0,93
Protein sequence
MAKLGISTGTTPNDGSGDSLLDGAVKVNSNFDEVYNKIGDGTDLFVGIVSSITVSGPLSISTTFGAPVITGLANTANINATNFQVTGVGTITGTTRLAGINTFSAAGYTVAGLVTASNIISNETIKVAGIVTTSEDGINVSAAVTARSLAIQDVTQTSHFVGLNTVFIDHTGVGATAINITDTATIGFGSISSANITTINANTANINSGILTTATVGTAITIHSKGIDAGQAGIITASRLFGAVTGAVTGTASSATEADLAYGLTGTPSIVVGVATLGGHIFNAPGAFISGILTATSFSVGTNEIVSSARQLKNIATLDATTKLTIENAISDPPNDFDDLNVVGLATVNRLFISGDTRGLNILGVTTGLSAPGITTLGIITGATSLQATDVYSNFLHGDGSNISNVTGGVTVQDEGSALSTVATTLNFVGSGVVASGSGATKTITISGGGGGGSIAGISTTGTSGFNQLNVTGVSTFGANIDLNANIDVSGSSTLHNGLVVNGGIVDINHQIVGLATDNVIPFYYANVSDFPSASTYHGAVAHGHNTGLLYFAHAGAWLELVSKDSSGVVNKIVVGAAVTIDQNNIDTVGIITASEFHGDGSNLTGITGSTVAGISTTGTSGFNQLSISGVSTFTGNIDANGALDVDGQTDLDVVNVAELATFSSRVQVGTGLTLDQNNIDAGSYVGIITAKEFHGDGTNVATSRWAVTNASSNHYVFNGPGNLVNANDPTIYLARGQKYEFDINASGHPFRIQTSSGASGYNSGNEYTTGITNVGAASSLLTFDVPFDANNTLYYVCQNHSSMNGTIIIYPSI
Physico‐chemical
properties
protein length:814 AA
molecular weight: 81821,29990 Da
isoelectric point:4,48951
aromaticity:0,06143
hydropathy:0,24988

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Prochlorococcus phage P-TIM68
[NCBI]
1542477 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Prochlorococcus sp.
[NCBI]
1220 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AIR93428.1 [NCBI]
Genbank nucleotide accession
KM359505 [NCBI]
CDS location
range 75788 -> 78232
strand +
CDS
ATGGCTAAATTAGGAATTAGTACAGGAACCACGCCCAATGATGGATCAGGTGACAGTCTGTTGGATGGTGCTGTTAAGGTTAATTCAAATTTTGATGAAGTCTATAATAAAATAGGAGATGGGACAGATTTATTTGTTGGAATTGTTAGTTCTATTACTGTATCAGGACCTTTAAGTATAAGCACTACTTTTGGTGCACCTGTCATAACTGGATTAGCAAACACTGCAAATATAAATGCAACCAACTTTCAAGTAACTGGTGTAGGAACAATAACAGGAACAACAAGGTTGGCAGGTATCAATACATTCTCTGCTGCTGGATATACTGTGGCAGGTTTAGTAACTGCGAGTAATATAATATCAAATGAGACTATTAAGGTAGCAGGTATAGTTACAACATCTGAAGATGGTATAAATGTATCAGCTGCTGTAACTGCTAGATCACTAGCAATTCAGGATGTAACTCAAACCTCTCATTTTGTTGGTTTAAACACTGTATTCATAGATCATACTGGTGTTGGTGCTACTGCTATCAATATAACTGACACTGCAACCATAGGATTTGGATCTATATCTAGTGCAAACATCACTACTATAAATGCAAACACAGCAAATATAAACAGTGGTATATTAACAACTGCCACAGTTGGAACAGCAATTACTATACATTCAAAAGGAATTGATGCAGGTCAAGCTGGTATCATAACTGCAAGTAGATTATTTGGTGCTGTAACTGGTGCTGTAACTGGAACAGCATCCTCTGCTACTGAAGCAGACTTAGCATATGGGTTAACAGGAACACCTAGCATTGTTGTAGGTGTTGCAACTCTTGGTGGACATATATTCAATGCACCTGGTGCCTTTATATCAGGTATTCTTACTGCTACTTCATTCTCTGTTGGTACTAATGAGATTGTAAGTAGTGCTAGACAATTAAAAAATATAGCAACCTTAGATGCTACAACCAAACTTACAATAGAAAATGCCATATCTGATCCTCCAAATGATTTTGATGATTTAAATGTAGTAGGTCTTGCCACTGTCAATAGATTGTTCATAAGTGGAGATACAAGAGGTTTAAACATTCTTGGTGTCACCACTGGTTTAAGTGCACCAGGTATTACAACTCTTGGTATTATTACAGGTGCCACATCATTACAGGCAACTGATGTTTATTCAAACTTTTTACATGGTGATGGATCTAATATCTCAAATGTCACTGGTGGTGTTACTGTTCAAGATGAAGGAAGTGCATTATCAACTGTTGCAACCACATTAAACTTTGTAGGATCTGGTGTAGTGGCATCTGGATCTGGTGCGACTAAAACAATTACTATCTCTGGTGGTGGAGGTGGTGGTAGTATTGCTGGTATCAGTACTACAGGAACATCTGGATTCAATCAACTCAATGTAACTGGGGTATCAACCTTTGGTGCTAATATTGATCTCAATGCAAATATAGATGTCAGTGGATCATCAACTCTTCATAATGGATTGGTTGTAAATGGTGGTATTGTTGATATTAATCATCAGATAGTTGGTCTTGCAACAGACAATGTAATTCCATTCTACTATGCTAATGTAAGTGATTTCCCATCTGCATCTACATATCATGGTGCAGTTGCTCATGGACATAATACTGGTTTACTATATTTTGCACATGCTGGTGCTTGGTTAGAATTAGTCAGTAAAGATAGTAGTGGAGTGGTCAATAAGATTGTAGTTGGTGCTGCTGTTACTATTGATCAAAATAATATTGATACTGTAGGAATTATAACTGCTTCTGAATTTCATGGTGATGGTTCAAACTTAACTGGTATCACTGGTTCAACTGTTGCAGGTATCAGCACTACAGGAACATCTGGATTTAATCAACTAAGTATTTCTGGAGTTTCCACATTTACAGGTAATATAGATGCTAATGGTGCCTTAGATGTTGATGGACAAACTGATTTAGATGTAGTTAATGTTGCTGAACTTGCTACATTTAGTTCAAGAGTTCAAGTTGGAACTGGTCTTACACTTGATCAAAATAATATTGATGCTGGTTCTTATGTTGGTATTATAACTGCCAAAGAGTTTCATGGTGATGGAACAAATGTGGCAACATCTAGATGGGCAGTGACAAATGCTAGTTCAAATCATTATGTGTTCAATGGACCTGGTAATTTAGTTAATGCTAATGATCCAACTATATACCTTGCAAGAGGTCAGAAGTATGAATTTGACATTAATGCTAGCGGTCATCCATTTAGAATACAAACTAGCTCTGGTGCATCAGGTTATAATTCTGGAAATGAGTATACTACTGGTATTACTAATGTAGGTGCTGCATCTAGTTTGCTTACATTTGATGTTCCATTTGATGCTAACAATACTTTATACTATGTTTGTCAAAACCATTCTAGTATGAATGGAACTATTATCATCTATCCATCAATATAA

Tertiary structure

PDB ID
8822b2a3c647f84c8ee79e24f003d3c16b1889a9a67d81f9a1375f59d636e90e
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5341
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50