Genbank accession
AGG54131.1 [GenBank]
Protein name
structural protein
RBP type
TF
Evidence RBPdetect2
Probability 0,93
Protein sequence
MANRIQLRRGGAQEWANENPTLAQGEIGIELDTNRFKIGDGVRGWNTLPYERPIESVANTANTLVTRDADGNFSAGAITATLIGNSATSSRLANPRQIQLSQDLSGSGTFDGSSNLSLNAQLQVLSSLPHYDGTTTSTGTYTKVIVDAKGRITNASQPSSYVDLGLNDVQPLDSDLSAIANLTSTGIITRNAGGSALTRSVQGSSGRISVVNGNAVAGNPTIDLIDTTVALEAEFIAGSGQYNIPSLTSVGGDNLPEAANRTVNSTRYTVDQYGRFTSALTIPIATAREGSKYPNYDAATTYSRYAIIQNASKVYQALTTINAGAGAPTHSSGDTGSWRYLAAEATEQKGLASFAQEDFDVDSNGHVTIAAAGVDNTQLQNNLLRFADGNATEDFELDNELTSTTGYRGFNKLNYVKVNDTSGNLLVGLNNTGDGGAGELDVNVRSYFSDPDVTFDGAVQQAINKTGDGDFQILHQQNTASARTFAIAAQNSGSGNSQVAISAENVVSIDATDSAGKVHIEDLRIQDNYLASTGQLNLDPGDDRTNAGLVRIFGDLQIDGTTTTVNSTTMTVDDVTILLGGDTAPASDDNLDRGIEFRYYDTQARLGFYGWDTSYTDLSGHEGGYRFLHAATNTGEVFAGTDSGIIAGNLKLTTNTNSTSNTTGDLVVLGGAGIGDDVNIGGSVDIDTNLRIHGTSRFDDNVVLQGASKTLQLNNGSGTTKIEFQSTSGNGSLAGILDVTGNFNVNSNKFNVVAASGNTSIAGTLAVTQGTTMSAGLDLNSTLNVSNTVYFEDTNEPTWAKNSGTGLWEIQSNDYGAFRFDGGGYVAGDFMFDSDVVINGTILQRDDATETFNEQNYLRVRRKLFVGNIQALTPSYASHSNTNLRVYGGAGIQTDLHIGDDLYIGKLNSNDSVKFQVLGESGNTTIQGTLLVENNTNFNGTLDVDADFAVRNGTTDKFFVDNVTGNTDIQGTLDVNGATEITNTLDVSNAVTFDQTLTVQGNSEFNGTVDVDANFAVRSGSTDKMTVASSTGNIATDGTLVVQGQTTINDSLIVQASNEFFKVQNGSSADRFTIDTDNGNTSVIGTLTVSQATDLNNTLNVAGITTFENNTDQNITNVSYSADGAVRIDGGVGIDKKLAVGGASRFYGTAEFSSDLDINAAADISGNLTISNGNQVTSFADTTVALKVTGGARINKNLMTGGDFTVYDNSGGLNSFLVEVATGDATLRNDLVVGGNLTVNGTTTTVNSTTVTLDDPIMTLGGDTAPVSDDNKDRGIEFRYYDTQARLGFIGFDNNLEKFRFLVNATNSSEVFSGTDGSLQAGTLNLTGSGTALDVDNNANIDGTLTVDGVITSTKTSGAPFVVNSTSKVTNLNADLLDGMTTAATNTVSTVVARDSSGNFAAGTITAALVGNSSTATALETARNIAVAGVVSGTVSFDGTSDVSITTSFVDADVAALAAMSGTGMVTRTAGNTYAQRTLSKSGAGITITNGDGVSGNPTINIQSASTNSASNLVLRDASGNFSAGTVTANLTGNVTGNVTGTVSDISNHDTDDLSEGSTNVYYTNARADARVNLQTGANLSLANKTTTDLAEGTNQYYTEARVQAKLDNAYEQLRAMLTNLATSTTLTLNLSGDPTPGAVVAIGAIQNNGIGGFSNSTGLATGGGSGTSLTVDLTTSAGAITGIAINTPGTNYTTSDTITITNPNAGGVNAFNFGSLSAGTNYVSTNNVLTTGGSGTGLRVNFTAGSGNVTNVTVASAGSGYVNGETVTIPNDGAASASITAAGTGYSVDSLVSTTGGTGSGLTISIDTVNPGTGAITGLSIVSGGHGYTASDVITVSGGNGDATFTIGSVHAGNATIDISQVFTNATFALSDVTEMEVGATVTGATSGTTARISSLGATAITVDNVDGFFKKGEVVSANDVTTLTISSFS
Physico‐chemical
properties
protein length:1931 AA
molecular weight: 198695,43280 Da
isoelectric point:4,24487
aromaticity:0,06163
hydropathy:-0,16396

Domains

Domains [InterPro]
SSF69349
STR
4–230
IPR041352
ATT
5–42
AGG54131.1
1 1931
Architecture
ATT
STR
STR
RBD
RBD
ATT 1-465 | STR 466-935 | STR 1139-1521 | RBD 1542-1783 | RBD 1847-1931
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage S-SSM4
[NCBI]
536466 Uroviricota > Caudoviricetes > Pantevenvirales > Greenvirus > Greenvirus ssm4
Host Synechococcus sp. WH 8018
[NCBI]
166322 Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGG54131.1 [NCBI]
Genbank nucleotide accession
HQ316583 [NCBI]
CDS location
range 71649 -> 77444
strand +
CDS
ATGGCAAATAGAATTCAACTTAGACGTGGTGGTGCTCAGGAGTGGGCTAATGAAAACCCAACCCTAGCCCAAGGCGAAATTGGCATTGAACTTGATACCAACCGATTCAAAATCGGTGATGGTGTCAGGGGATGGAATACCTTACCGTATGAACGGCCGATTGAATCCGTGGCAAACACGGCTAATACTCTTGTAACTAGAGATGCTGATGGTAACTTCTCTGCTGGTGCTATTACTGCTACCTTAATTGGTAACTCTGCAACATCTTCTCGTCTTGCCAACCCTCGTCAGATCCAACTATCTCAAGACCTTTCAGGTTCTGGTACTTTTGACGGTTCGTCTAACTTATCTCTTAACGCTCAGTTACAGGTTCTTTCTTCATTACCACATTACGATGGTACAACAACCTCTACTGGCACTTATACTAAAGTAATTGTTGATGCTAAAGGTAGAATTACAAACGCATCTCAACCATCATCTTATGTTGATCTTGGATTAAATGATGTTCAACCTTTAGACTCAGACCTTTCTGCAATTGCAAACTTAACCAGTACAGGTATTATCACTCGTAACGCTGGTGGTTCTGCACTTACCAGATCTGTACAAGGTTCATCAGGTAGAATTTCTGTTGTAAATGGTAACGCTGTTGCTGGTAATCCAACGATTGACCTTATTGATACTACCGTTGCTCTTGAGGCAGAATTTATTGCTGGTAGCGGTCAATACAATATCCCAAGTTTAACGTCAGTAGGTGGTGATAATCTACCAGAAGCAGCAAACAGGACGGTAAATAGTACAAGATACACTGTAGATCAGTACGGACGTTTCACGTCTGCATTGACTATTCCTATTGCTACCGCTCGTGAAGGTAGCAAGTATCCTAACTATGATGCAGCAACAACCTATTCTAGATATGCAATTATCCAGAATGCGTCCAAAGTTTACCAAGCACTTACAACAATTAACGCTGGCGCTGGTGCTCCTACTCATTCCAGTGGCGATACTGGATCATGGCGCTACCTCGCGGCTGAAGCCACGGAACAGAAGGGACTGGCTAGCTTTGCACAGGAAGATTTTGACGTTGACAGCAACGGGCACGTTACCATCGCCGCCGCAGGCGTAGACAATACACAACTACAAAATAATCTTCTAAGATTTGCTGACGGAAACGCTACAGAAGATTTTGAATTAGATAACGAATTAACTTCAACAACTGGTTATAGAGGATTTAATAAACTTAATTATGTTAAAGTCAACGATACTAGTGGTAATCTGCTGGTTGGCCTTAATAACACTGGCGATGGTGGAGCGGGGGAACTTGATGTCAATGTAAGATCATACTTCTCTGATCCTGACGTAACCTTTGATGGTGCTGTACAGCAAGCAATCAATAAAACTGGTGATGGAGATTTCCAAATTCTACATCAACAGAACACTGCGTCTGCTAGAACTTTTGCAATTGCTGCTCAAAACAGTGGTTCTGGAAATAGTCAGGTTGCAATCAGTGCTGAGAACGTTGTTTCAATTGATGCAACTGATTCTGCTGGTAAGGTTCATATTGAAGACCTTAGAATTCAGGACAACTATCTAGCAAGCACAGGACAACTTAATCTTGATCCTGGCGATGATCGTACGAATGCTGGTTTAGTTCGTATCTTTGGTGATTTACAAATTGACGGTACTACTACCACAGTAAACTCCACTACTATGACAGTGGATGATGTTACTATTCTTCTCGGTGGTGATACTGCTCCTGCATCTGACGATAACCTTGATAGAGGTATTGAGTTTAGATACTATGATACTCAAGCACGTCTTGGTTTCTATGGATGGGATACAAGTTATACAGATTTAAGTGGTCATGAGGGTGGATATCGTTTCCTTCATGCTGCTACTAATACTGGTGAAGTTTTCGCTGGTACTGATTCTGGTATCATTGCAGGTAACTTAAAACTCACAACAAATACAAACTCAACATCTAATACTACTGGAGACTTGGTAGTTCTCGGTGGTGCAGGTATTGGTGATGATGTCAATATCGGTGGTTCAGTTGATATTGATACTAACCTCCGTATTCATGGTACATCTCGTTTTGATGATAACGTAGTCTTACAGGGTGCTTCTAAGACTCTGCAACTTAATAATGGATCTGGAACTACTAAGATTGAGTTTCAATCTACAAGTGGTAATGGTTCTCTTGCAGGTATCTTAGATGTAACTGGTAACTTTAACGTTAACTCTAACAAGTTTAACGTTGTTGCTGCCTCAGGTAATACTTCTATCGCTGGTACTCTTGCAGTAACACAAGGTACTACGATGAGTGCTGGTCTTGATCTGAACAGCACACTGAATGTATCAAACACTGTATACTTTGAAGATACTAACGAACCTACATGGGCAAAGAATAGTGGCACTGGTCTTTGGGAAATTCAATCCAATGACTACGGTGCATTCCGATTTGATGGTGGTGGTTACGTTGCTGGTGACTTCATGTTTGATAGTGACGTTGTTATCAACGGTACTATCCTTCAGAGAGATGATGCTACTGAGACATTTAACGAACAGAACTACCTAAGAGTTCGTCGTAAACTATTTGTTGGTAATATTCAAGCACTGACACCTAGTTACGCTTCTCATAGTAATACAAACTTGAGAGTTTACGGTGGTGCTGGTATTCAAACTGATCTCCATATTGGTGACGATCTTTACATTGGTAAATTAAACAGTAATGATAGTGTTAAGTTCCAAGTTCTAGGTGAGAGTGGTAATACAACTATTCAGGGTACATTACTTGTTGAAAATAATACAAACTTCAATGGTACTCTTGATGTTGACGCAGACTTTGCTGTTAGAAACGGAACTACTGACAAGTTCTTTGTTGACAATGTAACTGGTAACACAGATATTCAAGGCACTCTGGATGTTAACGGTGCAACTGAAATCACTAACACCTTAGATGTTAGCAATGCTGTTACCTTTGACCAGACACTTACAGTACAAGGTAATTCTGAATTCAACGGAACTGTAGATGTTGATGCAAACTTTGCAGTCAGATCAGGTTCAACTGATAAGATGACTGTTGCATCTTCTACAGGTAACATTGCAACTGATGGAACTTTAGTTGTTCAAGGTCAGACAACTATCAATGATTCTCTGATTGTACAAGCATCTAATGAATTCTTTAAGGTTCAGAATGGTAGTTCTGCAGATAGATTTACTATTGATACTGATAATGGTAACACCTCTGTTATTGGTACTCTTACAGTTTCCCAAGCAACTGACCTTAATAATACTCTTAACGTTGCTGGTATTACAACGTTTGAAAATAATACTGATCAAAATATTACCAACGTATCTTATAGTGCCGATGGTGCTGTAAGAATTGACGGTGGTGTAGGTATTGATAAGAAACTTGCTGTAGGCGGTGCTTCAAGATTCTATGGAACTGCTGAGTTTAGTTCCGATCTTGACATTAATGCTGCTGCAGATATTTCTGGCAACCTTACTATTAGTAATGGAAACCAAGTTACTAGTTTTGCTGACACTACAGTTGCTCTTAAAGTTACTGGTGGTGCGAGAATTAACAAAAACTTGATGACTGGTGGAGACTTCACCGTTTATGATAATTCTGGTGGTCTTAATAGTTTCCTTGTAGAAGTTGCTACTGGTGATGCTACCTTGAGAAATGACTTGGTAGTCGGTGGTAACTTAACTGTTAATGGTACGACTACAACCGTTAATAGCACTACGGTCACACTAGATGATCCTATCATGACACTGGGTGGAGATACCGCTCCAGTATCTGATGATAACAAAGACCGTGGTATTGAATTTAGATATTACGATACTCAAGCAAGACTTGGATTCATTGGTTTTGATAACAACCTAGAGAAGTTTAGATTCCTTGTTAATGCCACAAACTCCAGTGAAGTATTCTCTGGTACTGATGGTTCTTTACAGGCAGGTACATTAAACCTTACTGGTTCTGGTACTGCACTTGACGTTGATAATAATGCAAACATTGACGGAACTCTAACCGTTGATGGTGTAATTACATCTACTAAGACATCTGGTGCTCCTTTCGTAGTTAACTCTACTTCTAAGGTCACTAATCTTAACGCAGATCTCTTAGATGGAATGACAACTGCTGCTACTAATACAGTATCTACAGTTGTTGCTCGTGATTCTTCTGGTAACTTTGCTGCTGGAACTATCACTGCTGCTCTGGTTGGTAACTCTTCTACCGCAACTGCTCTTGAAACTGCAAGAAACATTGCAGTTGCTGGCGTTGTTTCTGGTACTGTGTCGTTTGATGGTACTTCAGACGTATCTATCACAACTTCATTTGTTGACGCTGATGTGGCTGCTTTAGCAGCTATGTCTGGTACTGGTATGGTTACCAGAACTGCAGGAAATACTTACGCGCAGCGTACACTTTCCAAGTCTGGTGCTGGTATTACAATCACTAATGGTGATGGTGTTTCTGGCAATCCTACTATCAATATTCAGTCTGCATCTACTAATAGTGCATCTAATCTCGTTCTTCGTGATGCGTCTGGTAACTTCTCAGCAGGCACTGTTACTGCAAACTTGACTGGTAACGTTACTGGTAATGTGACTGGTACAGTTTCTGATATTAGTAACCACGATACTGATGATCTTAGCGAAGGATCTACTAATGTCTACTATACAAATGCTCGTGCTGACGCTAGAGTTAATTTGCAGACTGGTGCAAACCTCAGTCTTGCTAATAAGACTACGACTGATCTTGCTGAGGGAACTAATCAATATTATACAGAAGCAAGAGTACAAGCAAAACTTGATAATGCATACGAGCAACTTAGAGCAATGCTTACCAACCTTGCGACTTCTACCACATTAACGTTGAATCTCTCTGGAGACCCAACACCTGGTGCTGTTGTTGCAATCGGTGCTATTCAAAACAACGGTATTGGTGGATTTAGTAACTCTACTGGTCTTGCTACTGGTGGGGGTAGCGGAACTAGTTTGACTGTGGATCTTACAACATCCGCTGGTGCGATTACTGGAATTGCCATTAATACACCTGGTACAAACTACACAACCTCTGATACCATCACTATCACTAACCCGAATGCTGGTGGTGTGAATGCATTCAACTTTGGATCTCTTTCTGCTGGTACTAACTACGTTTCAACTAACAATGTGTTAACCACTGGTGGTAGCGGAACTGGATTGAGAGTTAACTTTACTGCTGGTTCTGGTAACGTTACTAACGTGACTGTGGCATCGGCAGGATCTGGATATGTAAATGGTGAGACAGTCACCATCCCGAACGATGGTGCTGCCAGTGCATCTATCACTGCTGCTGGTACTGGTTATAGCGTTGACAGTCTCGTATCTACCACAGGTGGAACTGGATCTGGTTTGACAATCTCTATTGACACTGTGAATCCTGGAACGGGTGCTATTACAGGACTCTCTATTGTAAGCGGTGGTCATGGATATACTGCCAGTGATGTTATTACTGTCTCTGGTGGTAATGGTGATGCAACATTTACTATTGGTAGTGTCCATGCTGGTAATGCAACCATTGACATCTCTCAGGTGTTTACTAATGCAACATTCGCACTTAGTGACGTTACTGAGATGGAAGTCGGTGCAACTGTCACTGGTGCTACATCTGGTACTACAGCAAGAATTAGTTCTCTCGGTGCTACTGCAATTACTGTTGATAATGTTGACGGATTCTTCAAGAAAGGAGAAGTCGTCAGTGCAAATGACGTTACTACTCTAACTATCTCCTCATTCTCCTGA

Genome Context

Genome Context

Tertiary structure

PDB ID
dd02d6389bd49c63f0e729d09fd6217863ed43d076c92492f979fd73a7bb4cd0
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5553
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage S-SSM4 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B. 2011-09-23 GenBank