Genbank accession
ADO99684.1 [GenBank]
Protein name
YadA domain-containing structural protein
RBP type
TF
Evidence RBPdetect2
Probability 0,93
Protein sequence
MANRIQLRRGGAQEWANANPTLAQGELGIELDTGRFKIGDGATAWNTLRYERPVESNTNTPNSLVQRDADGSFSAGTITSTLIGNASTSTRLEQTRQIQLSNDVTATGNFDGSQNLNLSTALSLINTLPHYLEGGLSTTTRTFTEVTVDQKGRVINARTPAQLNLADYGLDGSATSDTTLAQPWNANLEAISDETGTGLYSKTAAGVVETRLITGAAGQIVITDGGGISGNPLVSLSVQANVVPGDYNTESLTSVSQAGSGGEPFGTETVNATKFSVDDKGRLTTVTNVPIATATEGSKYAAYAAGTTYVRYDIIEDSSRVYQAITGIAAGGGAPTHTDGSDAGGWRYLAAAAVEQKGLASFAQEDFDVDANGHVTIAAVGVDNTQLQNNRVSFADGNTKEDFELDQELTATTGYRGFNYLNYLKVNDTSGNLLFGANNTGDSGAGELDVNVRSYFSDADITLDGALNQTLDKTGDGDLTFQLSQNTATNRNFNILTTNAGDGTSNIIITAEDTVQISASEATGKVHVEDYRFQENYLGTTDATMHLDPGDDRAITGLVRIHGNLQIDGTTTTVNSTQLTVDDVTILLGGDTVPTTDDNLDRGIEFNYYDTEARLGFYGWDTNYSDLGGHAGGYRFLHAATNTNEVFTGTDSGIIAGNLKLTTGTASSSNTTGDLVVAGGVGITGAVNIGGLLDVDSTLRVTSTSRFDDNVVLQGASKTLQLNNGSGTTKIEFQSTTGNGSLAGILDVTGNFNVNTNKFNVVAASGNTSIAGTLGVTNIATFSNDIDANANMTLAGDLHMESTNDITVAKNVGTGVWEIQSNDYGALRLDGGAYVAGDALIDGTLHVNGAIEVQDSATETESRLNWLRVRYRGRFGDTYQATPSYASHNTTTIRAHGGAGIERTLHVGGTGSGEGLFVGKRYSGDTVKFSVLGATGNTDIQGTFDVAGNSEFNGTVDVDADFAVRNGTTDKFFVDNVTGNTDIQGTLDVNGATEITNTLDVSNAVTFDQTLLVQGNSEFNGTVDVDANFAVRSGSTDKMTVASSSGNIATDGTLVVQGQTTINDSLIVDAANEVFSVRNGSAVEKFGVDADNGNTNIIGTLTVGDATQINDTFGASGIVTLTNNTEQTLTGSYGADGALRLTGGAAVQRNLAVGGAARVYGNTELTGTLDLNNSADISGALVTHDNVTITADNKTFAIQNASAANKFTVDTDNGNTDLRGTLDIGGDVTAESNLTVTGNLTINGTTTTVNSTVTTIDDPIITVGGDTAPASNDGKDRGVEFRYYDSSAKIGFFGYDRSANQFAFVVDATNSSEVLSGTDGNLRAGSLNLTGAGTALDVDANANIDGTLTVDGQIISQVSSGAALVIPNTTKINNLNADLLDSMTTASAATATTVVARDSSGDFAANIITVASGVGAAAGIQGNALTADTLKTARNITVAGVVSGDAEFNGSGDITITTTYVDADITALAAMAGTGFVSRTAANTYAQRTLAVTASSGITLTNADGVSGNPTINVASTASNSANNLVLRDASGDFAAGTITAALVGNVTGQTSDISNHDTGDLSEGSNLYFTNERVDDRVNALIVAGTGVTKAYNDSAGTYTLTVTQADIDTDNVTEGSTNLFTTAARTRTHFTYGTGIELSGAGALSVTQADIDTDNVTEGSTNIFYTEARFNTSLATKDTDDVSEGSSNLYFTNTRADTRADLRVAAATGANLDLSSKSTTNLSEGTNQYYTEARVQDKLDNAFAQLSAMLNNLATATTLVLNLSGDPTPGDVTTLNNGTLSGGTLYNTGTAVATTSSGSGTGLTVDITASGGAITAVAINAAGSGYVVGETITISTGGGDATINVSAVTEMAIGDTVTGSTSGTTGVITAVGATSVTVDTVDGFFKKTETVSAGDVSTLTITSFA
Physico‐chemical
properties
protein length:1907 AA
molecular weight: 196017,26100 Da
isoelectric point:4,20133
aromaticity:0,05873
hydropathy:-0,16287

Domains

Domains [InterPro]
IPR041352
ATT
5–43
ADO99684.1
1 1907
Architecture
ATT
STR
STR
RBD
ATT 4-43 | STR 44-202 | STR 345-1578 | RBD 1643-1907
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Prochlorococcus phage Syn33
[NCBI]
444878 Uroviricota > Caudoviricetes > Pantevenvirales > Brizovirus > Brizovirus syn33
Host Synechococcus sp. WH 7803
[NCBI]
32051 Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
ADO99684.1 [NCBI]
Genbank nucleotide accession
GU071108 [NCBI]
CDS location
range 88573 -> 94296
strand +
CDS
ATGGCAAATAGAATACAGTTAAGACGCGGTGGTGCTCAGGAATGGGCAAACGCGAATCCAACTCTTGCACAGGGTGAACTTGGAATTGAACTTGATACTGGTCGGTTCAAAATCGGTGATGGTGCAACGGCATGGAACACGCTGAGATATGAGCGTCCTGTAGAGTCCAACACTAATACTCCAAACAGTCTTGTACAGAGAGACGCAGACGGAAGTTTTTCTGCGGGTACTATTACATCAACTCTTATTGGTAATGCTTCAACATCAACTAGACTTGAACAGACTAGACAGATTCAGTTATCTAATGATGTAACAGCGACTGGTAACTTTGATGGTTCCCAAAACTTAAATCTAAGTACTGCTTTATCACTGATCAATACTCTTCCTCATTACTTGGAAGGTGGTCTAAGCACTACTACTAGAACTTTTACTGAGGTTACTGTTGATCAGAAAGGTAGAGTTATAAATGCTAGAACTCCTGCTCAACTAAATCTTGCTGATTATGGTCTTGATGGTTCTGCAACTAGTGATACAACTTTAGCACAACCTTGGAATGCTAACTTAGAAGCAATCTCAGACGAAACTGGTACTGGTTTATATTCAAAAACTGCAGCTGGTGTTGTTGAGACCAGACTTATTACTGGTGCTGCTGGTCAAATTGTTATCACTGACGGCGGTGGTATTAGTGGCAATCCTCTTGTCTCATTGTCGGTTCAAGCAAACGTTGTTCCTGGAGACTATAATACAGAATCTCTCACTTCAGTATCTCAAGCTGGTAGTGGTGGAGAACCTTTTGGTACAGAGACTGTTAATGCTACTAAGTTCTCTGTTGACGATAAAGGACGTTTAACAACCGTAACGAATGTACCTATTGCTACTGCTACCGAGGGTAGTAAGTATGCGGCATATGCAGCAGGTACAACATATGTTAGATATGATATCATTGAAGATAGTAGTAGAGTATATCAAGCAATTACAGGAATTGCTGCAGGTGGTGGCGCTCCAACTCATACTGATGGTTCAGATGCTGGTGGGTGGAGATATCTTGCTGCTGCAGCAGTAGAGCAGAAAGGACTTGCTTCTTTTGCACAAGAAGATTTTGATGTTGATGCTAACGGACATGTAACTATTGCTGCCGTTGGTGTTGATAATACACAACTACAGAATAATAGAGTTTCTTTTGCTGATGGAAATACAAAAGAAGATTTTGAACTGGATCAGGAACTTACTGCAACCACTGGATACAGAGGATTCAATTATCTTAACTATCTTAAAGTTAATGATACGAGCGGTAATCTACTGTTTGGCGCTAATAATACGGGGGACAGCGGAGCTGGCGAACTTGATGTTAATGTACGGTCGTATTTCTCTGACGCTGATATTACTCTTGACGGCGCTCTTAATCAGACACTGGATAAGACTGGGGATGGTGACCTTACCTTCCAGTTAAGTCAGAATACTGCTACAAATAGAAACTTTAATATTCTGACAACTAATGCTGGAGATGGAACCAGCAATATTATTATTACTGCTGAAGATACCGTACAGATTAGTGCATCGGAAGCAACTGGTAAGGTCCATGTAGAGGATTATAGATTCCAGGAAAACTACCTTGGAACTACAGATGCAACTATGCATTTAGATCCAGGTGATGATCGTGCGATAACTGGTCTTGTTCGTATTCATGGCAATCTCCAGATTGATGGCACTACAACTACAGTAAATTCTACACAACTAACTGTAGATGATGTCACAATTTTGCTTGGTGGCGATACTGTCCCTACAACTGATGACAACTTAGATCGTGGTATTGAATTCAACTATTATGATACTGAAGCACGCTTAGGTTTCTACGGTTGGGATACCAATTATTCCGATTTAGGTGGTCATGCAGGCGGATATCGTTTCCTTCATGCTGCCACAAATACCAACGAAGTCTTTACGGGTACTGATTCTGGTATTATTGCAGGTAATTTAAAACTTACAACTGGCACAGCATCTTCATCGAATACAACTGGTGATCTGGTTGTTGCTGGTGGTGTAGGCATCACTGGTGCAGTCAATATCGGTGGTCTTCTAGATGTTGATAGTACATTGCGTGTTACTAGCACCTCTCGTTTCGACGATAATGTAGTTCTGCAGGGTGCTTCTAAGACACTGCAACTGAATAATGGTAGTGGTACAACTAAGATTGAATTCCAATCTACAACTGGTAACGGATCTCTTGCTGGTATTCTGGATGTAACTGGAAACTTCAATGTTAATACTAATAAGTTTAATGTTGTTGCTGCTTCTGGCAATACCTCTATTGCTGGCACATTGGGTGTTACAAACATTGCAACGTTCTCTAACGACATTGATGCTAACGCCAACATGACATTGGCTGGTGACCTCCACATGGAGAGCACTAATGACATTACGGTTGCTAAGAATGTTGGCACTGGTGTTTGGGAGATTCAATCTAACGACTATGGTGCTCTCCGTCTTGATGGGGGCGCATATGTTGCTGGTGATGCACTGATTGATGGCACCCTACACGTTAACGGTGCTATTGAAGTTCAAGATAGTGCAACAGAGACTGAATCTAGACTGAACTGGTTGAGAGTTAGGTATAGAGGTCGTTTCGGTGACACTTATCAGGCAACTCCTTCCTATGCATCTCACAATACTACAACTATCAGAGCACATGGTGGTGCTGGTATTGAAAGAACTCTACATGTTGGTGGCACAGGATCTGGTGAAGGTCTGTTTGTTGGTAAGAGATACTCTGGTGATACAGTTAAGTTTAGCGTTTTAGGTGCAACTGGTAATACTGACATTCAAGGCACATTCGATGTTGCTGGTAACTCCGAGTTCAATGGCACAGTTGATGTTGATGCAGACTTTGCTGTAAGAAATGGCACAACGGATAAATTCTTTGTTGATAATGTAACTGGCAACACCGATATCCAAGGCACTCTGGATGTCAATGGTGCAACTGAGATTACAAATACTCTGGATGTTAGCAACGCTGTTACATTCGACCAGACACTGTTAGTCCAAGGCAACTCTGAGTTTAACGGTACTGTTGATGTTGATGCTAACTTCGCTGTAAGAAGTGGTAGCACGGATAAGATGACCGTTGCTTCTTCTTCAGGTAACATTGCAACTGACGGCACACTGGTTGTCCAAGGTCAAACAACCATCAACGATTCACTGATTGTTGATGCTGCTAATGAAGTCTTCTCTGTCAGAAACGGATCTGCTGTTGAGAAGTTTGGTGTTGATGCTGATAACGGTAATACAAATATCATCGGCACACTGACCGTTGGTGATGCAACTCAGATTAATGACACCTTCGGTGCATCTGGTATTGTCACACTTACCAATAACACTGAGCAAACTCTGACAGGTAGTTATGGTGCTGATGGTGCTCTAAGACTTACTGGTGGTGCTGCTGTCCAAAGAAACCTCGCTGTTGGTGGTGCTGCAAGAGTCTACGGCAACACTGAACTGACTGGTACTCTCGACCTTAACAATAGTGCAGACATCTCTGGTGCTTTAGTAACACATGACAATGTTACGATTACTGCAGACAATAAGACATTTGCAATTCAGAATGCATCTGCTGCTAATAAATTTACGGTAGATACTGATAATGGAAACACTGATCTTCGTGGCACCTTAGACATCGGTGGTGATGTAACTGCTGAGTCCAATCTTACTGTTACTGGAAATCTTACTATCAATGGAACGACAACTACTGTCAACTCTACGGTCACAACTATCGATGACCCTATTATTACTGTGGGTGGTGACACAGCACCAGCGTCTAACGACGGTAAGGATCGTGGTGTTGAGTTCCGTTATTACGACAGCTCTGCGAAAATTGGTTTCTTCGGATACGATAGATCCGCCAACCAATTCGCATTCGTAGTAGACGCAACTAATTCATCAGAAGTTCTTTCTGGTACTGACGGCAATCTTCGTGCTGGTAGTTTGAATCTTACTGGTGCTGGAACCGCACTCGATGTTGATGCAAATGCAAATATTGATGGCACTCTGACTGTAGATGGTCAAATCATCTCTCAGGTTTCTTCTGGTGCTGCTCTGGTCATTCCTAACACAACCAAGATTAACAACCTCAATGCTGACCTTCTGGACAGCATGACAACTGCTTCTGCAGCAACTGCAACTACTGTTGTTGCTCGTGACTCTAGTGGAGACTTTGCTGCAAATATCATTACGGTTGCTTCTGGTGTAGGTGCCGCTGCTGGTATTCAAGGTAATGCTCTTACTGCAGATACACTTAAAACGGCAAGAAACATCACAGTTGCTGGTGTTGTTTCTGGAGATGCTGAGTTTAATGGTTCTGGTGATATTACAATCACCACAACATATGTTGACGCAGACATCACTGCACTTGCTGCAATGGCAGGAACTGGTTTTGTTTCCAGAACTGCTGCCAATACATATGCTCAACGCACACTCGCTGTCACAGCATCTTCTGGTATTACACTGACAAATGCTGATGGGGTTTCTGGCAATCCAACCATTAACGTCGCTTCTACAGCAAGTAACTCAGCAAACAACCTCGTCCTTCGTGATGCATCTGGTGACTTTGCTGCTGGGACTATTACTGCAGCATTAGTTGGTAATGTTACTGGTCAAACATCTGATATTAGTAATCACGATACTGGAGACCTTTCTGAGGGATCCAATCTATACTTTACTAATGAGCGTGTTGATGACAGAGTTAATGCTCTGATTGTTGCGGGTACAGGTGTCACTAAGGCATATAACGATTCTGCAGGCACCTATACGCTTACTGTAACGCAGGCAGACATCGATACCGACAATGTAACCGAAGGTTCCACAAACCTCTTTACAACCGCTGCTAGGACCCGTACACACTTCACATATGGTACAGGTATTGAACTTAGCGGTGCAGGTGCTCTGAGTGTCACTCAGGCAGACATTGATACTGATAATGTAACTGAAGGTTCTACTAATATCTTCTACACGGAGGCACGCTTTAATACAAGTCTTGCAACTAAAGATACCGATGATGTGAGTGAAGGTTCTTCCAATCTATACTTCACTAATACTCGTGCAGATACCCGTGCTGATTTGAGAGTTGCAGCAGCAACTGGTGCAAACCTAGATCTTTCTAGTAAGTCTACCACCAATCTTTCTGAGGGTACAAATCAGTACTACACTGAAGCAAGAGTTCAAGATAAACTCGATAATGCGTTTGCTCAACTTAGTGCAATGCTCAATAATCTTGCAACCGCCACTACTTTAGTATTAAATCTATCTGGTGATCCTACACCTGGTGACGTAACTACTTTAAATAATGGCACATTATCTGGTGGTACATTGTATAACACTGGAACTGCAGTTGCTACCACCTCTAGCGGTAGTGGCACTGGATTAACAGTAGATATCACCGCATCTGGTGGTGCTATCACTGCAGTTGCTATCAACGCAGCAGGTTCTGGTTATGTAGTTGGTGAGACAATTACAATCTCTACTGGTGGTGGAGATGCCACAATAAATGTCTCTGCTGTTACTGAAATGGCAATTGGTGATACTGTCACAGGCAGTACATCAGGCACCACAGGTGTTATCACTGCTGTTGGTGCAACTTCAGTTACTGTTGACACTGTTGATGGATTCTTTAAGAAGACTGAGACAGTATCTGCTGGAGATGTTTCTACATTAACAATCACTTCATTCGCCTGA

Genome Context

Genome Context

Tertiary structure

PDB ID
a3de33d085214b69da85a67c4a7e71362c2943cf4df554179e2a1c1810a89630
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5367
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage Syn33 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Erlich,R., Young,S.K., Koehrsen,M., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Borenstein,D., Chen,Z., Engels,R., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heiman,D., Hepburn,T., Howarth,C., Jen,D., Larson,L., Lewis,B., Mehta,T., Park,D., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., Walk,T., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C., Galagan,J. and Birren,B. 2011-09-23 GenBank