Genbank accession
AET72643.1 [GenBank]
Protein name
fiber protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,85
TSP
Evidence RBPdetect2
Probability 0,77
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MSLTRLKNIITSRTGRIIYVNPDDFDASDAIDNRGNSALRPFKSLQRAFLEVARFSYRVGLSNDEFDAFSIMLYPAEYIVDNRPGEVLYTNVAPIDSNSNLDLTSPNNVLYKFNSVEGGIIVPRGCSLVGTDLRRTKIIPKYVPYPTSYGTEILEGQEPPRTSIFKVTGGTYFWQFSFFDGAEEGVYYRPDSTNTLAPKFSHHRLTCFEFADGLNSLSQLITDGNVPSGDYSAVPNILERTDLEIYYQKISKAFATIPDTSGDPATDQIQARVEENRIVGPISDEYRILQITRNGQTATAVTVDELDNPRDHGFSVGVNINISGVTGSTGPNSELDVGRYNGSFTVTSASGNVFTYQMQEEPSGNAVGSNITVKTEIDTVDSASPYAFNLSLRSVWGMNGMHADGSKATGFKSMVVAQFTGLSLQKDDRAFVRYNASTGNYDAAVAGDGAHLDGFAEYRKGWAHEHIKCSNDSFIQAVSVFAVGYGTHFTALSGADMSITNSNSNFGNTALRSAGFKAKAFSKDKAGEITHIIPPKALNVISTSATGTNGASSITLTNDGSVNGVLQGMIVSGENIGSGATVGSVNTTTGVVTLTASNTGTVNGNVIFGEETSINWVNVDIQRTKVINQALSGQGGTPGTRLYLFGYQNETSPPTTRVQGYTIGARQDGIGVNAVADKINVQLVAQGATEPTVQSALISPYGPSVSGLDAGVAGSPLQFDSATYTISGVAGSVGGWYLTTSATNNAIYQTIANNSGAGGTYQNIAFTPTTFIKRIPDSRDLQDRTYRVRYVIDKDKSNPLPRDPLSGYVVQPLNTDTTSYKLQRTFYIYDIEIVQEFERGISDGIYYLTLLCASIAPSTSNFNDRKFSQNVNEVYPTFDRDNPLADPDAAISVADNETIGLVSATDGASPTPNKDPKLSITKEGIQFLLTDTGWELPGTEPAYESVPKELSNVRVTARAGNEETRKINIRQNAEGVVAPIPVELRRHSIMRSGNHTFEYLGFGPGNYSTAFPQTQVETLSQDQIKFSQSIKEEAGVAFYSGLNSNGDLFIGNQIINPVTGQITNEDVAQLNVVGEENTTIETFSELVLTDKLTVIGGASNQLESIFAGPVTFQGQLSSTNNIIAKKITYNNQDGTVIKQTLLAPEDANGQPNFTNISGYDTPADGDLVYNINWNPGKSLGWIYYEGTWYEFGLTDVGDLNIVNDNGTTRFGLGVAPLSPYVLNVGGSTRVDGDLVVTGRGGVGSDKYVTKSYTGDGSTLTFAVTTYTGGIQHTDDSVLVFLNGVAQIAGTNYTVDSNGANVVFSSGDAPQTTDTVHILELPI
Physico‐chemical
properties
protein length:1322 AA
molecular weight: 141977,34350 Da
isoelectric point:4,72965
aromaticity:0,09077
hydropathy:-0,25787

Domains

Domains [InterPro]

No domain annotations available.

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage S-CAM8
[NCBI]
754038 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Synechococcus sp. WH 7803
[NCBI]
32051 Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AET72643.1 [NCBI]
Genbank nucleotide accession
JF974299 [NCBI]
CDS location
range 22899 -> 26867
strand +
CDS
ATGTCTCTAACTAGACTTAAGAATATTATTACGTCCCGCACGGGACGTATTATTTACGTTAACCCTGACGATTTTGATGCATCTGATGCTATTGATAACAGGGGTAACTCGGCATTGCGTCCATTTAAGTCTCTGCAACGAGCATTTTTAGAAGTTGCTAGATTTTCGTATCGAGTAGGTTTGTCAAACGATGAATTTGACGCCTTCTCGATCATGCTGTATCCAGCAGAATATATTGTTGATAATAGACCTGGAGAGGTTCTTTATACTAACGTTGCTCCTATTGATTCTAACTCAAACTTAGATCTTACCTCACCAAACAACGTATTATATAAGTTTAACTCGGTTGAAGGTGGTATCATTGTTCCTAGAGGTTGCTCCCTCGTTGGTACTGATCTTCGTCGTACAAAAATTATTCCCAAATATGTTCCTTATCCTACAAGTTACGGAACAGAAATTTTAGAAGGTCAAGAACCTCCTCGTACTTCTATTTTCAAAGTAACTGGTGGTACGTACTTCTGGCAGTTTTCATTCTTTGATGGTGCTGAAGAGGGTGTATATTATAGACCTGATAGTACAAATACTCTTGCTCCTAAGTTCTCTCATCATAGACTAACTTGTTTTGAGTTTGCTGATGGTCTTAACAGTTTATCTCAGTTAATTACTGACGGAAATGTACCCTCTGGAGATTATTCTGCTGTTCCTAATATCTTAGAAAGAACAGATTTGGAGATTTACTATCAAAAAATCTCCAAGGCATTTGCTACTATTCCTGATACATCTGGAGATCCTGCAACTGACCAAATTCAGGCAAGAGTTGAAGAAAATAGAATTGTTGGTCCTATTTCCGATGAATATAGAATTCTTCAAATTACTCGTAATGGTCAAACTGCAACTGCGGTTACTGTTGATGAACTTGATAATCCAAGAGATCACGGTTTCTCTGTAGGTGTTAATATTAATATTAGTGGTGTTACTGGATCTACTGGACCAAACTCTGAATTGGATGTTGGTAGATATAATGGTTCATTCACTGTAACTTCTGCATCTGGTAATGTGTTTACCTATCAGATGCAAGAAGAACCGTCTGGTAATGCTGTAGGTTCTAACATCACTGTTAAGACTGAGATTGATACTGTTGACTCTGCATCACCATATGCGTTTAACTTGTCACTGAGAAGTGTCTGGGGCATGAATGGTATGCACGCTGATGGTAGTAAGGCAACTGGTTTCAAATCAATGGTTGTTGCTCAGTTCACTGGATTGTCCCTCCAAAAAGATGATAGAGCATTCGTAAGATATAATGCTTCTACTGGTAACTATGATGCAGCAGTTGCTGGTGATGGTGCTCACTTAGATGGTTTTGCTGAGTATCGTAAGGGTTGGGCACACGAGCATATTAAGTGTAGTAATGACTCATTCATTCAGGCAGTTTCGGTGTTTGCTGTTGGATACGGCACACACTTTACAGCACTCAGTGGTGCTGACATGTCGATTACAAACTCTAACAGTAACTTTGGAAACACTGCTTTAAGATCTGCTGGTTTTAAAGCAAAAGCATTCTCTAAAGATAAAGCAGGCGAGATCACACATATCATCCCTCCTAAGGCACTAAATGTTATCTCAACATCTGCCACAGGTACTAATGGTGCATCTTCCATCACACTTACAAATGATGGTAGTGTAAATGGCGTTCTTCAGGGAATGATCGTAAGTGGTGAAAATATTGGTTCTGGTGCAACTGTAGGTTCTGTCAATACTACTACTGGAGTTGTTACACTCACTGCTTCTAATACAGGAACTGTTAATGGCAATGTTATCTTTGGTGAAGAAACTTCTATTAACTGGGTTAACGTTGACATTCAAAGAACCAAAGTAATTAACCAAGCACTTTCTGGTCAGGGTGGAACTCCTGGTACAAGATTATATCTCTTTGGATATCAGAACGAAACGTCTCCACCTACAACAAGAGTTCAAGGTTATACTATTGGTGCTCGTCAAGATGGTATAGGTGTAAATGCTGTTGCTGATAAAATTAATGTTCAATTAGTTGCTCAAGGTGCAACCGAACCTACCGTACAATCAGCATTAATTTCTCCTTATGGTCCAAGTGTTTCAGGTTTAGATGCAGGGGTAGCAGGTTCTCCGCTACAATTTGATAGTGCAACATATACTATTAGTGGCGTTGCTGGATCTGTAGGTGGTTGGTATTTGACCACAAGTGCTACAAATAATGCAATTTATCAAACTATTGCTAATAATAGTGGTGCTGGTGGCACTTATCAAAATATTGCATTTACACCTACAACATTCATTAAGAGAATTCCTGACAGCAGAGACTTGCAGGATAGGACTTATCGTGTTCGTTATGTAATCGATAAAGACAAGAGCAATCCCTTGCCTCGTGATCCCCTATCAGGTTATGTTGTGCAACCTCTGAATACGGATACTACATCCTATAAGTTACAGAGAACATTCTATATCTACGACATTGAAATTGTTCAGGAATTTGAACGAGGTATTTCCGATGGCATCTACTACCTTACCCTGCTTTGTGCATCTATTGCACCTTCAACTTCTAATTTTAACGACAGAAAGTTCAGTCAAAACGTCAACGAAGTCTATCCTACGTTTGACAGAGACAACCCTCTTGCTGACCCTGATGCTGCAATATCCGTCGCTGACAATGAAACTATCGGTCTCGTAAGTGCAACTGATGGTGCATCACCTACACCTAATAAAGATCCCAAACTGTCTATTACTAAAGAAGGAATTCAATTCCTTTTGACTGATACTGGTTGGGAATTGCCTGGAACAGAACCTGCGTATGAATCTGTTCCTAAAGAACTTTCTAATGTCAGAGTAACTGCTCGTGCTGGTAATGAAGAAACAAGAAAGATTAATATTCGTCAGAATGCTGAAGGTGTTGTAGCACCTATCCCAGTAGAACTTAGAAGGCATTCTATTATGCGTTCTGGTAACCATACCTTTGAGTATCTTGGTTTCGGTCCTGGTAACTACTCAACTGCATTCCCTCAGACACAAGTAGAAACGTTATCACAAGACCAGATTAAGTTCTCTCAGTCTATTAAAGAGGAAGCAGGTGTTGCATTCTACTCAGGTCTAAACTCTAATGGAGACCTATTCATTGGTAACCAGATTATTAACCCTGTTACGGGTCAGATTACGAATGAAGATGTTGCTCAATTGAATGTTGTTGGTGAAGAGAATACAACAATTGAAACATTCTCTGAGTTGGTTCTTACTGATAAACTCACCGTTATTGGTGGTGCATCTAACCAGTTAGAATCAATCTTTGCTGGTCCTGTTACTTTCCAAGGTCAATTATCTTCTACTAACAATATCATTGCTAAGAAGATCACTTACAATAACCAAGATGGTACTGTAATTAAGCAGACTCTTCTTGCACCTGAAGATGCTAATGGTCAACCTAATTTTACTAATATCTCAGGATACGATACTCCTGCTGATGGAGATTTAGTTTACAACATTAACTGGAACCCTGGTAAATCTCTTGGTTGGATTTACTACGAAGGAACTTGGTATGAGTTTGGATTGACTGATGTTGGTGATCTTAATATTGTTAATGACAATGGCACCACACGTTTTGGTCTTGGTGTTGCCCCATTATCACCTTATGTATTGAATGTTGGTGGCAGCACTAGAGTTGATGGTGACTTAGTTGTTACTGGACGAGGTGGCGTTGGTTCTGACAAGTATGTTACCAAGTCTTATACTGGTGACGGATCAACTCTAACATTCGCTGTTACTACGTACACTGGTGGTATTCAGCATACTGATGATTCTGTCCTAGTATTCCTGAATGGTGTTGCACAGATTGCTGGTACAAACTATACAGTTGATTCTAATGGTGCTAACGTTGTCTTTAGTTCTGGAGATGCACCACAAACTACAGACACAGTTCACATTTTAGAACTACCTATCTAA

Tertiary structure

PDB ID
e62163aa8ccc61066a3cb833bec8d5ea966c99d545838043d962103709f41f24
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,3799
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Synechococcus phage S-CAM8 0608SB47 Henn,M.R., Martiny,J., Weihe,C., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank