Genbank accession
AOO02046.1 [GenBank]
Protein name
putative tail fiber protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,86
TSP
Evidence RBPdetect2
Probability 0,79
TF
Evidence Phold
Probability 1,00
Protein sequence
MSLTRLKNIITSRTGRIIYVNPDDFDASDAIDNRGNSALRPFKSIQRAFLEVARFSYRVGLSNDEFDAFSIMLYPAEYVIDNRPGKVLYTDVPPIDSNSNLDLTSPNNVLYYYNSVEGGVIVPRGCSLVGTDLRRTKIIPKYVPYPTTYTAKGINTEDDVPPRTAIFKVTGGTYFWQFSFFDGAEEGVYFKPDSTETLSPKFSHHRLTCFEFADGLNPLSKLISDGTVPNTDYSAVPNILERTDLDIYYQKVSKAFATIPDTSGDPTTDQIQARVEENRIVGPISDEYRVLQITRNGQTATAVTVDEFDNPRDHGFSVGVNINVSGVTGSTGPQSEVDATVFNGSFTVTSTPTGSTFTYQLASVPSGNAVGSNVTVKTEIDTVDSASPYAFNLSLRSVWGMNGMHANGAKATGFKSMVVAQFTGLSLQKDDRAFVRYNASTGNYDVATAGDGAHLDGFAEYRKGWGHEHIKCSNDSFIQAVSVFAVGYFGHFTAESGADMSITNSNSNFGNTALRSAGFKAKAFSKDKAAEITHIIPPKALNVISTTATGASGSPNITLANDGSINGVIEGMTVSGTNLAAGATVVSFNTNTRVITLSGNNTAAVDTNIIFGEETSVNWVNVDIQRTKVINSALSGQGGIAGSRLYLYGYVTEASPPTTKVQGFAIGSRQDGTGVDAIPDKLNVLLVANGASSATVQTAKISPYGPDVSNKAAGDTGSPLQYDSATYTINGQAGSVGGWYLSVDPNDNQIYTTLSTNSQYNNVNFTPTTFIKRIPDPRDLQDRTYRVRMVIDKDKTNPLPRDPLSGYVVQPLNSDTTSYNLNRTFYIYDIEVVQKFERGVKDGIYYITLLCASIAPSTSNFNDRKFSQNVNEVYPTFDRDNPVADPVAAISVADNETIGLVNATDGANPTPNKDPKLSITKEAIKFLLTDTGWTQPGTTPNYDSVNGRLSNVELTARAGNEETRKINIRENNDGTVAPINVEFRRHSILRSGNHTFEYLGFGPGNYSTAFPQTQVETLSADQVKFSQSIKEEAGVAFYSGLNSNGDLFIGNQIINPVTGQITNEDIAQLNVVGEENTTIQTFSELVLTDKLTVIGGASNQLESIFAGPVTFQAQTSFTNNLTAKKITYNNQDGTVIKQTLLAPADANGQPSFAAITGYDTPGNGDLVYNINWTPGQSLGWIYYNGTWHEFGLTDTGDINIDTFNNEQHIGIGTAAVSSFRVGILGSAKVDGDLVVTGRGGVGADKYVTKTYTGDGTTLTFAVTTYSGGIQHSDDSLLVFLNGVAQIAGTNYTVDANGANVVFSSGDAPQSTDTVHILELPI
Physico‐chemical
properties
protein length:1321 AA
molecular weight: 142057,41320 Da
isoelectric point:4,85583
aromaticity:0,09387
hydropathy:-0,26684

Domains

Domains [InterPro]

No domain annotations available.

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage S-RIM2
[NCBI]
687800 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AOO02046.1 [NCBI]
Genbank nucleotide accession
KX349247 [NCBI]
CDS location
range 22593 -> 26558
strand +
CDS
ATGTCTCTAACTAGACTTAAGAATATTATTACGTCCCGCACGGGACGTATTATTTACGTTAACCCTGACGACTTTGATGCTTCTGATGCTATTGACAACAGAGGCAACTCAGCATTGCGTCCGTTTAAGTCTATTCAAAGAGCATTTCTTGAAGTTGCTAGATTTTCGTATCGTGTTGGTCTGAGTAATGACGAATTCGATGCGTTCAGTATCATGCTCTACCCTGCAGAGTATGTGATCGATAACCGTCCTGGTAAAGTTCTTTATACTGATGTCCCTCCTATTGATTCTAACTCTAATCTGGACCTGACTTCACCTAATAATGTTTTGTATTATTACAACTCAGTAGAAGGAGGAGTCATTGTTCCCAGAGGTTGTTCGCTGGTTGGCACCGACTTACGTCGTACCAAGATTATTCCTAAGTACGTTCCTTATCCTACGACATATACTGCGAAGGGAATCAACACAGAGGATGATGTTCCTCCCCGCACCGCAATCTTCAAGGTCACAGGTGGTACATACTTCTGGCAGTTCTCCTTCTTCGATGGTGCTGAGGAAGGTGTATACTTCAAACCCGATAGCACTGAAACTCTTTCCCCCAAGTTCTCACACCATAGACTAACTTGCTTTGAGTTTGCTGATGGTCTCAATCCTCTTTCCAAGTTAATCTCTGACGGCACTGTTCCTAACACAGATTATTCTGCTGTGCCTAACATTCTAGAGAGAACTGACCTAGACATTTACTACCAGAAAGTATCGAAGGCATTCGCAACTATTCCTGATACATCTGGTGATCCTACTACTGACCAGATTCAGGCAAGGGTCGAAGAAAACAGAATCGTTGGTCCTATTTCCGATGAATACAGAGTCCTTCAGATCACAAGAAATGGTCAGACAGCAACGGCAGTTACTGTTGATGAGTTTGATAACCCCAGAGACCATGGATTTAGTGTTGGCGTCAACATTAACGTTTCAGGTGTTACTGGATCAACTGGACCGCAATCCGAAGTTGATGCAACAGTTTTTAACGGATCTTTCACCGTCACTTCGACGCCAACTGGTAGCACATTTACTTACCAGTTAGCATCTGTACCATCAGGTAATGCTGTTGGTTCTAATGTTACTGTTAAGACTGAAATTGATACTGTTGACTCTGCATCTCCATATGCATTCAACCTGTCACTGAGAAGTGTTTGGGGTATGAATGGTATGCACGCGAACGGTGCTAAGGCAACTGGTTTCAAATCGATGGTTGTTGCACAGTTCACGGGTCTATCTCTACAGAAAGATGATAGAGCGTTTGTAAGATATAATGCTTCTACTGGTAACTATGATGTAGCAACTGCTGGTGATGGTGCTCACCTGGATGGTTTTGCTGAGTATCGTAAAGGATGGGGACATGAGCACATTAAGTGTTCTAATGACTCCTTCATTCAGGCGGTTTCGGTCTTCGCTGTTGGATACTTCGGTCACTTCACTGCTGAAAGTGGTGCTGACATGTCAATCACCAACTCCAACAGTAACTTTGGAAACACTGCGTTAAGATCTGCTGGATTTAAGGCAAAAGCATTCTCCAAGGATAAAGCAGCAGAGATTACTCATATCATTCCACCTAAGGCACTGAACGTTATTTCGACAACTGCAACAGGTGCTTCAGGTTCGCCAAATATCACACTTGCTAATGATGGTAGCATCAACGGTGTTATCGAAGGTATGACAGTTTCTGGAACTAATCTTGCTGCTGGTGCTACTGTTGTTTCCTTCAACACTAACACTAGAGTTATCACACTGTCTGGAAATAATACAGCAGCAGTTGACACTAACATCATCTTTGGTGAAGAAACATCTGTCAACTGGGTTAACGTTGATATTCAACGCACTAAGGTAATCAACTCTGCACTTTCTGGTCAGGGTGGTATTGCTGGTTCTAGACTTTATCTCTATGGATATGTCACGGAAGCATCTCCTCCAACAACAAAGGTTCAAGGTTTTGCTATTGGATCACGTCAAGATGGCACAGGTGTTGATGCTATACCAGACAAACTGAATGTACTTTTGGTTGCTAATGGTGCATCTTCTGCAACAGTTCAGACTGCTAAGATTTCACCTTATGGTCCTGATGTTTCCAACAAAGCAGCAGGTGATACTGGTTCACCTCTGCAATATGATAGTGCAACATACACTATCAATGGTCAAGCAGGTTCCGTTGGTGGTTGGTATCTGAGTGTAGATCCTAACGATAATCAAATCTACACAACTCTTTCTACCAACTCACAGTACAACAACGTAAACTTCACCCCTACAACTTTCATTAAGAGGATTCCTGACCCTCGTGACCTGCAGGATAGAACATATCGTGTCCGCATGGTTATCGATAAGGATAAGACTAATCCTCTGCCTCGTGATCCTCTCAGCGGTTATGTTGTACAACCTCTGAATAGTGACACTACAAGTTACAATCTGAACAGAACATTCTATATCTACGATATCGAAGTTGTTCAGAAATTCGAGAGAGGCGTTAAAGATGGCATCTACTACATTACCTTGCTTTGTGCATCTATTGCACCTAGCACTTCTAACTTCAACGACAGGAAGTTCTCTCAAAACGTCAACGAAGTCTATCCTACGTTTGACAGAGACAACCCTGTTGCTGACCCTGTTGCTGCGATTTCCGTCGCTGACAACGAAACTATCGGTCTTGTAAATGCAACTGATGGTGCTAACCCTACACCCAACAAAGATCCCAAACTGTCTATTACTAAAGAAGCGATTAAGTTCCTTCTGACTGATACTGGTTGGACACAACCAGGTACAACACCCAACTATGACTCTGTTAATGGAAGACTATCTAATGTCGAACTAACTGCACGTGCTGGAAATGAAGAAACTAGGAAGATCAACATCCGCGAAAACAATGATGGGACTGTCGCACCTATCAATGTTGAGTTCAGGAGGCACTCGATCCTTAGATCTGGTAACCATACGTTTGAGTATCTTGGTTTCGGTCCTGGTAACTATTCAACTGCATTCCCTCAAACTCAGGTAGAAACTCTGAGTGCAGATCAGGTTAAGTTCTCTCAGTCGATTAAAGAAGAAGCAGGTGTTGCATTCTACTCTGGTCTGAACTCTAACGGTGACCTGTTTATTGGTAACCAGATTATCAACCCTGTTACAGGTCAGATTACTAATGAAGATATTGCACAGTTGAATGTTGTTGGTGAAGAAAACACTACGATTCAGACATTCTCTGAGTTGGTTCTTACCGACAAACTGACCGTTATTGGTGGTGCATCTAACCAGTTAGAATCTATCTTTGCTGGTCCTGTTACATTCCAAGCACAAACATCCTTTACTAATAATCTTACTGCCAAAAAGATTACTTATAACAACCAGGATGGTACGGTAATCAAGCAAACGTTACTCGCTCCCGCCGATGCAAATGGACAACCAAGTTTTGCTGCTATCACAGGATACGATACACCTGGTAATGGTGATCTTGTTTACAATATCAATTGGACACCTGGGCAGTCGCTTGGTTGGATTTATTACAATGGAACGTGGCACGAGTTTGGTCTCACGGATACTGGTGACATTAATATCGATACTTTCAATAATGAGCAACATATCGGTATTGGTACTGCTGCTGTATCTAGTTTCCGTGTTGGCATCCTCGGAAGCGCCAAAGTAGATGGTGACCTTGTTGTTACTGGACGAGGTGGTGTTGGTGCTGATAAGTATGTCACTAAGACATATACTGGTGACGGCACAACTCTGACATTTGCAGTTACTACCTATAGTGGTGGTATTCAGCATTCTGATGATTCACTGCTGGTATTCCTGAACGGTGTTGCACAGATTGCAGGTACAAACTACACAGTTGACGCTAACGGTGCAAACGTTGTATTCAGTTCTGGTGATGCACCACAATCTACAGATACAGTCCACATTTTAGAACTGCCTATCTAA

Tertiary structure

PDB ID
93fb323c03337deea993adea9469626c58545de2c0eaca59cd29654802143437
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,3670
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50