Genbank accession
AOO03543.1 [GenBank]
Protein name
putative tail fiber protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,86
TSP
Evidence RBPdetect2
Probability 0,78
TF
Evidence Phold
Probability 1,00
Protein sequence
MSLTRLKNIITSRTGRIIYVNPDDFDASDAIDNRGNSALRPFKSIQRAFLEVARFSYRVGLSNDEFDAFSIMLYPAEYVIDNRPGKVLYTDVPPIDSNSNLDLTSPNNVLYYYNSVEGGVIVPRGCSLVGTDLRRTKIIPKYVPYPTTYTAKGINTEDDVPPRTAIFKVTGGTYFWQFSFFDGAEEGVYFKPDSTETLSPKFSHHRLTCFEFADGLNPLSKLISDGTVPNTDYSAVPNILERTDLDIYYQKVSKAFATIPDTSGDPTTDQIQARVEENRIVGPISDEYRVLQITRNGQTATAVTVDEFDNPRDHGFSVGVNINVSGVTGSTGPQSEVDATVFNGSFTVTSTPTGSTFTYQLASVPSGNAVGSNVTVKTEIDTVDSASPYAFNLSLRSVWGMNGMHANGAKATGFKSMVVAQFTGLSLQKDDRAFVRYNASTGNYDVATAGDGAHLDGFAEYRKGWGHEHIKCSNDSFIQAVSVFAVGYFGHFTAESGADMSITNSNSNFGNTALRSAGFKAKAFSKDKAAEITHIIPPKALNVISTTATGASGSPNITLANDGSINGVIEGMTVSGTNLAAGATVVSFNTNTRVITLSGNNTAAVDTNIIFGEETSVNWVNVDIQRTKVINSALSGQGGIAGSRLYLYGYVTEASPPTTKVQGFAIGSRQDGTGVDAIPDKLNVLLVANGASSATVQTAKISPYGPDVSNKAAGDTGSPLQYDSATYTINGQAGSVGGWYLSVDPNDNQIYTTLSTNSQYNNVNFTPTTFIKRIPDPRDLQDRTYRVRMVIDKDKTNPLPRDPLSGYVVQPLNSDTTSYNLNRTFYIYDIEVVQKFERGVKDGIYYITLLCASIAPSTSNFNDRKFSQNVNEVYPTFDRDNPVADPVAAISVADNETIGLVNATDGANPTPNKDPKLSITKEAIKFLLTDTGWTQPGTTPNYDSVNGRLSNVELTARAGNEETRKINIRENNDGTVAPINVEFRRHSILRSGNHTFEYLGFGPGNYSTAFPQTQVETLSADQVKFSQSIKEEAGVAFYSGLNSNGDLFIGNQIINPVTGQITNEDIAQLNVVGEENTTIQTFSELVLTDKLTVIGGASNQLESIFAGPVTFQAQTSFTNNLTAKKITYNNQDGTVIKQTLLAPADANGQPSFAAITGYDTPGNGDLVYNINWTPGQSLGWIYYNGTWHEFGLTDTGDINIDTFNNEQHIGIGTAAVSNFRVGILGSAKVDGDLVVTGRGGVGADKYVTKTYTGDGTTLTFAVTTYSGGIQHSDDSLLVFLNGVAQIAGTNYTVDANGANVVFSSGDAPQSTDTVHILELPI
Physico‐chemical
properties
protein length:1321 AA
molecular weight: 142084,43850 Da
isoelectric point:4,85583
aromaticity:0,09387
hydropathy:-0,26889

Domains

Domains [InterPro]

No domain annotations available.

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage S-RIM2
[NCBI]
687800 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AOO03543.1 [NCBI]
Genbank nucleotide accession
KX349254 [NCBI]
CDS location
range 22602 -> 26567
strand +
CDS
ATGTCTCTAACTAGACTTAAGAATATTATTACGTCCCGCACGGGACGTATTATTTACGTTAACCCTGACGACTTTGATGCTTCTGATGCTATTGACAACAGAGGCAACTCAGCATTGCGTCCGTTTAAGTCTATTCAAAGAGCATTTCTTGAAGTTGCTAGATTTTCGTATCGTGTTGGTCTGAGTAATGACGAATTCGATGCGTTCAGTATCATGCTCTACCCTGCAGAGTATGTGATCGATAACCGTCCTGGTAAAGTTCTTTATACTGATGTCCCTCCTATTGATTCTAACTCTAATCTGGACCTGACTTCACCTAATAATGTTTTGTATTATTACAACTCAGTAGAAGGAGGAGTCATTGTTCCCAGAGGTTGTTCGCTGGTTGGCACCGACTTACGTCGTACCAAGATTATTCCTAAGTACGTTCCTTATCCTACGACATATACTGCGAAGGGAATCAACACAGAGGATGATGTTCCTCCCCGCACCGCAATCTTCAAGGTCACAGGTGGTACATACTTCTGGCAGTTCTCCTTCTTCGATGGTGCTGAGGAAGGTGTATACTTCAAACCCGATAGCACTGAAACTCTTTCCCCCAAGTTCTCACACCATAGACTAACTTGCTTTGAGTTTGCTGATGGTCTCAATCCTCTTTCCAAGTTAATCTCTGACGGCACTGTTCCTAACACAGATTATTCTGCTGTGCCTAACATTCTAGAGAGAACTGACCTAGACATTTACTACCAGAAAGTATCGAAGGCATTCGCAACTATTCCTGATACATCTGGTGATCCTACTACTGACCAGATTCAGGCAAGGGTCGAAGAAAACAGAATCGTTGGTCCTATTTCCGATGAATACAGAGTCCTTCAGATCACAAGAAATGGTCAGACAGCAACGGCAGTTACTGTTGATGAGTTTGATAACCCCAGAGACCATGGATTTAGTGTTGGCGTCAACATTAACGTTTCAGGTGTTACTGGATCAACTGGACCGCAATCCGAAGTTGATGCAACAGTTTTTAACGGATCTTTCACCGTCACTTCGACGCCAACTGGTAGCACATTTACTTACCAGTTAGCATCTGTACCATCAGGTAATGCTGTTGGTTCTAATGTTACTGTTAAGACTGAAATTGATACTGTTGACTCTGCATCTCCATATGCATTCAACCTGTCACTGAGAAGTGTTTGGGGTATGAATGGTATGCACGCGAACGGTGCTAAGGCAACTGGTTTCAAATCGATGGTTGTTGCACAGTTCACGGGTCTATCTCTACAGAAAGATGATAGAGCGTTTGTAAGATATAATGCTTCTACTGGTAACTATGATGTAGCAACTGCTGGTGATGGTGCTCACCTGGATGGTTTTGCTGAGTATCGTAAAGGATGGGGACATGAGCACATTAAGTGTTCTAATGACTCCTTCATTCAGGCGGTTTCGGTGTTCGCTGTTGGATACTTCGGTCACTTCACTGCTGAAAGTGGTGCTGACATGTCAATCACCAACTCCAACAGTAACTTTGGAAACACTGCGTTAAGATCTGCTGGATTTAAGGCAAAAGCATTCTCCAAGGATAAAGCAGCAGAGATTACTCATATCATTCCACCTAAGGCACTGAACGTTATTTCGACAACTGCAACAGGTGCTTCAGGTTCGCCAAATATCACACTTGCTAATGATGGTAGCATCAACGGTGTTATCGAAGGTATGACAGTTTCTGGAACTAATCTTGCTGCTGGTGCTACTGTTGTTTCCTTCAACACTAACACTAGAGTTATCACACTGTCTGGAAATAATACAGCAGCAGTTGACACTAACATCATCTTTGGTGAAGAAACATCTGTCAACTGGGTTAACGTTGATATTCAACGCACTAAGGTAATCAACTCTGCACTTTCTGGTCAGGGTGGTATTGCTGGTTCTAGACTTTATCTCTATGGATATGTCACGGAAGCATCTCCTCCAACAACAAAGGTTCAAGGTTTTGCTATTGGATCACGTCAAGATGGCACAGGTGTTGATGCTATACCAGACAAACTGAATGTACTTTTGGTTGCTAATGGTGCATCTTCTGCAACAGTTCAGACTGCTAAGATTTCACCTTATGGTCCTGATGTTTCCAACAAAGCAGCAGGTGATACTGGTTCACCTCTGCAATATGATAGTGCAACATACACTATCAATGGTCAAGCAGGTTCCGTTGGTGGTTGGTATCTGAGTGTAGATCCTAACGATAATCAAATCTACACAACTCTTTCTACCAACTCACAGTACAACAACGTAAACTTCACCCCTACAACTTTCATTAAGAGGATTCCTGACCCTCGTGACCTGCAGGATAGAACATATCGTGTCCGCATGGTTATCGATAAGGATAAGACTAATCCTCTGCCTCGTGATCCTCTCAGCGGTTATGTTGTACAACCTCTGAATAGTGACACTACAAGTTACAATCTGAACAGAACATTCTATATCTACGATATCGAAGTTGTTCAGAAATTCGAGAGAGGCGTTAAAGATGGCATCTACTACATTACCTTGCTTTGTGCATCTATTGCACCTAGCACTTCTAACTTCAACGACAGGAAGTTCTCTCAAAACGTCAACGAAGTCTATCCTACGTTTGACAGAGACAACCCTGTTGCTGACCCTGTTGCTGCGATTTCCGTCGCTGACAACGAAACTATCGGTCTTGTAAATGCAACTGATGGTGCTAACCCTACACCCAACAAAGATCCCAAACTGTCTATTACTAAAGAAGCGATTAAGTTCCTTCTGACTGATACTGGTTGGACACAACCAGGTACAACACCCAACTATGACTCTGTTAATGGAAGACTATCTAATGTCGAACTAACTGCACGTGCTGGAAATGAAGAAACTAGGAAGATCAACATCCGCGAAAACAATGATGGGACTGTCGCACCTATCAATGTTGAGTTCAGGAGGCACTCGATCCTTAGATCTGGTAACCATACGTTTGAGTATCTTGGTTTCGGTCCTGGTAACTATTCAACTGCATTCCCTCAAACTCAGGTAGAAACTCTGAGTGCAGATCAGGTTAAGTTCTCTCAGTCGATTAAAGAAGAAGCAGGTGTTGCATTCTACTCTGGTCTGAACTCTAACGGTGACCTGTTTATTGGTAACCAGATTATCAACCCTGTTACAGGTCAGATTACTAATGAAGATATTGCACAGTTGAATGTTGTTGGTGAAGAAAACACTACGATTCAGACATTCTCTGAGTTGGTTCTTACCGACAAACTGACCGTTATTGGTGGTGCATCTAACCAGTTAGAATCTATCTTTGCTGGTCCTGTTACATTCCAAGCACAAACATCCTTTACTAATAATCTTACTGCCAAAAAGATTACTTATAACAACCAGGATGGTACGGTAATCAAGCAAACGTTACTCGCTCCCGCCGATGCAAATGGACAACCAAGTTTTGCTGCTATCACAGGATACGATACACCTGGTAATGGTGATCTTGTTTACAATATCAATTGGACACCTGGGCAGTCGCTTGGTTGGATTTATTACAATGGAACGTGGCACGAGTTTGGTCTCACGGATACTGGTGACATTAATATCGATACTTTCAATAATGAGCAACATATCGGTATTGGTACTGCTGCTGTATCTAATTTCCGTGTTGGCATCCTCGGAAGCGCCAAAGTAGATGGTGACCTTGTTGTTACTGGACGAGGTGGTGTTGGTGCTGATAAGTATGTCACTAAGACATATACTGGTGACGGCACAACTCTGACATTTGCAGTTACTACCTATAGTGGTGGTATTCAGCATTCTGATGATTCACTGCTGGTATTCCTGAACGGTGTTGCACAGATTGCAGGTACAAACTACACAGTTGACGCTAACGGTGCAAACGTTGTATTCAGTTCTGGTGATGCACCACAATCTACAGATACAGTCCACATTTTAGAACTGCCTATCTAA

Tertiary structure

PDB ID
42a973385b756fd482b52ea54757798a1c894427f8ebfb8688e0234974cc765b
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,3670
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50