Genbank accession
AIX16836.1 [GenBank]
Protein name
putative short tail fiber
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,86
TSP
Evidence RBPdetect2
Probability 0,76
TF
Evidence Phold
Probability 1,00
Protein sequence
MSLTRLKNIITSRTGRIIYVNPDDFDASDAIDNRGNSALRPFKSLQRAFLEVARFSYRVGLSNDEFDAFSIMLYPAEYIVDNRPGDVLYTNVAPIDENSNLDLTSPNNVLYKYNSVEGGIIVPRGCSLVGTDLRRTKIIPKYVPYPTTLASQGINTEEQVPPRTSIFKVTGGTYFWQFSFFDGAEEGVYFKPDSTNTLAPKFSHHRLTCFEFADGLNNLSTLISSGTVPNVDYSAVPNILERTDLEIYYQKVSKAFATIPDTSGDPAADQIQARVEENRIVGPISDEYRVLQITRNGQTATAVTVDEFDNPRDHGFSVGVNINVSGVTGSTGPQSEADAGIYNGSFTVTSASGNVFTYQMQTEPTGNAIGSNVTVKTEIDTVDSASPYAFNLSLRSVWGMNGMHADGSKATGFKSMVVAQFTGLSLQKDDRAFVRYNASTGNYDAATAGDGAHLDGFAEYRKGWAHEHIKCSNDSFIQAVSVFAVGYGTHFTALSGADMSITNSNSNFGNTALRSAGFKAKSFSKDKAGEITHIIPPKALNVISTTATGTNASNSITLVNDGSINGVIEGMTVTGTGIGDNALVGSVNVNTRVVTLSQTNTDTVNGNVVFGEETSVNWVNLDIQRTKVINSALAGQGGTPGTRLYLYGYTVEASPPTSRVQGYTIGARQDGTGASAVPDKINCLLVPQGASSASVQTASISPYGPSISGLNAGVTGSPLQFDSGTYTINGVAGSVGGWYLSVDSVENSIYTTLSTNTQYNSVNFTPTTFIKRIPDPRDLQDRTYRVRLVIDKDKTNPLPRNPISGYVMQPLNTDTTGYSLQRAFYIYDIEIVQEFQRGVADGIFYLTLLCASIAPTTSNFNDRKFSQNVNEVYPTFDRDNPLADPADSVSVADNETIGLVNSTDGASPTPNKDPKRSITKEAIKFLLTDTGWTQPGTTPNYDSVNSRLSNVDLTARQGDEETRKINIRQNNDGTVAPIAVEFRRHSIMRSGNHTFEYLGFGPGNYSTAFPQTQVETLSTDQIKFSQSIKEEGGVAFYSGLNSNGDLFIGNQIINPVTGQITNEDIAQLNVVGEENTTIETFSELVLTDKLTVIGGASNQLESIFAGPVTFQGLTTFTNNIQARKISYYNQDGTVIKQTLLAPEDANGQPSFTNITGYDTPADGDLVYNINWSPGKSLGWIYYTGVWYEFGLTDIGDINIINDGGVTRIGIGTAPNSSYRVNIDGSTRVDGDLVVTGRGGVGSDKYITKTYTGDGVTLTFAVTTYVGGIQHSDDSLLVFLNGVAQIAGTNYTVDSNGANVVFSSGDAPLSTDTVHILELPI
Physico‐chemical
properties
protein length:1320 AA
molecular weight: 142060,43700 Da
isoelectric point:4,76540
aromaticity:0,09167
hydropathy:-0,25659

Domains

Domains [InterPro]

No domain annotations available.

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage ACG-2014a
[NCBI]
1493507 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AIX16836.1 [NCBI]
Genbank nucleotide accession
KJ019038 [NCBI]
CDS location
range 23331 -> 27293
strand +
CDS
ATGTCTCTAACTAGACTTAAGAATATTATTACGTCCCGCACGGGACGTATTATTTACGTGAATCCTGATGACTTTGATGCCTCTGATGCGATTGACAATAGAGGTAACTCTGCATTGCGTCCGTTTAAGTCTCTACAGAGAGCATTTCTTGAAGTAGCAAGATTCTCCTATCGTGTTGGTTTGTCAAATGACGAATTTGATGCCTTCTCGATCATGCTGTATCCAGCAGAATATATTGTTGATAACAGACCTGGAGACGTTCTCTACACTAATGTTGCTCCTATCGATGAGAACTCAAACCTTGATTTGACCTCTCCTAATAATGTTCTGTATAAGTATAATTCGGTTGAAGGTGGTATCATTGTTCCTAGAGGTTGTTCTCTAGTTGGTACAGATCTTCGTCGTACAAAGATTATTCCCAAGTACGTTCCATATCCTACAACGCTTGCTTCTCAAGGTATCAACACAGAAGAGCAGGTTCCACCTCGCACATCTATCTTTAAGGTAACTGGTGGTACATACTTTTGGCAGTTTTCATTCTTTGATGGTGCTGAAGAAGGTGTATATTTCAAACCTGATAGTACAAATACTCTTGCTCCTAAGTTTTCACATCATCGACTAACTTGTTTTGAGTTTGCTGATGGTTTGAATAATCTTTCCACATTGATTTCTAGTGGAACAGTTCCAAACGTAGATTATTCTGCAGTTCCTAATATCTTAGAAAGAACAGATTTAGAAATTTATTATCAGAAAGTATCGAAAGCATTTGCTACAATTCCTGATACATCTGGAGATCCTGCTGCTGACCAAATTCAGGCAAGAGTCGAAGAAAATAGAATTGTTGGTCCTATTTCTGATGAATATAGAGTCCTTCAGATTACAAGAAATGGACAGACAGCAACAGCAGTAACTGTTGATGAGTTTGATAACCCTAGAGATCATGGATTCTCTGTTGGTGTTAATATCAACGTTAGTGGTGTTACTGGATCAACTGGACCGCAATCGGAAGCGGATGCTGGAATTTATAACGGATCTTTCACAGTCACATCAGCATCAGGTAACGTTTTTACTTACCAAATGCAAACAGAACCAACAGGAAATGCTATTGGTTCTAATGTTACAGTTAAGACTGAAATTGATACAGTTGATTCTGCATCACCTTATGCGTTTAACCTGTCACTGAGATCAGTGTGGGGTATGAATGGTATGCACGCTGATGGTAGCAAAGCAACTGGTTTCAAATCAATGGTTGTTGCTCAATTTACTGGTTTGAGTCTTCAAAAGGATGATAGAGCATTCGTAAGATATAATGCTTCTACTGGTAACTATGATGCTGCAACTGCTGGTGATGGTGCTCACTTAGATGGTTTTGCTGAATACCGTAAGGGTTGGGCACACGAGCATATTAAGTGTAGTAATGACTCATTCATTCAGGCAGTTTCGGTGTTTGCTGTTGGATATGGCACACACTTTACAGCACTTAGTGGTGCTGACATGTCGATTACGAACTCTAACAGTAACTTTGGAAACACTGCTTTAAGATCTGCTGGATTCAAGGCAAAATCATTCTCTAAAGATAAAGCAGGTGAAATTACACATATCATTCCACCCAAAGCACTGAATGTCATTTCGACAACAGCAACAGGTACGAATGCTTCAAATTCGATAACACTGGTTAATGATGGTTCTATCAATGGTGTTATTGAAGGTATGACTGTTACTGGTACTGGTATCGGTGATAATGCCCTTGTTGGTTCTGTTAATGTAAATACTCGTGTTGTTACTCTTTCACAGACAAACACTGATACTGTCAATGGAAATGTTGTTTTTGGTGAAGAAACATCAGTCAATTGGGTCAATCTTGATATTCAACGTACAAAGGTCATTAACTCTGCACTAGCAGGGCAGGGAGGAACCCCTGGAACAAGATTGTATCTATATGGTTATACAGTAGAGGCATCTCCCCCTACATCACGAGTACAGGGTTATACAATCGGTGCTAGACAAGATGGTACTGGTGCAAGTGCTGTTCCTGATAAAATCAATTGCCTGTTAGTTCCTCAGGGTGCAAGTTCAGCATCAGTTCAAACTGCTAGTATTTCACCTTATGGTCCTAGTATTTCTGGTTTGAATGCTGGTGTTACAGGTTCTCCATTGCAATTTGATAGTGGTACATACACTATCAATGGAGTTGCTGGATCTGTTGGTGGTTGGTATCTATCGGTAGATTCTGTAGAAAACAGCATCTATACAACTCTTTCGACAAATACTCAATATAATAGTGTTAATTTTACTCCAACAACATTCATTAAGAGAATTCCTGACCCTCGTGACTTGCAAGATAGAACATATCGTGTTCGTCTGGTAATTGACAAAGATAAAACTAATCCTTTACCCCGTAATCCTATTAGTGGTTATGTAATGCAACCATTGAATACCGATACAACAGGGTATTCACTACAGAGAGCATTCTATATCTACGATATTGAGATTGTCCAAGAATTCCAAAGAGGTGTTGCTGATGGAATCTTCTATCTTACCCTGCTATGTGCATCTATTGCACCTACAACTTCTAACTTTAACGACAGAAAGTTCAGTCAAAACGTCAATGAAGTCTATCCTACGTTTGACAGAGACAACCCTCTTGCTGACCCTGCTGATTCGGTATCCGTCGCTGACAACGAAACTATCGGTCTAGTAAATTCTACTGATGGTGCATCACCTACACCTAATAAAGATCCTAAGCGTTCTATCACTAAAGAAGCAATTAAATTCTTATTGACCGATACAGGTTGGACGCAACCAGGAACAACACCTAATTATGATTCTGTCAATTCTCGTCTCAGCAATGTAGATCTTACTGCCCGTCAGGGTGATGAGGAGACCAGAAAGATTAACATCAGACAGAATAATGATGGCACTGTTGCTCCCATTGCTGTTGAGTTTAGACGCCACTCAATCATGAGATCTGGTAACCATACTTTTGAGTATCTTGGTTTCGGTCCTGGTAACTATTCAACTGCATTCCCTCAGACTCAAGTAGAGACGTTATCTACTGATCAGATTAAGTTCTCTCAGTCTATTAAAGAAGAGGGTGGAGTTGCATTCTACTCTGGTCTTAACTCTAATGGAGACCTATTCATTGGTAACCAGATCATTAACCCTGTTACTGGTCAGATTACGAACGAAGATATTGCACAACTAAATGTTGTTGGTGAAGAGAATACAACGATTGAAACATTCTCTGAGTTGGTGCTAACTGATAAACTGACTGTTATCGGTGGTGCATCTAACCAGTTAGAATCTATTTTTGCTGGTCCTGTTACATTCCAAGGACTGACTACATTCACAAATAATATTCAAGCAAGAAAGATTTCTTATTACAACCAAGATGGTACTGTAATCAAGCAGACTTTACTTGCACCTGAAGATGCAAACGGACAACCAAGTTTTACTAATATCACTGGGTATGATACACCTGCTGATGGCGATCTTGTTTATAATATCAACTGGTCACCTGGTAAATCTTTAGGTTGGATTTACTATACTGGTGTTTGGTATGAGTTTGGTCTCACTGATATTGGTGATATTAATATCATTAATGATGGAGGTGTAACTCGTATTGGTATTGGCACTGCTCCTAATAGTTCTTATAGAGTTAATATTGACGGTTCTACAAGAGTTGATGGCGACTTAGTTGTTACTGGAAGAGGTGGAGTTGGTTCTGATAAGTATATTACAAAAACTTATACTGGTGACGGTGTAACCCTTACATTTGCAGTTACTACCTATGTTGGTGGTATTCAGCATAGCGATGATTCTTTACTGGTCTTCTTGAATGGTGTTGCTCAAATTGCAGGAACAAATTACACCGTGGATTCTAATGGTGCAAACGTCGTCTTTAGTTCAGGAGACGCACCATTATCAACAGATACAGTTCATATTTTAGAACTGCCTATCTAA

Tertiary structure

PDB ID
1100fc7ac46c7e4891b2ad2efe66d47a0f03ca8580b4ae4e62159317d5a744f7
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,3904
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Ecological redundancy of diverse viral populations within a natural community Gregory,A.C., LaButti,K., Copeland,A., Woyke,T. and Sullivan,M.B. 2015-03-20 GenBank