Genbank accession
AAX44678.1 [GenBank]
Protein name
phage tail fiber-like protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,86
TSP
Evidence RBPdetect2
Probability 0,89
TF
Evidence GenBank
Probability 1,00
TF
Evidence Phold
Probability 1,00
Protein sequence
MAEFRLGRLKFNWRSDWTISTAYVIDDIIKYGANTYVCKKNHTSAGAEESFYSTDLTLNWSLHTEGIVNKGSWAANYWYKVNDIFKYGNTQYRVTTGFTSGATFDEAATTTNVVEYLQSFNYEDTWSNSTQYQDGDVVTYGGYTYVAKSVNTNKAPSYNLTNDWDIITTGFSVVGYYSTTTDYKQGDVVQYGGYTYVAITTSTNTIPTTPANWTLVTKGVSWKGNWDSTVKYELGDAVKRLSNSYIGVATVGSLNEDPSTDGTSTYWSMLAEGAANNVMTTQGDMVYYTTGSARLPKGTNGQVLAMSSGGVPNWESNSVTHPVFYVTEEGSDTNDGSNISRAFASVRHACAKAAETGNPCSVYVKAGTYSETLPIVVPPFVSIVGDNLRTSRVKPGVHYAHTFISGLTGSITADSGGPFTAGSGTTYDSATGDLVLEIGTHSLTTSNTIGINGNSLTFTCSQDSHATQHTYPRPKDPVYNKTDIAIIATTGTTITVRVGKGNASRHQDLVLASAPSSVSYGSSIFNGAGTKCAVILDSDYAEKKIQIRWLSGGEWTTSDEWENGGTDIGITSVTTRPNEESTMFMLSNATMLKDLLMEDMTGFSPAGIVTTISCSIAGSKVTGSELFPDLVGTTVTGSGVSTGTKVSGFIDAQTLEVDIVQNLGATDLTFTAQQYDPNNAHIKGTFCALNPESRVIKSPYVSNCSAKSVRGIGAVVDGGVHRQFVDGSATPSNKSIVFDSFTNIHDEGMAFWITDGAVAETVSCFTYYNHISYAATRGGRLRSLVGNSSWGKYGVVSSGFSPLEKAREGEIEGLVLQYDVDSMSGSGFQVGERIRGNTSGAWGYINSVQGTTQEKIYYSVISEGPVGVGTGFGPGETITAMTSGTTAPLLNNTSANEGQAGRILVLSGLGTSPTLEVNGSIEFITGLGNGGYNSDNITGADPFTFVISGVSQTGPTGKGNVQIDRAQWSTTGAAHTGGSTTFVKYPVNIGASFTLLTPAAAGDTTLSTSTISGFNPGEYCLSPTNELCKIVSFPTANSMSVQRAQDGAGAAVAYSIGDIFTSIGTTSFVTSAEVNKDFTGVSTDFRATISNRFEDAVGAYMKIDDEFTKVTGVTTDTYGTTTVTLVEEKAAKSFDEQDIKIRYIFSQARLTGHDFLQVGTGGTYTTNWPDVPSQDPVQTQEITEDFPGRVFYVSTDEQGNFRVGKYFRVNQATGAATLNANSFDLSGLTSIRLGSIGAQLGAQVNEFSTDGTMAQNSNEKVPTQAAVRTYVATRDAEHLVMAQNAANLGIATALAHANAGIATLRTDANTEFRSGVQVSEFFVGQI
Physico‐chemical
properties
protein length:1326 AA
molecular weight: 140948,79910 Da
isoelectric point:4,89102
aromaticity:0,09804
hydropathy:-0,20943

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Prochlorococcus phage P-SSM2
[NCBI]
268746 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Prochlorococcus
[NCBI]
1218 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae >
Host Prochlorococcus marinus str. NATL1A
[NCBI]
167555 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AAX44678.1 [NCBI]
Genbank nucleotide accession
AY939844.2 [NCBI]
CDS location
range 227615 -> 231595
strand +
CDS
ATGGCTGAATTTAGACTTGGCAGATTAAAATTTAACTGGCGTAGTGACTGGACTATAAGTACTGCGTATGTTATAGATGACATCATAAAGTATGGTGCAAATACTTATGTTTGTAAGAAGAATCACACTTCTGCTGGTGCTGAAGAATCTTTTTATAGCACAGATCTAACACTTAATTGGTCCTTACATACCGAAGGAATTGTTAATAAGGGAAGTTGGGCAGCAAATTATTGGTATAAAGTAAACGATATATTCAAATACGGTAATACTCAATATAGAGTAACTACTGGATTTACTTCTGGTGCTACTTTTGATGAAGCTGCTACTACTACAAATGTAGTTGAGTATTTACAATCATTTAATTATGAAGATACTTGGAGTAATTCAACACAGTATCAGGATGGAGATGTTGTAACTTACGGTGGATACACTTACGTTGCAAAGAGCGTTAATACAAATAAAGCACCTTCATATAATTTAACGAATGATTGGGATATTATAACTACAGGATTTAGTGTAGTTGGTTATTATTCTACAACAACAGATTATAAGCAAGGTGATGTGGTTCAATATGGTGGATACACCTATGTTGCAATTACAACTAGTACAAATACTATCCCAACAACACCAGCAAATTGGACCTTAGTTACTAAAGGTGTTTCTTGGAAAGGTAACTGGGATTCTACTGTAAAGTATGAATTAGGAGATGCTGTAAAGAGATTAAGTAATAGTTATATTGGTGTTGCTACTGTTGGTAGTTTAAACGAAGATCCTTCAACTGACGGTACAAGTACTTATTGGAGTATGTTGGCTGAGGGTGCTGCCAACAATGTGATGACCACTCAAGGTGATATGGTCTATTACACCACTGGTTCTGCTAGATTACCTAAAGGAACTAATGGTCAAGTACTCGCTATGAGTTCTGGTGGTGTACCTAATTGGGAATCTAATAGTGTAACACATCCAGTTTTCTATGTAACAGAAGAAGGAAGTGATACTAATGATGGTTCAAATATCAGTAGAGCATTTGCCTCAGTAAGACATGCTTGTGCAAAAGCAGCTGAAACAGGAAATCCTTGTTCAGTTTATGTAAAAGCAGGAACATATTCAGAAACACTTCCAATTGTAGTGCCACCATTTGTATCTATTGTTGGAGATAACTTAAGAACATCTAGGGTTAAACCAGGTGTTCATTATGCACATACCTTTATAAGTGGTCTTACTGGTAGTATTACGGCAGATTCTGGTGGTCCTTTTACTGCTGGTAGTGGAACAACCTACGATTCTGCAACAGGAGACCTTGTATTAGAAATTGGAACACATAGTTTAACTACTTCTAATACTATTGGTATTAATGGTAATTCATTAACATTTACTTGTTCACAGGATAGTCATGCTACTCAGCATACTTATCCAAGACCAAAGGATCCAGTTTACAATAAAACTGATATAGCAATTATTGCAACAACTGGAACTACAATTACAGTTAGAGTTGGTAAAGGAAATGCATCTAGGCATCAAGATCTAGTATTAGCATCTGCTCCTTCTTCTGTTTCATATGGTTCTTCAATCTTTAATGGTGCTGGAACTAAATGTGCTGTTATCTTAGATTCAGATTACGCTGAGAAGAAGATACAAATCAGATGGCTTTCTGGTGGAGAATGGACAACATCAGACGAGTGGGAAAATGGTGGAACAGATATAGGTATTACTTCGGTTACTACAAGACCGAATGAAGAATCAACAATGTTTATGTTAAGCAACGCAACGATGCTTAAAGACTTGTTGATGGAAGATATGACTGGTTTCAGTCCAGCAGGTATCGTTACAACTATAAGTTGTAGTATTGCTGGATCAAAAGTAACTGGTAGTGAGTTATTCCCAGACTTAGTTGGTACAACTGTAACTGGTTCTGGTGTTTCAACTGGAACAAAGGTTAGTGGATTTATTGATGCACAAACATTAGAAGTTGATATAGTTCAAAATCTTGGTGCAACTGATCTTACATTTACAGCACAACAGTATGATCCTAATAACGCACATATTAAAGGAACCTTTTGTGCTTTAAACCCAGAAAGTAGAGTTATTAAATCACCATACGTATCAAACTGTTCTGCAAAATCAGTTAGAGGTATTGGTGCAGTCGTAGATGGTGGGGTTCATAGACAATTTGTTGATGGATCAGCAACACCTTCTAACAAATCTATCGTGTTTGACTCATTTACAAATATTCACGATGAAGGAATGGCATTCTGGATCACAGACGGTGCTGTGGCAGAAACAGTTTCTTGTTTCACATACTATAACCATATAAGTTATGCTGCTACTCGTGGTGGAAGACTTAGATCTCTTGTTGGAAATAGTTCTTGGGGTAAGTATGGTGTTGTAAGTTCTGGATTCAGTCCACTTGAAAAAGCAAGAGAAGGTGAGATTGAAGGATTAGTTCTTCAATATGATGTAGATAGTATGAGTGGATCTGGTTTCCAAGTTGGAGAAAGAATTAGAGGTAACACTTCTGGTGCTTGGGGTTATATTAACTCAGTACAAGGAACTACTCAAGAGAAAATATATTATTCAGTAATTAGTGAAGGTCCAGTTGGAGTTGGAACAGGATTTGGACCTGGTGAAACCATTACTGCTATGACTTCAGGAACAACTGCTCCACTTCTTAATAATACAAGTGCAAACGAGGGTCAAGCTGGTCGTATTCTTGTTCTTAGTGGATTAGGAACATCACCAACCCTTGAAGTTAATGGTAGTATTGAATTTATTACTGGATTGGGTAACGGTGGATATAATAGCGATAATATTACTGGTGCTGATCCATTTACCTTTGTGATCTCTGGTGTGAGTCAGACAGGTCCTACTGGTAAGGGTAATGTACAGATTGACAGAGCACAGTGGTCTACTACTGGTGCAGCACATACAGGTGGAAGTACAACGTTTGTTAAGTATCCAGTTAATATTGGTGCTTCATTTACTCTGCTAACTCCTGCTGCTGCTGGCGATACTACTCTCAGTACGAGTACTATTAGTGGATTCAATCCAGGTGAATATTGTTTATCACCAACTAATGAACTTTGTAAGATTGTTAGTTTCCCAACTGCAAACTCTATGAGTGTTCAGAGAGCACAAGATGGTGCTGGTGCTGCTGTTGCATATAGTATTGGTGACATCTTTACTTCAATTGGAACAACTAGTTTTGTTACTTCAGCAGAAGTTAATAAAGATTTTACTGGTGTTTCTACTGACTTTAGAGCAACGATTTCAAATAGATTTGAGGATGCTGTTGGTGCTTATATGAAGATTGATGATGAATTTACAAAAGTAACAGGTGTTACTACTGATACTTACGGTACTACTACAGTAACTCTTGTTGAAGAAAAGGCTGCTAAATCCTTTGATGAACAGGATATTAAGATCCGCTACATCTTCAGTCAGGCAAGATTAACTGGACATGACTTCTTACAAGTAGGAACTGGTGGAACATACACAACTAATTGGCCTGATGTTCCTTCACAAGATCCAGTTCAGACACAGGAAATTACAGAAGACTTCCCAGGAAGGGTATTCTATGTTTCTACTGATGAACAAGGTAACTTTAGGGTTGGTAAGTACTTCCGTGTTAACCAGGCAACTGGTGCTGCAACGTTGAATGCTAACAGTTTCGATCTATCTGGTTTGACCTCAATTCGATTGGGTTCAATCGGTGCTCAGTTAGGTGCTCAAGTTAATGAGTTCTCAACTGATGGAACTATGGCACAAAATAGTAATGAGAAAGTGCCAACACAGGCTGCGGTTAGAACTTATGTTGCTACTAGAGATGCAGAGCATCTTGTAATGGCACAAAACGCAGCAAACTTGGGTATAGCAACTGCATTAGCACACGCTAACGCTGGTATAGCAACTTTAAGAACTGATGCAAACACTGAGTTCAGATCAGGAGTTCAGGTATCTGAATTCTTTGTTGGGCAAATCTAA

Tertiary structure

PDB ID
d655e42804646218586c0c3e535b17b491a27eae77a7532a41ce95f32b6cb883
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5551
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50