Genbank accession
QLF88461.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence Phold
Probability 1,00
Protein sequence
MAAAAPIIGAITSKGIGGAILRFALSLAVSYITQKLFAPDMPGVEGGAGSGKDPGVKQRIPSDPSNKLPVVYGQDKIHGSIIFADITSDNKTMAFIIALCEGPINKIGTSNYGTNSGIYWDDYELSFDLAGNVINATHADGGTDSWLNGNLKIVKYPDGGRCLDMETFSSKWNSGSQNRYLPDVAYAYVELNYDREDNVTGLTSKLGFEVEGKLIRTISSAPSLNGPTPTTTTIQGSLANPNIFDTSVKFANFSGYQLWHWVNPYNGGVNYSYPHSYVAPGGTYNIIDLGPSSDPNAPYDLNDYITNGVTPTGLGTGGEVEFDFINVGEQYHLSNGNLTNFTPNSYVDSNGVTQPDDGRRLINAIHFKQWGNNYSNSFFNNVSGNEETRVWIEYVYSDAILGVTKHYIGLSTIQFTPTGGIYANYTEEDYGQLLADKLNLSLVTNFFEILAPDGLKQVGIRKLRNITAADANGVLPTYQYSPRQQYFTAKIPQTVQRTLYGTYSTNPAECLADYLTNKVYGCGQSISDNDLDLDTFYAHKVFCDTSVTHNDPDGNSVTSKRYQCNGYVNTNDSKDLNISDIVSNSQSIFSYTLGKFQMLSDTTGSISYGGSNNDFDETSIYGDVTVVNDGFNSTLNEMNLQFKSKINEYQDDQVFLEYGNKYFNEPVLSKDLTLKFINTNVEAQRIGTVIMNKSRSNKIISFKTDTRAANLQVNDIISVKGTYYNLDKNSVFSHNFVTNTSNGSTSNAIGEYVVKVDSSQPYIYEDTQEEARFYVPGTVAGYEKLSNFYKDCINGQFFDSTGQLTDAQVKLNNKLGEIFSFVSCELDTISSSYGSYGAKLTFYANDIISGGIKEDFQIDVITNILNSTWGSLNVINTASELGSLFKINSISETELNGGLQGYFITAQEYNANDYTVGTLTATAAAPPISSTRGYQNLGVATNLVLNNTFPSATTPYIDVSFTMPSKNNVEGVEIYYGSGVNTPEASRILVQTFSAPTGNYAGGSTQNFNIQNIPTTTDLYIWVRLTNSFSRGAFSTGLTIGNWNPTTNITTIGNNSIAPVLLGFDYNQYRNLIINGDFLIHQRGSSSTTSANPGYLLTDMWYSDINNSGTWVHSHSNDTPDNTVLSRSYKLENTTVPTLGASSKFKFKQIIEGQNLQKLKYGTTNAEDITVTFWVKSSKTGNYIFDLYNHDDNRHISKLYTIDNANVWEQKLITIPGDTNNTSAFNNDNNKSLEVSWWLTAGSDFDSGTLNTNWNTTADDDRAVGQVNLADTVNNTWFISGIQLEVGSNASKFEIIPFDKSLERCQRYFYKLVSIVGEAFQGHSSSHLRHMNIWFPVTMRDTPTINATWSTGTSPTNLSTKQYANVCINIGSNSTSANLTGFSASAELT
Physico‐chemical
properties
protein length:1389 AA
molecular weight: 152561,53850 Da
isoelectric point:4,81741
aromaticity:0,11447
hydropathy:-0,35709

Domains

Domains [InterPro]
DC_1879
ATT
1–257
QLF88461.1
1 1389
Architecture
ATT
STR
ATT 1-257 | STR 458-1378 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Pelagibacter phage Kolga EXVC016S
[NCBI]
2736233 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Candidatus Pelagibacter sp
[NCBI]
2024849 Pseudomonadota > Alphaproteobacteria > Candidatus Pelagibacterales > Candidatus Pelagibacteraceae > Candidatus Pelagibacter >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QLF88461.1 [NCBI]
Genbank nucleotide accession
MT375529.1 [NCBI]
CDS location
range 8906 -> 13075
strand +
CDS
ATGGCAGCGGCGGCACCTATTATAGGGGCAATAACATCTAAAGGTATTGGAGGGGCAATTCTTAGATTTGCTTTATCACTTGCAGTATCATATATTACACAAAAATTATTTGCACCTGATATGCCAGGTGTCGAAGGTGGTGCTGGTTCAGGTAAAGATCCAGGTGTTAAACAAAGGATACCTTCAGATCCATCTAATAAACTTCCTGTTGTTTATGGTCAAGATAAAATACATGGATCTATTATATTTGCAGATATAACTAGTGATAATAAAACAATGGCTTTTATTATTGCTTTATGTGAAGGCCCAATTAATAAAATAGGTACATCTAATTATGGCACTAACAGTGGTATATATTGGGATGACTATGAATTATCTTTTGACTTAGCTGGAAACGTTATTAATGCTACTCATGCTGATGGCGGAACTGATAGCTGGTTAAATGGTAATTTAAAAATTGTAAAATACCCAGATGGTGGAAGATGTTTAGATATGGAAACCTTTAGTTCTAAATGGAATTCAGGATCACAAAATAGATATTTACCAGATGTTGCATATGCATATGTAGAATTAAATTATGATAGAGAAGATAATGTTACAGGATTAACTAGCAAACTAGGTTTTGAAGTTGAAGGTAAATTAATTAGAACAATTAGTTCGGCTCCAAGTTTAAATGGGCCAACGCCAACAACAACAACTATACAGGGTTCTTTGGCTAATCCAAATATTTTTGATACTTCAGTTAAATTTGCAAATTTTTCAGGGTATCAACTTTGGCATTGGGTTAATCCATATAATGGTGGAGTAAATTATAGTTACCCTCATTCTTATGTTGCTCCTGGAGGAACATATAATATTATAGATTTAGGCCCTTCATCAGACCCAAATGCACCTTATGATTTAAATGATTATATTACAAACGGTGTTACACCAACAGGTTTAGGTACTGGTGGTGAAGTAGAATTTGACTTTATTAATGTTGGAGAACAATATCATTTATCTAATGGAAATCTTACAAATTTTACACCTAATAGCTATGTCGATAGCAATGGTGTTACACAACCAGATGATGGTAGAAGATTAATTAATGCTATACATTTTAAACAATGGGGTAATAATTATTCTAATTCATTTTTTAATAATGTATCTGGTAATGAAGAAACAAGAGTTTGGATTGAATATGTTTACTCAGATGCTATTTTAGGTGTTACAAAACATTATATAGGTTTAAGTACAATACAGTTTACACCTACTGGGGGGATTTATGCTAATTACACTGAAGAAGATTATGGGCAATTATTAGCAGATAAACTTAATTTATCTTTAGTTACTAACTTTTTTGAAATTTTAGCACCTGATGGTTTAAAACAAGTTGGTATAAGAAAATTAAGAAATATTACTGCAGCTGATGCTAATGGGGTTTTACCTACTTATCAATATTCACCTAGACAACAATATTTTACAGCTAAAATACCCCAAACTGTTCAAAGAACATTATACGGAACTTATTCAACTAATCCAGCTGAATGTTTAGCTGATTATTTAACTAATAAAGTTTATGGTTGTGGTCAATCTATTTCAGATAATGATTTAGATTTAGATACATTTTATGCACATAAAGTATTTTGTGATACTTCAGTTACACATAACGACCCTGATGGTAATTCTGTAACAAGCAAAAGATATCAATGTAATGGATATGTAAATACAAATGATTCTAAAGATTTAAATATTTCTGATATTGTTAGTAATTCACAATCTATATTTAGTTATACATTAGGTAAATTTCAAATGCTTTCTGATACAACTGGATCAATTTCTTATGGTGGATCAAATAATGATTTTGATGAAACTAGTATATATGGTGATGTTACTGTAGTTAATGATGGTTTTAATTCTACATTAAATGAAATGAATTTACAATTTAAATCTAAAATAAATGAATATCAAGACGATCAAGTTTTTTTAGAATATGGCAATAAATATTTTAATGAACCTGTATTATCTAAAGATTTAACTTTAAAATTTATTAATACAAATGTTGAGGCTCAAAGAATTGGAACTGTAATAATGAATAAGTCTAGAAGTAATAAAATTATTTCATTTAAAACAGATACAAGAGCCGCAAATTTACAAGTTAATGATATAATAAGTGTTAAGGGTACTTATTATAATTTAGATAAAAATAGTGTATTTAGTCATAATTTTGTAACTAATACTTCAAATGGTTCAACAAGTAATGCTATAGGAGAATATGTTGTAAAAGTAGATTCTAGCCAACCTTATATTTATGAAGATACGCAAGAAGAAGCTAGGTTTTATGTTCCAGGCACAGTAGCTGGTTACGAAAAATTATCAAATTTTTATAAAGATTGTATTAATGGACAATTTTTTGATTCAACAGGTCAACTAACAGATGCACAAGTTAAATTAAATAATAAACTTGGTGAAATATTTTCATTTGTATCTTGTGAGTTAGATACTATATCATCATCTTATGGTTCTTATGGTGCAAAATTAACATTTTATGCTAACGATATAATTTCTGGTGGTATAAAAGAAGATTTTCAAATTGATGTAATAACAAACATTTTAAATTCTACATGGGGTTCATTAAATGTTATTAATACTGCATCTGAATTAGGTAGTTTATTTAAAATAAATAGTATTTCAGAAACAGAATTAAATGGTGGTCTTCAAGGATATTTTATAACTGCTCAAGAATATAATGCTAATGATTATACAGTTGGTACATTAACAGCTACTGCTGCTGCACCACCTATATCATCTACAAGAGGTTATCAAAATTTAGGAGTTGCTACAAATTTAGTTTTAAATAATACTTTTCCTTCTGCAACTACACCTTATATTGATGTAAGTTTTACTATGCCATCTAAAAATAATGTTGAAGGTGTTGAAATATATTATGGTAGTGGTGTAAATACTCCAGAAGCAAGTAGAATTTTAGTTCAAACTTTTTCTGCTCCTACTGGTAATTATGCTGGCGGATCAACTCAAAATTTTAATATACAAAATATACCTACTACAACAGATTTATATATTTGGGTAAGATTAACTAATTCATTTTCAAGAGGTGCATTTTCTACAGGATTAACTATTGGTAATTGGAACCCAACTACTAATATAACAACAATAGGTAATAATTCAATTGCACCTGTTTTATTAGGTTTTGATTATAATCAATATAGAAATTTAATTATTAACGGAGATTTTTTAATTCATCAAAGAGGATCTTCATCTACTACTAGTGCTAATCCAGGTTATCTTTTAACAGATATGTGGTATTCAGATATTAATAATTCTGGAACTTGGGTACATTCACATTCTAATGATACACCAGATAATACAGTATTAAGTAGATCTTATAAATTAGAAAATACAACAGTACCTACTTTAGGTGCTAGTTCTAAATTTAAATTTAAACAAATTATAGAAGGACAAAATTTACAAAAATTAAAATATGGTACAACTAATGCAGAAGATATAACTGTAACTTTTTGGGTTAAATCTAGCAAAACAGGTAACTATATTTTTGATTTATACAATCATGATGATAATAGACATATAAGTAAATTATATACTATTGATAATGCAAATGTATGGGAACAAAAATTAATAACTATCCCAGGTGATACTAACAATACATCAGCTTTTAATAATGATAATAATAAAAGTTTAGAAGTAAGTTGGTGGTTAACAGCTGGATCTGATTTTGATTCTGGTACTTTAAATACAAACTGGAATACAACAGCAGATGATGATAGAGCAGTAGGTCAAGTTAACTTGGCTGATACAGTAAATAATACATGGTTTATATCTGGAATACAATTAGAAGTTGGCAGTAATGCTAGTAAATTTGAAATAATTCCTTTTGATAAATCATTAGAAAGATGCCAAAGATATTTTTATAAATTGGTCAGCATTGTTGGTGAAGCGTTTCAAGGACATTCAAGTAGTCATTTAAGACATATGAATATTTGGTTTCCTGTTACAATGAGAGATACACCTACAATAAATGCTACATGGAGCACTGGAACTAGTCCAACAAATTTAAGTACAAAACAATATGCTAATGTTTGTATAAATATTGGATCAAATTCAACAAGTGCAAATTTAACAGGTTTTTCAGCTAGCGCTGAATTAACATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
f7f85499cb83e948a1306835311f57697c6af03c08f67ab4f34c80c6cc2e7716
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6331
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50