Protein

View in Explore

Genbank accession

QLF88461.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MAAAAPIIGAITSKGIGGAILRFALSLAVSYITQKLFAPDMPGVEGGAGSGKDPGVKQRIPSDPSNKLPVVYGQDKIHGSIIFADITSDNKTMAFIIALCEGPINKIGTSNYGTNSGIYWDDYELSFDLAGNVINATHADGGTDSWLNGNLKIVKYPDGGRCLDMETFSSKWNSGSQNRYLPDVAYAYVELNYDREDNVTGLTSKLGFEVEGKLIRTISSAPSLNGPTPTTTTIQGSLANPNIFDTSVKFANFSGYQLWHWVNPYNGGVNYSYPHSYVAPGGTYNIIDLGPSSDPNAPYDLNDYITNGVTPTGLGTGGEVEFDFINVGEQYHLSNGNLTNFTPNSYVDSNGVTQPDDGRRLINAIHFKQWGNNYSNSFFNNVSGNEETRVWIEYVYSDAILGVTKHYIGLSTIQFTPTGGIYANYTEEDYGQLLADKLNLSLVTNFFEILAPDGLKQVGIRKLRNITAADANGVLPTYQYSPRQQYFTAKIPQTVQRTLYGTYSTNPAECLADYLTNKVYGCGQSISDNDLDLDTFYAHKVFCDTSVTHNDPDGNSVTSKRYQCNGYVNTNDSKDLNISDIVSNSQSIFSYTLGKFQMLSDTTGSISYGGSNNDFDETSIYGDVTVVNDGFNSTLNEMNLQFKSKINEYQDDQVFLEYGNKYFNEPVLSKDLTLKFINTNVEAQRIGTVIMNKSRSNKIISFKTDTRAANLQVNDIISVKGTYYNLDKNSVFSHNFVTNTSNGSTSNAIGEYVVKVDSSQPYIYEDTQEEARFYVPGTVAGYEKLSNFYKDCINGQFFDSTGQLTDAQVKLNNKLGEIFSFVSCELDTISSSYGSYGAKLTFYANDIISGGIKEDFQIDVITNILNSTWGSLNVINTASELGSLFKINSISETELNGGLQGYFITAQEYNANDYTVGTLTATAAAPPISSTRGYQNLGVATNLVLNNTFPSATTPYIDVSFTMPSKNNVEGVEIYYGSGVNTPEASRILVQTFSAPTGNYAGGSTQNFNIQNIPTTTDLYIWVRLTNSFSRGAFSTGLTIGNWNPTTNITTIGNNSIAPVLLGFDYNQYRNLIINGDFLIHQRGSSSTTSANPGYLLTDMWYSDINNSGTWVHSHSNDTPDNTVLSRSYKLENTTVPTLGASSKFKFKQIIEGQNLQKLKYGTTNAEDITVTFWVKSSKTGNYIFDLYNHDDNRHISKLYTIDNANVWEQKLITIPGDTNNTSAFNNDNNKSLEVSWWLTAGSDFDSGTLNTNWNTTADDDRAVGQVNLADTVNNTWFISGIQLEVGSNASKFEIIPFDKSLERCQRYFYKLVSIVGEAFQGHSSSHLRHMNIWFPVTMRDTPTINATWSTGTSPTNLSTKQYANVCINIGSNSTSANLTGFSASAELT

Physico‐chemical properties

protein length:	1389 AA
molecular weight:	152561,53850 Da
isoelectric point:	4,81741
aromaticity:	0,11447
hydropathy:	-0,35709

Domains

Domains [InterPro]

DC_1879
ATT
1–257

DC_1879 DC_0187

QLF88461.1

1 1389

Architecture

ATT

STR

ATT 1-257 | STR 458-1378 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1879	ATT	DC_1879	1	257	Novel HMM	DC_1879	N-terminal	Low	Positional only	54 proteins / 54 hits
DC_0187	STR	DC_0187	458	1378	Novel HMM	DC_0187	Central	Low	Positional only	466 proteins / 466 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pelagibacter phage Kolga EXVC016S [NCBI]	2736233	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Candidatus Pelagibacter sp [NCBI]	2024849	Pseudomonadota > Alphaproteobacteria > Candidatus Pelagibacterales > Candidatus Pelagibacteraceae > Candidatus Pelagibacter >

Coding sequence (CDS)

Genbank protein accession

QLF88461.1 [NCBI]

Genbank nucleotide accession

MT375529.1 [NCBI]

CDS location

range 8906 -> 13075
strand +

CDS

ATGGCAGCGGCGGCACCTATTATAGGGGCAATAACATCTAAAGGTATTGGAGGGGCAATTCTTAGATTTGCTTTATCACTTGCAGTATCATATATTACACAAAAATTATTTGCACCTGATATGCCAGGTGTCGAAGGTGGTGCTGGTTCAGGTAAAGATCCAGGTGTTAAACAAAGGATACCTTCAGATCCATCTAATAAACTTCCTGTTGTTTATGGTCAAGATAAAATACATGGATCTATTATATTTGCAGATATAACTAGTGATAATAAAACAATGGCTTTTATTATTGCTTTATGTGAAGGCCCAATTAATAAAATAGGTACATCTAATTATGGCACTAACAGTGGTATATATTGGGATGACTATGAATTATCTTTTGACTTAGCTGGAAACGTTATTAATGCTACTCATGCTGATGGCGGAACTGATAGCTGGTTAAATGGTAATTTAAAAATTGTAAAATACCCAGATGGTGGAAGATGTTTAGATATGGAAACCTTTAGTTCTAAATGGAATTCAGGATCACAAAATAGATATTTACCAGATGTTGCATATGCATATGTAGAATTAAATTATGATAGAGAAGATAATGTTACAGGATTAACTAGCAAACTAGGTTTTGAAGTTGAAGGTAAATTAATTAGAACAATTAGTTCGGCTCCAAGTTTAAATGGGCCAACGCCAACAACAACAACTATACAGGGTTCTTTGGCTAATCCAAATATTTTTGATACTTCAGTTAAATTTGCAAATTTTTCAGGGTATCAACTTTGGCATTGGGTTAATCCATATAATGGTGGAGTAAATTATAGTTACCCTCATTCTTATGTTGCTCCTGGAGGAACATATAATATTATAGATTTAGGCCCTTCATCAGACCCAAATGCACCTTATGATTTAAATGATTATATTACAAACGGTGTTACACCAACAGGTTTAGGTACTGGTGGTGAAGTAGAATTTGACTTTATTAATGTTGGAGAACAATATCATTTATCTAATGGAAATCTTACAAATTTTACACCTAATAGCTATGTCGATAGCAATGGTGTTACACAACCAGATGATGGTAGAAGATTAATTAATGCTATACATTTTAAACAATGGGGTAATAATTATTCTAATTCATTTTTTAATAATGTATCTGGTAATGAAGAAACAAGAGTTTGGATTGAATATGTTTACTCAGATGCTATTTTAGGTGTTACAAAACATTATATAGGTTTAAGTACAATACAGTTTACACCTACTGGGGGGATTTATGCTAATTACACTGAAGAAGATTATGGGCAATTATTAGCAGATAAACTTAATTTATCTTTAGTTACTAACTTTTTTGAAATTTTAGCACCTGATGGTTTAAAACAAGTTGGTATAAGAAAATTAAGAAATATTACTGCAGCTGATGCTAATGGGGTTTTACCTACTTATCAATATTCACCTAGACAACAATATTTTACAGCTAAAATACCCCAAACTGTTCAAAGAACATTATACGGAACTTATTCAACTAATCCAGCTGAATGTTTAGCTGATTATTTAACTAATAAAGTTTATGGTTGTGGTCAATCTATTTCAGATAATGATTTAGATTTAGATACATTTTATGCACATAAAGTATTTTGTGATACTTCAGTTACACATAACGACCCTGATGGTAATTCTGTAACAAGCAAAAGATATCAATGTAATGGATATGTAAATACAAATGATTCTAAAGATTTAAATATTTCTGATATTGTTAGTAATTCACAATCTATATTTAGTTATACATTAGGTAAATTTCAAATGCTTTCTGATACAACTGGATCAATTTCTTATGGTGGATCAAATAATGATTTTGATGAAACTAGTATATATGGTGATGTTACTGTAGTTAATGATGGTTTTAATTCTACATTAAATGAAATGAATTTACAATTTAAATCTAAAATAAATGAATATCAAGACGATCAAGTTTTTTTAGAATATGGCAATAAATATTTTAATGAACCTGTATTATCTAAAGATTTAACTTTAAAATTTATTAATACAAATGTTGAGGCTCAAAGAATTGGAACTGTAATAATGAATAAGTCTAGAAGTAATAAAATTATTTCATTTAAAACAGATACAAGAGCCGCAAATTTACAAGTTAATGATATAATAAGTGTTAAGGGTACTTATTATAATTTAGATAAAAATAGTGTATTTAGTCATAATTTTGTAACTAATACTTCAAATGGTTCAACAAGTAATGCTATAGGAGAATATGTTGTAAAAGTAGATTCTAGCCAACCTTATATTTATGAAGATACGCAAGAAGAAGCTAGGTTTTATGTTCCAGGCACAGTAGCTGGTTACGAAAAATTATCAAATTTTTATAAAGATTGTATTAATGGACAATTTTTTGATTCAACAGGTCAACTAACAGATGCACAAGTTAAATTAAATAATAAACTTGGTGAAATATTTTCATTTGTATCTTGTGAGTTAGATACTATATCATCATCTTATGGTTCTTATGGTGCAAAATTAACATTTTATGCTAACGATATAATTTCTGGTGGTATAAAAGAAGATTTTCAAATTGATGTAATAACAAACATTTTAAATTCTACATGGGGTTCATTAAATGTTATTAATACTGCATCTGAATTAGGTAGTTTATTTAAAATAAATAGTATTTCAGAAACAGAATTAAATGGTGGTCTTCAAGGATATTTTATAACTGCTCAAGAATATAATGCTAATGATTATACAGTTGGTACATTAACAGCTACTGCTGCTGCACCACCTATATCATCTACAAGAGGTTATCAAAATTTAGGAGTTGCTACAAATTTAGTTTTAAATAATACTTTTCCTTCTGCAACTACACCTTATATTGATGTAAGTTTTACTATGCCATCTAAAAATAATGTTGAAGGTGTTGAAATATATTATGGTAGTGGTGTAAATACTCCAGAAGCAAGTAGAATTTTAGTTCAAACTTTTTCTGCTCCTACTGGTAATTATGCTGGCGGATCAACTCAAAATTTTAATATACAAAATATACCTACTACAACAGATTTATATATTTGGGTAAGATTAACTAATTCATTTTCAAGAGGTGCATTTTCTACAGGATTAACTATTGGTAATTGGAACCCAACTACTAATATAACAACAATAGGTAATAATTCAATTGCACCTGTTTTATTAGGTTTTGATTATAATCAATATAGAAATTTAATTATTAACGGAGATTTTTTAATTCATCAAAGAGGATCTTCATCTACTACTAGTGCTAATCCAGGTTATCTTTTAACAGATATGTGGTATTCAGATATTAATAATTCTGGAACTTGGGTACATTCACATTCTAATGATACACCAGATAATACAGTATTAAGTAGATCTTATAAATTAGAAAATACAACAGTACCTACTTTAGGTGCTAGTTCTAAATTTAAATTTAAACAAATTATAGAAGGACAAAATTTACAAAAATTAAAATATGGTACAACTAATGCAGAAGATATAACTGTAACTTTTTGGGTTAAATCTAGCAAAACAGGTAACTATATTTTTGATTTATACAATCATGATGATAATAGACATATAAGTAAATTATATACTATTGATAATGCAAATGTATGGGAACAAAAATTAATAACTATCCCAGGTGATACTAACAATACATCAGCTTTTAATAATGATAATAATAAAAGTTTAGAAGTAAGTTGGTGGTTAACAGCTGGATCTGATTTTGATTCTGGTACTTTAAATACAAACTGGAATACAACAGCAGATGATGATAGAGCAGTAGGTCAAGTTAACTTGGCTGATACAGTAAATAATACATGGTTTATATCTGGAATACAATTAGAAGTTGGCAGTAATGCTAGTAAATTTGAAATAATTCCTTTTGATAAATCATTAGAAAGATGCCAAAGATATTTTTATAAATTGGTCAGCATTGTTGGTGAAGCGTTTCAAGGACATTCAAGTAGTCATTTAAGACATATGAATATTTGGTTTCCTGTTACAATGAGAGATACACCTACAATAAATGCTACATGGAGCACTGGAACTAGTCCAACAAATTTAAGTACAAAACAATATGCTAATGTTTGTATAAATATTGGATCAAATTCAACAAGTGCAAATTTAACAGGTTTTTCAGCTAGCGCTGAATTAACATAA

Genome Context

Tertiary structure

PDB ID

f7f85499cb83e948a1306835311f57697c6af03c08f67ab4f34c80c6cc2e7716

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6331

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence