Genbank accession
XAG96561.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence Phold
Probability 1,00
Protein sequence
MDNEKFDQFNTPLSPMRLQSQLGKEVKRMYKEGQNVVKLSLARVVKVNYKYNTVDVVTVQGKDAFVKNPNDNGKYSARLPVKFGGRTPDGNVYGSTTLATVGSLVLIGFLEGNKEYPIVLNIYSDSDNQSQLTRTTFTGGDIADEDMQRELWQIFDLYPSMTYKNIDGNGNQEITFSGKSFMYITDTDPDNAYVQDGAFDYQDLPSSRYADGELIEPKSPNAPTVLYVHQGIYDNHRVTMFIKADGTFRLGSRHVEGEGITFMQMGTDGAFEITQKKDTADPEQESTKFSKFGITPEGFLVLKSQKHLFEVNNDGVYVDGKPIAAFVGGTDPDGNQITFQDIIDGLNELKTSITVMNGVISTKISRTEYNIGLEDIKEFTEELVNGVNSEIEDIGKQISDLDSYIDGAFKDGIIDESEAKVIQGYINTINTEKADIDGKYTEIYNNKYLSEAGKASLKSAKDAYDAKHDSLIAAIHGAIVDGKITQEDRDAVNQAFAEYRAALGDLSKAFESAADIISFAKAKEALDDAKDYVNGEIKIVNSEITQLAESITSKVDSTTFTNAISDVNSKIAATDETLTKEIQDTNSRVDDVEKNVTYKADILSTNGNIFRDGSTDTTLFCKVYHGNQELTNTLDASLFKWTRVSDDAAGDEQWNNAHSSGMKSVHITAQDVPSRATFTCDVTGIAAAQISIIGFAYDITISDTPPENPTEGTLWMNTSGEPPYRLYIYKNGNWDPTDYDSLRQLDPDAYDKIQDTYNAITDLDLDNRLTRYERSVVRGELANIIGVYLSATDDMPTLAEVDANGVGSLYTLRQQAREIGVPITDADYVKLGDAYTALRTYLSSLSIKPWDIDSSETLDINSDEWDAAWNGYYYAANLLEIKVTKRQKEYSDIVADGAKQDAIKAVSNAQQFQEVPLANPTIINSPITSLGLPSFQGRHVDLWSMNPDAESSWALNGNRLVPITNPIFNSAGSLTLYTKLYGDGTINDEFTWDLEGRAVKIKRWDDVSLDGTLDWKFDQDFTGYKQVKFGEFSEYPVADMAIQGVKYDGAFLAAASGTTSAADEVMVDNDTNTLFITVSDTDSGWGESYTPTEPEIKAYFNGWRMCNGTFGVPYDGTGSKVWYPIGDTDLSRSTMSGPTHNPVPTDSSPTIKEQSINEYQIVYRYIDAIQQAVTYDGILSLLEGENSITIDYPVNTPPITDGKIKYATNLATVTDSLKYLIPTMQRRISKAEEKITDSSIVNTVTQSIEYQIAMSSKASVEDLGNYATSGELDDLSKDVNDRITNAVNAIDFSPYVTKSELEQTANNITAKFYATGGLNLIKNSIGFAGLDFWDLTYPPNLVETIRTNELDSLGFGSGFLFKPDGVNKGIAQTVKVNVGQPYTLSWYLNKRTGGDTMSYRFWVQIQEDGVTKMQIADNSTMTNTGYDASHMTYIPQSDTITVRFIGYADVDATLTGIMLTIGDVPLQWSLATGEVYNTHIRMDVNGIRVSQLDENRKEIGYTQITPQEFAGYYDAEGNGSFQKIFYLNGEETVTKKLRAETEMTMGPIKILNIETETRRGWAYVPNID
Physico‐chemical
properties
protein length:1568 AA
molecular weight: 173622,56400 Da
isoelectric point:4,48934
aromaticity:0,09758
hydropathy:-0,43010

Domains

Domains [InterPro]
DC_0209
STR
16–555
DC_0835
STR
465–1557
XAG96561.1
1 1568
Architecture
STR
STR 16-1557 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacillus phage KKP_4049
[NCBI]
3109402 No lineage information
Host Bacillus licheniformis
[NCBI]
1402 cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
XAG96561.1 [NCBI]
Genbank nucleotide accession
PP579744.1 [NCBI]
CDS location
range 91970 -> 96676
strand -
CDS
TTGGATAATGAAAAGTTCGATCAATTTAACACCCCTCTTTCACCTATGAGACTTCAATCTCAACTAGGTAAAGAGGTTAAGAGGATGTACAAAGAAGGGCAGAATGTTGTTAAACTGTCATTGGCTCGTGTCGTTAAAGTTAACTACAAATACAACACTGTCGATGTAGTAACGGTCCAAGGGAAAGACGCATTCGTAAAGAACCCTAATGATAACGGTAAATATTCTGCTCGGTTACCCGTAAAATTCGGAGGTAGAACACCAGACGGTAATGTATATGGGTCAACAACGCTTGCAACTGTAGGCTCCTTGGTCCTTATCGGGTTTCTTGAGGGGAACAAGGAGTATCCTATCGTCCTGAATATCTACAGCGACTCAGATAACCAGTCTCAGCTAACAAGAACAACGTTCACAGGCGGAGATATTGCAGATGAAGATATGCAGAGAGAGCTGTGGCAGATATTCGATCTGTACCCTTCTATGACATATAAGAATATTGACGGTAACGGGAACCAAGAAATCACCTTCTCCGGTAAGTCCTTTATGTACATCACAGACACGGACCCAGACAACGCCTATGTTCAAGATGGGGCATTTGACTATCAAGACCTTCCTAGTTCTCGTTATGCAGATGGAGAGCTAATTGAACCTAAGTCCCCTAATGCTCCTACAGTTCTATATGTCCACCAAGGCATCTACGATAATCACCGGGTGACAATGTTCATTAAAGCTGATGGAACATTCCGACTTGGTAGTAGGCATGTAGAGGGTGAAGGAATTACCTTCATGCAAATGGGTACAGATGGAGCATTTGAGATCACTCAGAAAAAGGACACAGCAGACCCAGAACAAGAATCAACTAAATTTTCAAAGTTTGGTATCACTCCAGAAGGGTTCCTTGTCCTTAAATCTCAAAAGCATTTATTCGAAGTCAATAATGATGGTGTTTATGTTGATGGAAAACCTATCGCAGCTTTTGTTGGTGGTACTGATCCGGATGGAAACCAGATTACTTTCCAAGACATCATTGACGGCTTGAATGAGCTTAAAACAAGTATCACTGTGATGAATGGGGTTATCTCTACAAAGATCAGCAGAACAGAGTATAACATTGGATTAGAAGATATAAAGGAATTTACTGAAGAGTTGGTCAACGGAGTTAACTCTGAAATTGAGGATATCGGAAAACAGATTTCTGACTTAGATAGTTATATCGATGGTGCGTTTAAAGATGGCATTATTGATGAGTCTGAGGCAAAAGTTATTCAGGGGTACATTAACACGATTAACACAGAGAAAGCAGACATAGACGGTAAGTACACTGAGATTTATAACAACAAGTACTTGTCTGAAGCAGGTAAAGCTAGCCTAAAAAGTGCCAAAGATGCTTACGATGCAAAACACGATAGTTTAATTGCAGCTATTCACGGAGCCATTGTTGACGGTAAGATCACACAAGAAGACCGTGATGCAGTTAATCAGGCTTTTGCAGAGTACAGAGCGGCCCTTGGAGACCTCTCTAAGGCGTTTGAATCTGCTGCGGATATTATCTCCTTCGCTAAAGCTAAAGAAGCTCTAGACGATGCCAAAGACTATGTTAACGGGGAGATTAAGATCGTCAACTCTGAGATCACTCAGTTAGCTGAATCTATTACGTCTAAAGTAGACTCCACAACATTCACAAATGCTATCTCTGACGTTAACTCTAAGATTGCAGCTACGGACGAGACATTGACTAAAGAAATCCAAGATACGAATAGTCGTGTAGATGACGTTGAGAAGAACGTAACCTATAAGGCTGACATTCTAAGCACCAACGGAAACATCTTTAGAGATGGGTCTACAGACACTACTTTATTCTGTAAAGTGTACCATGGAAATCAAGAGTTAACAAACACTTTAGATGCTAGCCTGTTTAAGTGGACTCGTGTTTCCGATGATGCAGCAGGAGACGAACAATGGAACAATGCTCATTCTTCCGGAATGAAGTCTGTACACATTACTGCACAGGACGTTCCAAGCAGAGCAACATTCACTTGTGATGTGACAGGTATTGCCGCAGCTCAGATTTCTATTATTGGGTTTGCTTACGACATTACCATTAGTGATACTCCTCCGGAAAACCCAACAGAAGGAACACTCTGGATGAATACTTCAGGGGAACCTCCGTATCGCTTGTACATTTACAAAAACGGAAACTGGGACCCAACAGACTATGATAGTCTTCGTCAACTGGACCCAGATGCTTACGATAAAATTCAAGACACATATAATGCCATTACTGACTTGGATTTAGATAACAGACTTACTCGTTATGAACGAAGCGTAGTTCGAGGAGAGTTGGCAAACATCATCGGTGTTTATCTTTCTGCAACTGATGATATGCCTACACTAGCAGAAGTAGACGCTAACGGGGTAGGGTCCTTGTACACTCTTAGACAGCAAGCTAGAGAGATCGGTGTACCTATCACGGATGCGGATTATGTTAAACTTGGGGATGCTTATACAGCGCTGAGAACATACCTATCTAGCCTAAGCATAAAACCGTGGGATATTGACTCTTCAGAAACACTTGATATTAACAGCGATGAGTGGGATGCGGCATGGAATGGTTACTATTACGCAGCTAACCTTCTAGAAATTAAAGTCACGAAACGACAGAAAGAGTATTCTGATATAGTAGCAGACGGGGCTAAACAGGATGCAATTAAAGCGGTCAGTAACGCACAGCAATTTCAGGAAGTTCCGTTAGCTAACCCAACAATTATTAATTCTCCGATTACAAGTTTAGGTCTACCATCATTCCAAGGAAGACACGTAGACTTGTGGTCAATGAACCCAGATGCAGAGTCATCGTGGGCGCTAAACGGAAACAGGCTTGTACCTATCACGAATCCAATTTTCAACTCAGCAGGGTCTTTAACACTGTATACAAAGCTATACGGGGATGGAACGATTAATGATGAGTTTACATGGGATTTAGAGGGTAGAGCAGTTAAGATTAAGCGATGGGACGATGTATCTCTAGACGGTACACTTGACTGGAAGTTCGATCAAGATTTCACCGGATACAAACAAGTTAAATTCGGAGAGTTCTCTGAGTATCCTGTTGCAGATATGGCAATCCAAGGGGTTAAATATGACGGAGCATTCTTAGCCGCTGCCAGTGGCACTACAAGTGCTGCTGATGAGGTAATGGTGGATAACGATACTAATACGTTGTTTATCACTGTAAGTGACACAGACAGCGGATGGGGGGAATCATATACACCTACAGAACCAGAGATCAAAGCGTATTTTAATGGATGGAGAATGTGTAACGGAACATTCGGTGTCCCGTATGATGGAACAGGAAGTAAAGTTTGGTACCCTATTGGAGACACAGACCTAAGCCGTTCAACTATGTCTGGACCAACACACAACCCAGTTCCTACAGACTCTTCTCCAACGATTAAAGAGCAGTCCATTAATGAGTACCAGATCGTTTACCGTTACATAGATGCAATCCAGCAAGCAGTGACTTATGATGGCATACTGTCCCTGTTGGAAGGGGAGAACTCAATCACAATTGATTACCCGGTCAACACTCCTCCGATAACTGACGGTAAGATCAAATACGCTACAAACCTTGCTACTGTTACAGACAGTTTGAAATACCTGATCCCTACGATGCAAAGAAGGATTTCTAAAGCAGAGGAAAAGATTACAGACAGCTCAATCGTCAACACCGTTACTCAGTCTATAGAGTATCAGATTGCTATGTCAAGTAAAGCTAGTGTCGAGGACTTAGGAAACTATGCAACTTCTGGAGAGCTAGATGACCTTTCCAAGGATGTCAACGATAGAATCACAAATGCAGTAAATGCAATTGATTTCTCTCCTTATGTTACTAAGTCAGAATTAGAGCAGACAGCTAACAACATTACTGCCAAGTTCTACGCTACTGGTGGTTTGAACTTAATTAAAAACTCTATTGGATTTGCAGGACTGGACTTTTGGGATTTGACTTACCCTCCGAATCTTGTTGAAACTATTAGAACCAACGAACTAGACAGTCTTGGATTCGGGAGTGGGTTCCTGTTTAAACCTGATGGTGTTAATAAAGGGATCGCCCAAACTGTTAAAGTTAATGTGGGGCAGCCTTACACATTATCTTGGTATCTGAATAAAAGGACAGGCGGAGACACCATGTCTTACCGATTCTGGGTCCAGATTCAGGAAGACGGGGTAACAAAGATGCAGATTGCAGATAACAGTACAATGACAAACACAGGTTATGATGCAAGTCATATGACCTATATCCCTCAATCTGACACAATCACTGTTAGATTTATCGGTTACGCTGATGTAGACGCTACCTTAACGGGAATAATGCTAACCATCGGGGACGTACCTTTACAGTGGTCTCTCGCTACAGGGGAAGTATACAACACTCATATCCGGATGGACGTTAATGGAATCCGAGTATCTCAGCTAGACGAGAACCGAAAAGAGATCGGGTATACGCAGATCACTCCTCAAGAGTTTGCAGGTTACTACGATGCAGAGGGTAACGGTTCTTTCCAAAAGATTTTCTATCTTAATGGAGAGGAAACTGTAACAAAGAAACTTCGAGCAGAAACAGAAATGACGATGGGGCCTATTAAAATCCTGAATATCGAGACAGAAACTCGGAGAGGGTGGGCTTACGTACCGAATATAGACTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
1977897e8e8b553f27973ae2679ff6230b38bd4729760466e27877326d04a030
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7536
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50