Protein
View in Explore- Genbank accession
- XZS47729.1 [GenBank]
- Protein name
- tail fiber protein
- RBP type
-
TFTSPTSP
- Protein sequence
-
MADQNLKQIQFKRSSTENKAPGADIVARGEIALNTHGRTLAIYTKDENDTVVQLAGKGVPFLDTSGTLSVDGTTTLKDNVTVSPNKSISFETTDLSGEITRHIVGKCATNDGWYIGAGGTSNSGILEIGTIDDGAETIQFVQRGPGNVEARKLVLLDGSGNTTLPGDLRLSSNKAIKIYSGSTLALEMGVGSNDVYIKNQRGVGVLQLTNDSNLTFRNSQVYYAMTGKGPGKDGTLLTNVENERQLKQDNFPVTTGGEVRWTKVALLKDPGSSQSRLQLMVTNGGNYGNTRSSIDFIDCSARSFPTSLTSSNIRTYLQVRRLGDPALDETNQLRYSLVRTSEGLELWFTQRAFIGGVKVALLSIAGGTEYYLPTGYTVSSTEPEGLVESTAIRIYDELNKPNVDGGTEGVLPINRGGTGGTSAAAARSNLGLGTAAIRDVGESSGNLLEVGAFGIGGNGRSLVDITSDVDLMTRLKALGGTVFRANTASGYTGAPYYSHGTGFYGRASDTMAALNIDYATGNVRVFAINDSGLASGRVNSNVLYGTANKPSKADVGLGNLTNDAQVKKAGDTMSGDLLISKESPGLFLNATNDTGNSVIWFRNKGVETGAVWAIPNTESSGEVRIRARTTAGVTGGEFKFKSDGTFTSPGSIDITNGAFNGKTVNTEYANFNNTSSTTTEQTVSISGSQHTPLLLDRPTNANLSIGFKLSGMNMKRLGIDINGDIRYGEAENQANNAWLLTSDTVNRWIVNFGRDIKVAGVVNSTGGFAGPVAAYDLADAKLDLNDLTLTGAAPGHVKVYSCPSMGGGSNITNKPSGVGGNFIVIVECIRKINDTDYTNRQVLRTSDSKRSWERWLTVSGTSKIWTPWRMIVVSGIDSDVSFNSVTTTTGNLNSGNDLIVANNARVGGNLGLGGASSTKYADKGVVIGQGSALLETTDGRVIVGSSGGGNAVELRPGGPTQTNNLVKVTATSGSGGDTAIEYAQGAKIRANNGGALIISSKQGQTIYLRPQGDANGGNEVRIDSNTMVVTGGFEAQNTKIAGNLNVSEDNRMIVLGRNTDIGLVKKSNMPGKMAIGKSNSFTVMVSTNTNNQINPADTFNDIFKVDADGNQTVYGNAQINRQLTVTSNTNLNSVLIVQGNTTLNTDLSVKGNSSFTGVINADGNINVASGKFVIAGQAPTDNSHLTNKKYVDDKVASAISNAGDTYLPLAGGTVTGTLIVTGNQLKTTSLWTTGDAAVNGVLTVDGRARFNQEFIVSTSVNVQNTGNSHLVFRKADGTEKGLIWADEPGSVSIRAGGISGKTWNFWNSGSCQFPGAISNFNGISSTTNYPAGQPNGTYSNTAGLVTRFSNGAYASLYFQEYVGHYHQAILNVNGFGRDDNFYFRSGGDFFCTRNGSFDNVEIRSDRRAKSDIKVIENALEKVETLSGNTYELHNTSGGTTRSAGLIAQEVQEVLPEAVTQDNEEDGGMLRLNYNSVIALLVESVKELSAEVKGLKAEIEELKSK
- Physico‐chemical
properties -
protein length: 1504 AA molecular weight: 158819,39280 Da isoelectric point: 5,86802 aromaticity: 0,06649 hydropathy: -0,29428
Domains
Domain architecture
XZS47729.1
1
1504 aa
STR 783–871 · CHP 1404–1498 ·
ATT Attachment Domain
STR Structural Domain
RBD Receptor-Binding Domain
CBM Carbohydrate-Binding Module
LEC Lectin-like Domain
ENZ Enzymatic Domain
CHP Intramolecular Chaperone
LNK Linker/Spacer Domain
TAS Tail-Associated Structural
TTP Tail Tubular Protein
UNK Uncharacterized Domain
Unmapped
Proteins with similar domain architecture
Tail Spike Domain Segmentation
Segmented into three structural domains: N-terminal, central, and C-terminal.
Domain layout
XZS47729.1
1
1504 aa
| Domain | Start | End | Length (AA) | Confidence |
|---|---|---|---|---|
| N-terminal | 1 | 732 | 732 | 0,1813 |
| Central domain | 733 | 948 | 217 | 0,4101 |
| C-terminal | 949 | 1504 | 555 | 0,7408 |
Note: Constraints were applied during segmentation.
Fixed 279 C-terminal predictions appearing before Central domain
Fixed 279 C-terminal predictions appearing before Central domain
N-terminal
Central domain
C-terminal
View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.
Taxonomy
Coding sequence (CDS)
Genbank protein accession
XZS47729.1
[NCBI]
Genbank nucleotide accession
PV784030.1
[NCBI]
CDS location
range 79799 -> 84313
strand +
strand +
CDS
ATGGCCGATCAGAACTTAAAACAAATACAATTTAAAAGAAGCAGTACAGAGAATAAAGCACCTGGTGCCGATATCGTAGCCCGTGGCGAAATCGCATTGAATACCCATGGGCGTACTCTTGCCATTTATACTAAAGATGAAAATGATACCGTAGTACAGCTCGCCGGTAAAGGGGTTCCATTTTTAGATACCTCTGGTACTCTTAGTGTTGATGGAACCACTACATTAAAAGACAACGTAACAGTTTCTCCGAATAAATCGATCAGTTTTGAAACTACTGATTTAAGCGGTGAAATAACTCGTCATATCGTTGGCAAATGCGCCACTAACGACGGTTGGTATATCGGCGCCGGTGGTACAAGCAATAGCGGTATTCTTGAAATCGGTACTATTGATGACGGCGCTGAAACTATTCAATTCGTACAACGCGGCCCGGGCAACGTTGAAGCCCGAAAACTGGTCTTACTTGATGGTTCGGGTAATACTACTCTTCCGGGTGATTTAAGATTATCTAGCAATAAAGCCATTAAAATTTACAGTGGAAGCACTCTTGCTCTTGAAATGGGTGTAGGCTCTAACGACGTCTATATTAAAAACCAACGAGGCGTAGGTGTTCTTCAATTAACTAATGATAGCAATCTGACCTTCAGAAATTCCCAGGTTTATTATGCCATGACTGGAAAAGGTCCTGGTAAAGATGGTACTCTTCTGACTAATGTAGAAAACGAGCGCCAACTTAAGCAGGATAATTTCCCTGTAACGACCGGCGGCGAAGTTAGATGGACCAAAGTTGCCCTTTTAAAAGACCCGGGGTCAAGCCAGAGTCGCTTGCAACTGATGGTGACTAATGGCGGTAACTACGGTAACACTCGCAGTTCTATTGACTTTATTGATTGCAGCGCTAGAAGCTTTCCAACCTCGTTAACAAGCAGTAACATTCGTACTTATCTGCAGGTCCGTCGACTTGGTGATCCGGCACTTGATGAGACCAATCAATTGCGTTATAGTCTAGTTCGTACCTCTGAAGGTTTAGAACTGTGGTTTACGCAGCGCGCATTTATCGGTGGAGTTAAAGTTGCACTGTTATCTATTGCCGGTGGTACTGAATACTATTTGCCTACTGGTTACACAGTTTCTTCAACAGAGCCGGAAGGTTTAGTTGAGAGTACGGCTATTCGTATCTACGACGAATTGAACAAGCCTAATGTTGATGGTGGCACTGAGGGTGTTCTGCCTATTAACCGTGGCGGTACTGGTGGTACTTCTGCAGCGGCAGCCCGTAGTAACTTAGGCCTTGGAACTGCGGCTATCCGTGATGTTGGTGAATCTAGCGGAAACTTGTTGGAAGTTGGTGCCTTTGGTATTGGCGGTAACGGAAGATCACTAGTAGATATTACTTCTGACGTTGATTTAATGACTCGCCTTAAGGCTCTTGGTGGTACAGTGTTCAGAGCTAACACAGCGAGTGGTTATACAGGGGCTCCTTATTACTCCCATGGCACCGGATTTTACGGAAGAGCTTCTGACACAATGGCTGCGCTTAATATAGATTATGCAACCGGTAATGTCAGAGTATTTGCTATAAACGATAGTGGTTTAGCAAGTGGAAGAGTAAATTCTAATGTTCTCTACGGCACAGCAAATAAGCCATCTAAGGCCGATGTCGGACTTGGTAATCTGACAAATGACGCCCAGGTTAAAAAAGCTGGTGATACAATGTCTGGTGATTTGCTTATCAGTAAAGAGTCACCTGGGTTGTTTTTGAATGCCACTAATGATACCGGAAACTCTGTAATTTGGTTTAGAAACAAAGGAGTTGAGACAGGTGCTGTATGGGCAATACCTAACACCGAGTCTTCGGGTGAGGTTCGAATTCGTGCTAGAACGACTGCTGGGGTCACAGGCGGCGAGTTCAAATTTAAATCTGACGGTACGTTTACATCTCCAGGTAGTATTGATATTACTAATGGTGCCTTTAATGGTAAAACGGTTAATACCGAATATGCCAACTTTAATAACACAAGTTCAACCACAACCGAACAAACAGTTTCTATTAGTGGTTCACAGCACACTCCTCTGTTACTGGATAGACCGACTAACGCGAACTTGTCTATCGGGTTTAAACTTTCCGGAATGAACATGAAACGTTTGGGTATTGATATAAACGGTGATATTCGTTACGGTGAAGCAGAAAACCAGGCAAACAACGCATGGCTGTTGACTTCGGATACAGTAAACAGATGGATTGTTAACTTTGGTCGTGATATTAAAGTTGCTGGTGTGGTTAATTCGACTGGTGGATTTGCTGGCCCTGTTGCAGCGTACGATTTGGCTGATGCTAAACTAGATCTTAATGATTTAACGCTAACTGGTGCTGCCCCAGGCCATGTTAAAGTTTATTCATGCCCTAGTATGGGTGGCGGTAGTAACATCACCAATAAACCTTCTGGCGTCGGTGGTAACTTTATTGTTATTGTTGAATGTATCCGTAAAATAAACGATACCGATTACACTAACCGCCAAGTATTACGCACATCTGATAGTAAGCGCAGTTGGGAACGTTGGTTAACTGTTAGCGGTACTTCTAAAATCTGGACGCCGTGGAGAATGATCGTTGTTAGCGGAATCGACTCCGATGTATCATTTAACTCTGTTACCACGACTACAGGAAACCTGAACAGCGGAAATGATTTGATTGTTGCTAACAACGCTCGCGTAGGTGGTAACTTAGGGTTAGGTGGTGCTTCTTCAACGAAATACGCTGATAAAGGTGTTGTGATTGGCCAAGGTAGTGCTCTGTTAGAAACTACTGATGGTCGTGTTATCGTTGGTAGTTCTGGTGGTGGTAATGCTGTTGAATTGCGTCCTGGTGGCCCAACTCAAACCAACAACCTGGTCAAAGTAACTGCTACATCTGGAAGTGGTGGTGACACTGCTATCGAGTATGCACAAGGCGCTAAAATTCGGGCTAATAACGGCGGCGCATTAATTATTTCTTCTAAACAAGGCCAAACAATCTATCTGAGACCGCAAGGTGATGCAAACGGTGGAAATGAAGTTCGTATTGATTCAAACACTATGGTCGTCACAGGCGGATTTGAGGCTCAGAACACTAAAATCGCAGGTAATTTAAATGTATCTGAAGATAATAGAATGATTGTTCTTGGCAGAAATACCGATATCGGTTTAGTCAAGAAAAGTAATATGCCAGGAAAAATGGCTATCGGTAAATCTAACTCGTTTACTGTTATGGTATCAACCAATACCAACAACCAAATTAATCCTGCGGATACGTTTAATGATATATTCAAGGTAGATGCTGACGGAAACCAAACCGTTTACGGAAATGCCCAAATTAACAGACAGCTTACAGTAACAAGTAATACTAACTTGAACTCTGTTCTTATTGTTCAAGGTAATACTACTCTTAATACTGATTTGTCTGTTAAAGGCAACTCCAGCTTCACCGGTGTGATTAACGCTGATGGAAACATCAACGTCGCTTCTGGTAAGTTTGTTATTGCGGGTCAAGCTCCTACTGATAACTCGCATCTGACCAACAAAAAATACGTTGACGATAAAGTTGCTTCTGCTATTAGTAATGCTGGTGATACTTATCTTCCGTTAGCGGGTGGTACTGTGACTGGTACATTAATAGTTACAGGTAATCAACTGAAAACTACTTCTCTGTGGACTACCGGAGACGCTGCAGTTAATGGTGTTTTAACTGTTGATGGAAGGGCTAGATTTAATCAAGAGTTCATTGTATCAACTTCAGTTAACGTCCAGAACACCGGTAACAGTCATTTAGTCTTCCGTAAAGCAGATGGTACGGAAAAAGGCCTTATTTGGGCTGATGAGCCTGGTAGCGTTAGTATAAGAGCTGGTGGTATCTCAGGGAAGACGTGGAATTTCTGGAACAGCGGTTCTTGTCAATTCCCAGGTGCTATTAGTAACTTTAACGGAATTAGCTCAACTACTAATTATCCCGCAGGACAGCCTAACGGTACGTACAGTAATACCGCAGGATTGGTAACTAGATTTAGTAATGGTGCTTATGCTTCGTTATATTTCCAAGAGTATGTAGGACATTATCACCAGGCTATTCTTAATGTTAACGGATTTGGTCGAGATGACAATTTCTATTTCAGATCCGGTGGTGACTTCTTCTGTACTCGTAATGGTTCTTTCGATAACGTTGAGATTCGTTCTGACCGTAGAGCTAAATCAGATATTAAAGTTATTGAAAATGCTTTGGAAAAAGTAGAAACCTTATCTGGTAATACTTATGAGCTTCACAATACATCTGGCGGTACTACCCGTTCTGCTGGTTTAATCGCACAAGAAGTTCAAGAAGTTCTTCCTGAAGCAGTTACTCAGGATAATGAAGAAGATGGTGGTATGCTTCGTCTGAATTATAACTCAGTAATTGCTCTTCTTGTTGAATCAGTGAAAGAACTTTCAGCTGAGGTCAAAGGTCTTAAAGCCGAAATTGAAGAACTTAAATCTAAATAA
Genome Context
Tertiary structure
XZS47729.1
ColabFold structure
Source
ColabFold
pLDDT
69.2
Oligomeric state
monomer