Genbank accession
WAX13162.1 [GenBank]
Protein name
long-tail fiber proximal subunit
RBP type
TSP
Evidence RBPdetect
Probability 0,57
TF
Evidence RBPdetect2
Probability 0,80
Protein sequence
MAEIKRKFRAEDGLDAGGDKIINVALADRTVGTDGVNVDYLIQENTVQQYDPTRGYLKDFVIIYDNRFWAAINDIPKPAGAFNSGRWRALRTDANWITVSSGSYQLKSGEAISVNTAAGNDITFTLPSSPIDGDTIVLQDIGGKPGVNQVLIVAPVQSIVNFRGEQVRSVLMTHPKSQLVLIFSNRLWQMYVADYSREAVVVTPANTYQAQSNDFIVRRFTSAAPINIKLPRFANHGDIINFVDLDKLNPLYHTIVTTYDETTSIQEDGTHSIEGRTSIDGFLMYDDNEKLWRLFDGDSKARLRIITTNSNIRPNEEVMVFGANNGMTQTIELQLPTNISVGDTVKISMNYMRKGQTVKIKAAGEDKIASSVQLLQFPKRSEYPPEAEWVTVQELVFNGETNYVPVLQLAYIEDSDGKYWVVQQNVPTVERVDSLNDSTRARLGVIALATQAQANADLENSPQKELAITPETLANRTATETRRGIARIATTAQVNQNTTFSFADDIIITPKKLNERTATETRRGVAEIATQQETNAGTDDTTIITPKKLQARQGSESLSGIVTFVSTAGATPASSRELNGTNVYNKNTNNLVVSPKALDQYKATPTQQGAVILAVESEVIAGKSQEGWANAVVTPETLHKKTSTDGRIGLIEIATQSEVNTGTDYTRAVTPKTLNDRIATESLSGIAEIATQVEFDAGVDDTRISTPLKIKTRFNSTDRTSVVALSGLVESGTLWDHYTLNILEANETQRGTLRVATQVEAAAGTLDNVLITPKKLLGTKSTEAQEGVIKVATQSETVTGTSANTAVSPKNLKWIVQSEPTWAATTAIRGFVKMSEGAITFVGNATAGSTQALDLYEKNSYAISPYELNKTLGNFLPRLAKAADSDKLDNLDSTQFIRRDVAQDINATMTFKQPARIESTLTATGVVNLSGSVTSNNTTLTGATAINSNSTVGAQNYIEFTSLSQGSGTWTSQHDSNVKAPVFLNITTLAGASRYVPLIKQRYKDGTFTFGTLTNEPTSNDEGAFILHYIDAVKTQRKWSFRRNGDLEISAGNFVLGNGTAVINGGLNVTKASGITTTSLVANSESRFEGAVTINNFLTVSNKATINNGLDVQKYARVTGDKTSDIYSRKPTMDNVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGALPSDNATMGNLTIRDFLRIGNVRIVPDPVNKSVKFEWIE
Physico‐chemical
properties
protein length:1281 AA
molecular weight: 140004,85120 Da
isoelectric point:5,45486
aromaticity:0,07494
hydropathy:-0,34052

Domains

View on InterPro
WAX13162.1
1 1281 aa
ATT 1131–1229 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Tail Spike Domain Segmentation

Segmented into three structural domains: N-terminal, central, and C-terminal.

WAX13162.1
1 1281 aa
Domain Start End Length (AA) Confidence
N-terminal 1 1029 1029 0,8503
Central domain 1030 1228 200 0,2607
C-terminal 1229 1281 52 0,2493
N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Taxonomy

Coding sequence (CDS)

Genbank protein accession
WAX13162.1 [NCBI]
Genbank nucleotide accession
OP172785 [NCBI]
CDS location
range 96613 -> 100458
strand +
CDS
ATGGCCGAGATTAAAAGAAAGTTCAGAGCAGAAGATGGTCTGGACGCAGGTGGTGATAAAATAATCAACGTAGCTTTAGCTGATCGTACCGTAGGAACTGACGGTGTTAACGTTGATTACTTAATTCAAGAAAATACAGTTCAACAATACGATCCAACTCGTGGATATTTAAAAGATTTTGTAATCATTTATGATAACCGCTTTTGGGCTGCTATAAATGATATTCCAAAACCGGCAGGAGCTTTTAATAGCGGACGCTGGAGAGCATTACGTACCGATGCTAACTGGATTACAGTCTCATCTGGTTCATATCAATTAAAATCCGGTGAAGCTATTTCGGTTAACACTGCAGCTGGTAATGATATTACGTTTACTTTACCATCTTCCCCAATTGACGGTGATACTATCGTTCTCCAAGATATTGGAGGAAAACCTGGAGTTAACCAAGTTTTAATTGTAGCTCCAGTGCAAAGTATTGTAAACTTCAGAGGCGAACAAGTACGTTCAGTACTAATGACTCATCCAAAGTCACAGCTAGTTTTAATTTTTAGTAATCGTCTGTGGCAAATGTATGTAGCTGATTATAGTAGAGAAGCTGTAGTTGTAACACCAGCGAATACTTATCAAGCGCAATCTAACGATTTTATCGTACGTAGATTTACTTCTGCTGCACCGATTAATATTAAACTTCCGAGATTTGCTAATCACGGCGATATTATTAATTTCGTCGATTTGGACAAATTAAATCCACTTTATCATACAATTGTTACGACATACGATGAAACTACTTCAATACAAGAAGATGGAACTCATTCTATTGAAGGCCGCACATCGATTGACGGTTTCTTGATGTATGATGATAATGAAAAATTGTGGAGATTGTTTGACGGGGACAGTAAAGCACGTTTACGCATTATAACGACTAATTCAAATATTCGTCCAAATGAAGAAGTTATGGTATTTGGTGCGAATAACGGAATGACTCAAACAATTGAACTTCAGCTTCCAACTAATATTTCTGTTGGTGATACTGTTAAAATTTCCATGAATTACATGAGAAAAGGACAAACAGTTAAAATCAAAGCTGCAGGTGAAGATAAAATTGCTTCTTCAGTTCAATTGCTGCAATTCCCAAAACGTTCAGAATATCCGCCTGAAGCTGAATGGGTGACTGTTCAAGAATTAGTTTTTAACGGTGAAACTAATTATGTTCCAGTTTTACAACTTGCTTATATAGAAGATTCTGACGGAAAATACTGGGTAGTACAGCAAAACGTTCCAACCGTAGAAAGAGTCGATTCGTTAAATGATTCTACTAGAGCAAGATTAGGCGTGATTGCTTTAGCTACACAAGCTCAAGCTAATGCCGATTTAGAAAATTCTCCACAAAAAGAATTAGCAATTACTCCAGAAACATTAGCTAACCGTACTGCTACAGAAACTCGTAGAGGTATCGCAAGAATAGCAACTACTGCTCAAGTGAATCAGAACACTACATTCTCTTTTGCTGACGATATTATCATCACTCCTAAAAAGCTGAATGAAAGAACTGCCACAGAAACTCGTAGAGGTGTTGCTGAAATTGCTACGCAGCAGGAAACTAATGCAGGTACTGATGATACTACAATCATCACTCCTAAAAAGCTTCAAGCTCGTCAAGGTTCTGAATCATTATCTGGTATTGTAACATTTGTATCTACTGCAGGAGCTACTCCAGCTTCTAGTCGTGAATTAAATGGTACAAACGTTTATAATAAAAACACTAATAATTTAGTTGTTTCGCCTAAAGCTCTGGATCAGTATAAAGCTACTCCAACACAACAAGGCGCAGTAATTTTAGCAGTTGAAAGTGAAGTAATTGCTGGAAAAAGTCAAGAAGGATGGGCAAATGCGGTTGTAACGCCAGAAACGTTACATAAAAAGACATCAACTGATGGAAGAATTGGTTTAATTGAAATTGCTACGCAAAGTGAAGTTAATACGGGAACTGATTATACTCGTGCAGTCACTCCTAAAACTTTAAATGACCGTATAGCAACTGAAAGTTTAAGTGGTATAGCTGAAATTGCTACACAAGTTGAATTCGACGCAGGCGTCGACGATACTCGTATCTCTACACCATTAAAAATTAAAACTAGATTTAATAGTACTGATCGTACTTCTGTTGTTGCTCTATCTGGATTAGTTGAATCAGGAACTCTCTGGGACCATTATACCCTTAATATTCTTGAAGCAAATGAGACACAGCGTGGTACACTTCGTGTAGCTACACAAGTTGAAGCTGCTGCAGGAACATTGGATAATGTTTTAATAACTCCTAAAAAGCTTTTAGGTACTAAATCTACTGAAGCACAGGAAGGTGTTATTAAAGTTGCAACTCAGTCTGAAACTGTGACTGGAACGTCAGCAAATACTGCTGTATCTCCAAAAAATTTAAAATGGATTGTGCAGAGTGAACCTACTTGGGCAGCTACTACTGCGATAAGAGGTTTTGTTAAAATGTCTGAAGGCGCAATTACTTTTGTCGGTAATGCAACTGCAGGTTCGACCCAGGCTCTTGACCTGTACGAGAAAAATAGCTATGCTATCTCTCCGTACGAGTTAAACAAAACTCTTGGTAACTTCCTGCCGCGTTTGGCTAAAGCAGCAGACTCGGATAAACTGGATAACCTGGATAGTACACAGTTTATTCGTCGTGATGTAGCCCAGGATATTAATGCTACTATGACATTTAAACAGCCTGCAAGAATTGAAAGTACTTTAACCGCTACAGGTGTGGTTAATTTGAGTGGTTCTGTTACTTCAAATAATACCACATTAACCGGTGCTACTGCAATCAATAGCAATTCTACTGTAGGTGCTCAGAATTACATTGAGTTCACTTCACTTTCGCAAGGCTCGGGTACTTGGACCTCTCAACATGATAGCAATGTTAAAGCTCCTGTATTTTTAAATATAACTACTCTAGCTGGCGCATCTAGATACGTTCCTTTAATTAAGCAACGTTATAAAGATGGAACATTTACCTTTGGTACATTGACAAATGAACCTACCTCAAATGATGAAGGTGCTTTTATTCTTCATTATATAGATGCAGTAAAAACCCAGCGCAAATGGTCCTTTAGACGGAACGGTGATTTAGAAATATCGGCAGGTAATTTCGTTCTTGGTAATGGGACTGCTGTAATTAATGGCGGGCTTAATGTTACTAAAGCTTCAGGTATTACAACCACCAGTCTAGTTGCTAATAGCGAATCTAGATTCGAAGGTGCCGTTACTATTAACAACTTCCTTACGGTAAGCAACAAAGCTACCATTAACAACGGCTTAGATGTTCAGAAATATGCAAGGGTTACAGGAGATAAGACTTCTGACATCTATAGCAGAAAACCTACAATGGATAATGTTGGTTTTTGGTCTATAGACATCAACGATTCAGCCACTTATAACCAGTTCCCAGGTTATTTTAAAATGGTTGAAAAAACTAATGAAGTGACTGGACTTCCATACTTAGAACGTGGTGAAGAAGTTAAATCTCCTGGTACATTGACTCAGTTTGGTAACACACTTGATTCGCTTTACCAAGATTGGATTACTTATCCAACGACTCCAGAAGCACGTACCACTCGCTGGACGCGTACATGGCAGAAAACCAAAAACTCTTGGTCGAGTTTTGTTCAGGTATTTGATGGAGGTAACCCTCCTCAGCCGTCTGATATCGGTGCTTTACCATCTGATAATGCTACAATGGGGAATCTTACTATTCGTGATTTCTTACGAATTGGTAATGTTCGCATTGTTCCTGACCCAGTGAATAAATCTGTTAAATTTGAATGGATTGAATAG

Genome Context

Tertiary structure

WAX13162.1
ESMFold structure
Source ESMFold
pLDDT 57.9
Oligomeric state monomer