Genbank accession
YP_009626653.1 [GenBank]
Protein name
tail protein
RBP type
TSP
Evidence RBPdetect
Probability 0,58
TSP
Evidence RBPdetect2
Probability 0,47
Protein sequence
MAKFSVTGQLTIYNMNDVLASLTPPPKPTEGALWLNANDNQLYVYVKGSWVISADYKNWVNSKGDNLVSNGGGSLGNNSNFSAFEFDGSDSYSGGGSFKDSSPANQKLSDELIPVDISKSYKLSLWAKTNPNVGAKYYVGVYEHDMDGLPIYAENHMYVQSTFSTLTQDLKNGDTVVYLDNVTNWLNTAPIHQRKLIFWDYVSKTGYKYQPLTYSRHTSAQDLWADGSINTTNKTITLKAPWNGGLVKAGTKLSQGSSGAGFRYIAVQNVAIPGTWTNYSGVISGLNNSGNDAQNQFSWGTAYVKIGFLNNRDVTGSTVWYSNISFGLNVADQGDVDKINDSLESLGSDGKITRFERSLVRGYIADIVGKFLNPTDTMPTLNQIDADTYNAGKLYAVRRMARKLGMNLSTSVNYQPLGKAYSDLVTYLTGLTPVKPWDTSSSAVIDIDRNVWNTKWNDYYNRYALFEIEVQDRQKEFTEQETQKMSKDTIAAISTTGNYDRATFANPVNIKPPIATLGLPEFEGSHTDSWDWNGRNYILKSDVAYSWDGKLADNGFFNKQLSPLAVSAFDKQKVTMSLSYKLTNVVYGTTNPWVGMQITVEYTDGTREYPTCVGGKADGSPTTSGFVTRAGTYQFNASKTIKTLSIMLGGRDLTGKVEIQNYKVEVGDKTVDKVVWTPAIEDVWAGAGNRIRPVTNPTFSSGTDLTIWGKFYGDGTNNDKFYWETNGSAIKEKRWMDVSLNDKQSWAFSTNGLSTNGVNRVLNSSCNNMQPYMFDNSSTGGTIGRATSKFVSDYLELTSTDASDSFYQIGSYDMNLHMFSIGETVTFSAEVNCEVAGAYISVWHHDGSNWIENKGDANSVGAANTWKRLYKTFTIPSNAKGLFGRVYFPRGTAATGKKLNMRKVQFESGSVMTDWTNTSLVKVTRVRADGFAYANANSNSLSVIKADGTVIPKDGQLHVNTYSTSSTLDKIWFSIDNNDSGWAEAYNPSKEDINAYFLGWRVCNGTFGGLYPGSGIKQWYPIGDKDLSRATVAGNTAPTEPSPSISDKSINYYQVVYQLVDPIQEIVEFDGILELLGEKDNVVTTYYPTWSSTISKGSIKYGTNLATVNQDTRYIIPSMVKRIANAEQKITDESITNTVFSSREYTLALKSKANASDLGNLASKDELNNVSGAVDGKIKDAMDKLDFSPYATKSELKQTATDITAKFSATGGMNLIKNSIGYSDRDFWNLTTAYAVETIANSALDNLGFGKGFYFKANGQETGIYQDVSVIPGQPYTLGWYLNKMTKGADSSYRFWIQAQEYNGTAWVVPPGNQIADNSNQTTNGFEARYMTFTPTKDKVRIRFIGYANVEAIVSGIMLNIGDVALQWTLATGELYNTNIRMNINGIRVSQLDGNGSEIGFTQITPSEFAGYYQNNGTFEKVFYLNGDETVTKKLRATNEITLGNIKILSIQSSTATGWAFVPNNS
Physico‐chemical
properties
protein length:1466 AA
molecular weight: 161612,00670 Da
isoelectric point:5,73695
aromaticity:0,11664
hydropathy:-0,41044

Tail Spike Domain Segmentation

Segmented into three structural domains: N-terminal, central, and C-terminal.

YP_009626653.1
1 1466 aa
Domain Start End Length (AA) Confidence
N-terminal 1 118 118 0,6495
Central domain 119 755 638 0,5776
C-terminal 756 1466 710 0,2056
N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Taxonomy

Host

Coding sequence (CDS)

Genbank protein accession
YP_009626653.1 [NCBI]
Genbank nucleotide accession
NC_042140 [NCBI]
CDS location
range 58033 -> 62433
strand +
CDS
ATGGCTAAATTTAGTGTTACAGGTCAATTGACCATTTACAATATGAACGATGTTTTAGCATCGCTAACGCCACCACCCAAGCCTACAGAGGGTGCTCTATGGTTGAATGCAAACGATAACCAATTATATGTATATGTAAAGGGCAGTTGGGTAATCTCTGCCGATTACAAGAACTGGGTTAACTCTAAAGGGGATAACCTGGTATCTAATGGTGGAGGTTCTTTAGGGAACAACTCTAACTTCAGCGCTTTCGAATTTGACGGATCGGACTCATATTCAGGTGGAGGTTCATTCAAAGATTCAAGTCCTGCCAACCAAAAGTTATCTGACGAGTTAATTCCTGTGGACATTAGTAAATCTTATAAACTATCTCTGTGGGCTAAAACAAACCCTAACGTAGGAGCTAAGTACTACGTTGGTGTGTACGAGCATGACATGGATGGTCTACCAATCTACGCAGAGAATCACATGTATGTACAAAGTACTTTCTCAACACTAACTCAGGATTTAAAGAATGGAGACACAGTTGTATACCTGGACAACGTTACAAACTGGTTAAATACTGCTCCAATCCACCAAAGAAAATTAATCTTTTGGGACTATGTAAGTAAGACTGGTTACAAGTATCAACCACTTACATACTCTCGTCATACGTCTGCACAAGACTTATGGGCAGATGGGTCTATTAACACTACAAATAAAACTATCACGCTGAAAGCTCCTTGGAATGGTGGGCTAGTTAAAGCAGGTACAAAGTTAAGCCAAGGTAGTAGTGGAGCAGGATTCCGATATATCGCAGTACAGAACGTAGCTATTCCTGGGACGTGGACAAACTACTCAGGTGTAATTAGTGGTCTGAACAACTCAGGTAATGACGCACAGAATCAATTCTCTTGGGGAACAGCTTATGTAAAAATCGGGTTCTTAAATAACCGTGATGTGACAGGAAGTACTGTATGGTACTCTAACATTAGCTTCGGACTTAACGTAGCAGACCAAGGTGATGTAGATAAAATCAACGACTCTCTAGAATCGTTAGGTAGTGATGGTAAGATTACTCGTTTCGAACGTAGCTTAGTTCGTGGGTATATCGCAGATATCGTAGGTAAGTTCTTGAATCCTACAGATACAATGCCTACATTAAATCAGATTGATGCAGATACATACAACGCAGGTAAGCTTTATGCGGTCCGTAGAATGGCTCGTAAGCTTGGAATGAACCTATCTACAAGTGTAAACTATCAACCACTAGGAAAGGCATACTCGGATTTAGTAACATATTTAACTGGTCTGACACCTGTTAAACCTTGGGACACAAGTTCATCTGCGGTCATCGACATCGACAGAAATGTGTGGAACACTAAGTGGAATGACTACTATAACCGTTACGCTCTATTCGAAATTGAGGTGCAGGATCGTCAGAAAGAGTTCACGGAACAAGAGACACAGAAAATGTCAAAGGACACGATTGCTGCCATTAGTACAACTGGTAACTACGATAGAGCAACATTCGCTAATCCTGTGAACATTAAACCACCTATCGCTACTTTAGGACTACCTGAGTTCGAGGGTAGCCATACAGATAGTTGGGATTGGAACGGACGTAACTATATACTAAAATCGGATGTAGCATACTCTTGGGACGGTAAACTAGCTGATAATGGCTTCTTTAATAAACAACTCAGCCCACTAGCAGTATCTGCTTTTGATAAGCAGAAGGTTACAATGTCTCTATCATACAAGTTAACTAACGTTGTGTATGGTACTACAAACCCTTGGGTGGGTATGCAGATAACTGTAGAGTACACGGACGGCACAAGAGAGTACCCTACTTGTGTTGGGGGTAAAGCAGATGGTTCGCCTACAACTAGTGGTTTCGTAACTAGAGCAGGTACATACCAGTTCAATGCGTCTAAGACAATCAAAACTTTAAGTATTATGTTAGGTGGTAGGGACTTAACAGGTAAAGTAGAAATTCAGAATTACAAAGTTGAAGTAGGAGACAAAACTGTTGATAAAGTAGTGTGGACACCTGCTATCGAAGATGTGTGGGCAGGTGCAGGAAACCGTATTCGTCCTGTGACAAACCCTACGTTTAGTAGTGGTACCGACCTAACTATTTGGGGCAAGTTCTACGGAGACGGGACAAACAACGATAAGTTCTACTGGGAAACAAACGGTTCTGCTATTAAAGAGAAAAGATGGATGGATGTTTCTCTTAACGATAAGCAGAGTTGGGCGTTCTCTACAAATGGTCTATCAACTAACGGAGTAAACAGAGTCCTAAATTCTAGTTGTAATAACATGCAACCATACATGTTCGACAACTCAAGTACAGGTGGTACAATAGGTCGAGCTACATCAAAGTTCGTCAGTGACTACCTTGAACTGACATCTACAGATGCGAGTGACAGTTTCTATCAGATTGGTTCTTATGATATGAACTTGCATATGTTCTCTATAGGAGAGACAGTTACATTCTCCGCAGAGGTTAACTGTGAGGTTGCAGGAGCGTATATCTCTGTTTGGCATCATGATGGATCGAACTGGATTGAGAACAAGGGTGACGCTAACTCTGTAGGAGCAGCTAACACTTGGAAACGTCTTTACAAAACGTTTACGATCCCGAGCAATGCGAAAGGATTATTCGGACGTGTTTACTTCCCTAGAGGAACGGCAGCAACAGGTAAAAAACTTAACATGCGAAAAGTACAGTTCGAGTCAGGAAGCGTTATGACCGACTGGACTAACACTAGCCTAGTTAAGGTTACACGAGTGCGAGCTGACGGTTTTGCTTATGCCAACGCAAACAGTAACTCCTTATCTGTTATTAAAGCAGACGGGACGGTAATTCCGAAAGACGGGCAACTACACGTAAACACTTACTCAACTAGCAGTACTCTTGATAAAATTTGGTTCTCTATTGACAACAACGATAGTGGTTGGGCTGAAGCGTATAACCCTAGCAAGGAAGACATTAACGCTTACTTCCTAGGTTGGAGAGTATGTAACGGTACTTTCGGAGGGTTATACCCAGGATCAGGAATTAAGCAGTGGTATCCAATAGGTGATAAAGATTTATCTCGTGCTACTGTAGCAGGTAACACGGCACCAACAGAACCATCACCTTCGATTAGTGATAAATCTATAAACTACTATCAAGTTGTTTATCAGCTTGTAGACCCAATTCAAGAGATAGTTGAATTTGATGGTATACTAGAATTACTAGGGGAAAAGGATAACGTTGTAACAACTTACTACCCTACTTGGTCATCTACGATTTCTAAAGGTTCAATCAAGTACGGTACCAACTTAGCTACAGTCAACCAAGACACACGTTACATCATCCCATCTATGGTAAAACGTATCGCTAATGCAGAACAGAAGATTACGGATGAGTCTATTACAAACACAGTCTTCAGTTCTAGAGAGTACACGCTTGCGCTAAAGAGTAAAGCAAACGCTAGTGACCTTGGTAACTTAGCTTCTAAAGATGAGTTAAACAACGTATCAGGTGCCGTAGACGGTAAGATTAAAGATGCGATGGACAAGCTAGACTTCTCTCCATACGCAACTAAATCTGAGTTAAAACAGACCGCTACAGACATCACTGCTAAGTTCTCTGCTACAGGTGGTATGAACTTAATTAAGAACTCTATTGGTTACAGTGACAGAGACTTTTGGAACTTAACTACTGCTTATGCAGTAGAGACCATTGCAAACTCCGCTTTAGATAATCTAGGGTTCGGTAAAGGGTTCTACTTTAAAGCCAACGGACAAGAGACAGGAATCTACCAAGATGTATCTGTTATCCCTGGACAACCGTACACATTAGGTTGGTACTTGAACAAGATGACGAAGGGTGCAGATTCTAGCTACCGTTTTTGGATTCAGGCTCAGGAATACAACGGAACAGCTTGGGTTGTACCTCCTGGAAACCAAATAGCAGATAATAGCAATCAGACAACAAACGGGTTCGAAGCTCGTTATATGACATTCACTCCTACAAAGGATAAAGTAAGAATCCGTTTCATCGGATACGCTAACGTAGAAGCCATTGTATCAGGGATCATGTTAAACATTGGTGACGTTGCTCTACAATGGACTCTAGCTACAGGAGAGCTTTACAATACGAACATCCGAATGAACATCAACGGTATCCGTGTATCGCAGTTAGATGGTAACGGAAGTGAAATTGGTTTCACACAAATCACACCGTCAGAGTTCGCAGGATACTACCAAAATAACGGAACATTCGAAAAAGTATTCTACCTAAACGGAGATGAAACAGTAACGAAAAAGCTTCGAGCAACAAACGAAATTACGTTAGGAAATATTAAAATCCTTTCTATTCAAAGTTCGACAGCTACAGGTTGGGCATTCGTACCTAACAATAGCTAA

Genome Context

Tertiary structure

YP_009626653.1
ColabFold structure
Source ColabFold
pLDDT 84.9
Oligomeric state monomer