Genbank accession
UDY80640.1 [GenBank]
Protein name
tail protein
RBP type
TSP
Evidence RBPdetect
Probability 0,65
TF
Evidence RBPdetect2
Probability 0,75
Protein sequence
MAEIKRKFRAEDGLDAGGDKIINVALADRTVGTDGVNVDYLIQENTVQQYDPTRGYLKDFVIIYNNRFWAATDNIPKPAGSFNRIRWKALRTDAVYTTVSSGPYQLKSGEAISVDTSVGNDIEFNLPPSPLDGETVIIQDIGGKPGINQVKINSSNQSIVNFRGEQVRSVLMTHPKSQMIFIFNNRLWQMYVADYSREAAIVTPSTAYQAQSNDFIVRRFTSAAPINIKLPRFANHGDIINFVDLDKLNPLYHTIVTTYDETTSVQEVGTHSIEGRTSIDGFLMFDDNEKLWRLFDGDSKARLRIITTNSNIRPNEEVMVFGANNGTTQTIELQLPTDISIGDTVKISMNYMRKGQTVKIKAAGEDKIASSVQLLQFPKRSEYPPEAEWVTVQELVFNGETNYVPVLQLAYIEDSDGKYWVVQQNVPTVERVDSLNNSTRARLGVIALATQAQANADLENSPQKELAITPETLANRTATETRRGIARIATTAQVNQNTTFSFADDLIITPKKLNERTATETRRGVAEIATQQETNTGTDDTTIITPKKLQARQGSESLSGIVTFVSTAGATPASSRELNGTNVYNKNTNNLVVSPKALDQYKATPTQQGAVILAVESEVIAGQSQEGWANAVVTPETLHKKTSTDARIGLIEIATQSEVNTGTDYTRAVTPKTLNDRIATESLSGIAEIATQVEFDAGVDDTRISTPLKIKTRFNSTDRTSVVALSGLVESGTLWDHYTLNILEANETQRGTLRVATQVEAAAGTLDNVLITPKKLLGTKSTEAQEGVIKVATRSETVAGTSANTAVSPKNLKWIVQSEPTWAATTLVRGFVKTSSGSITFVGNDTVGSTQDLELYEKNNYAVSPYELNRVLANYLPLKAKAVDSNLLDGLDSLQFIRRDIAQTVNGSLTLTQQTNLSAPLVSSSTATFGGSVSANSTLTISNTGTATRLIFEKGPQTGTNPAQTMTVRVWGNQFSGESDTTRSTVFEVSDETSSHFYSQRNKTGNITFNINGTVTPINVNASGTLNANGVATFGSSVTANGEFISKSSNAFRAINGDYGFFIRNGGSITHFMLTESGDQTGGFNGLRPLSINNASGQVTIGESLIIAKGATISSGGLTVNSRIRSQGTKTSDLYTRAPTSDTVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGAIPSDNGIIGNLTIRDFLRIGNVRIIPDPVNKTVKFEWIE
Physico‐chemical
properties
protein length:1289 AA
molecular weight: 140531,04860 Da
isoelectric point:5,45270
aromaticity:0,07448
hydropathy:-0,34593

Domains

View on InterPro
UDY80640.1
1 1289 aa
ATT 979–1092 · ATT 1139–1237 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Tail Spike Domain Segmentation

Segmented into three structural domains: N-terminal, central, and C-terminal.

UDY80640.1
1 1289 aa
Domain Start End Length (AA) Confidence
N-terminal 1 1080 1080 0,8169
Central domain 1081 1278 199 0,1250
C-terminal 1279 1289 10 0,8254
N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Taxonomy

Coding sequence (CDS)

Genbank protein accession
UDY80640.1 [NCBI]
Genbank nucleotide accession
OK018184 [NCBI]
CDS location
range 149710 -> 153579
strand +
CDS
ATGGCCGAGATTAAAAGAAAGTTCAGAGCAGAAGACGGTCTGGACGCAGGTGGCGATAAAATAATCAACGTAGCTTTAGCTGATCGTACCGTAGGAACTGACGGTGTTAACGTTGATTACTTAATTCAAGAAAACACAGTTCAACAATATGATCCAACTCGTGGATATTTAAAAGATTTTGTAATCATTTATAATAATCGTTTTTGGGCAGCAACGGATAATATTCCAAAACCTGCTGGAAGTTTTAATAGAATTCGTTGGAAAGCATTGCGTACTGATGCCGTATATACAACCGTATCATCTGGACCGTATCAATTAAAATCCGGAGAAGCAATTTCAGTAGATACATCAGTTGGTAATGACATTGAGTTTAATTTACCACCTTCTCCTCTTGATGGAGAAACCGTAATAATTCAAGATATTGGTGGAAAACCTGGTATAAATCAGGTTAAAATAAATTCTTCAAATCAGAGTATTGTTAATTTTAGAGGTGAACAGGTACGTTCAGTTCTAATGACTCATCCAAAGTCACAAATGATATTCATTTTTAATAATCGTTTGTGGCAAATGTATGTTGCTGATTATAGCAGAGAAGCTGCGATTGTTACTCCATCGACTGCATATCAAGCACAATCTAATGATTTTATCGTGCGTAGATTTACTTCCGCTGCGCCGATTAATATTAAACTTCCGAGATTTGCTAATCATGGCGATATTATTAATTTCGTTGATTTAGATAAATTAAATCCACTTTATCATACAATTGTCACGACATATGATGAAACAACTTCAGTACAAGAAGTTGGAACTCATTCTATTGAAGGCCGTACATCGATTGACGGTTTCTTGATGTTTGATGATAATGAAAAATTATGGAGATTGTTTGACGGGGATAGTAAAGCACGTTTACGCATTATAACAACTAATTCTAATATTCGTCCAAATGAAGAAGTTATGGTATTTGGTGCGAATAACGGAACAACCCAAACAATTGAACTTCAGCTTCCAACCGATATTTCCATTGGTGATACTGTTAAAATTTCCATGAATTACATGAGAAAAGGACAAACAGTTAAAATCAAAGCTGCCGGTGAAGATAAAATTGCTTCTTCAGTTCAATTGCTGCAATTCCCAAAACGTTCAGAATATCCACCTGAAGCTGAATGGGTGACTGTACAGGAATTAGTTTTTAACGGTGAAACTAATTATGTTCCAGTTTTACAACTTGCTTATATAGAAGATTCTGACGGAAAATACTGGGTTGTACAACAAAACGTTCCAACAGTTGAAAGAGTCGATTCTTTAAATAATTCTACTAGAGCAAGATTAGGCGTAATTGCTTTAGCTACACAAGCTCAAGCAAATGCTGATTTAGAAAATTCTCCGCAAAAAGAATTAGCAATTACACCAGAAACATTAGCTAACCGTACTGCTACAGAAACTCGTAGAGGTATCGCAAGAATAGCAACTACTGCTCAAGTAAATCAGAACACTACATTCTCTTTTGCTGATGACCTTATCATCACTCCTAAAAAGCTGAATGAAAGAACTGCTACAGAAACTCGTAGAGGCGTTGCTGAAATTGCCACGCAACAAGAAACTAATACAGGTACTGATGATACTACAATCATCACTCCTAAAAAGCTTCAAGCTCGTCAAGGTTCTGAATCATTATCTGGTATTGTAACCTTTGTATCTACTGCAGGAGCTACTCCAGCTTCTAGTCGTGAATTAAATGGTACAAATGTTTATAATAAAAACACTAATAATTTAGTTGTTTCGCCTAAAGCTTTGGATCAGTATAAAGCTACTCCAACGCAACAAGGTGCAGTAATTTTAGCAGTTGAAAGTGAAGTAATTGCTGGACAAAGCCAAGAAGGATGGGCAAATGCGGTTGTAACGCCAGAAACGTTACATAAAAAGACATCAACTGATGCAAGAATTGGTTTAATTGAAATTGCTACGCAAAGTGAAGTTAATACAGGAACTGATTATACTCGTGCAGTCACTCCGAAAACTTTAAATGACCGTATAGCAACTGAAAGTTTAAGTGGTATAGCTGAAATTGCTACACAAGTTGAATTCGACGCAGGCGTCGACGATACTCGTATCTCTACACCATTAAAAATTAAAACCAGATTTAATAGTACTGATCGTACTTCTGTTGTTGCTCTATCTGGATTAGTTGAATCAGGAACTCTCTGGGACCATTATACCCTTAATATTCTTGAAGCAAATGAGACACAGCGTGGTACACTTCGTGTAGCTACACAAGTTGAAGCTGCTGCAGGAACATTGGATAATGTTCTAATAACTCCTAAAAAGCTTTTAGGTACTAAATCTACTGAAGCGCAGGAAGGCGTTATTAAAGTTGCAACTCGGTCTGAAACTGTAGCTGGAACGTCAGCAAATACTGCTGTATCTCCAAAAAATTTAAAATGGATTGTGCAGAGTGAACCTACTTGGGCAGCTACTACCCTGGTAAGAGGTTTTGTTAAAACTTCATCTGGTTCAATTACATTCGTTGGTAATGATACAGTTGGTTCTACGCAGGACTTAGAACTATATGAGAAAAATAACTATGCAGTATCACCATATGAATTAAACCGCGTATTAGCAAATTATTTGCCGTTAAAAGCAAAAGCTGTAGATAGTAATTTATTAGATGGTTTAGATTCACTCCAGTTCATTCGTAGGGATATTGCGCAGACGGTTAATGGTTCACTAACCTTAACACAGCAAACGAATCTGAGTGCCCCTCTTGTATCATCTAGTACTGCTACGTTCGGTGGATCAGTTTCGGCAAATAGTACATTAACTATTTCTAATACTGGAACAGCAACTCGTCTGATTTTTGAGAAAGGACCTCAAACTGGGACGAACCCAGCTCAAACGATGACAGTCAGAGTGTGGGGAAATCAATTCAGCGGTGAATCGGACACAACACGTTCTACTGTATTTGAAGTTAGTGATGAAACGTCTAGTCACTTTTATTCTCAGCGCAATAAAACTGGTAATATAACATTTAATATAAACGGTACAGTAACGCCGATAAATGTGAATGCTTCAGGAACATTGAATGCGAATGGCGTTGCAACATTCGGTAGTTCAGTTACTGCTAATGGCGAATTTATCAGTAAATCATCGAATGCTTTTAGAGCAATAAACGGTGATTATGGATTCTTTATCAGGAATGGTGGCAGCATCACACATTTTATGCTCACTGAATCTGGCGACCAGACCGGTGGATTTAATGGATTACGTCCTTTATCTATTAATAATGCATCTGGTCAAGTAACGATTGGTGAAAGCTTAATCATTGCCAAAGGTGCTACTATAAGTTCAGGTGGTTTAACTGTCAACTCGAGAATTCGTTCTCAGGGTACTAAAACCTCTGATTTATATACTCGTGCGCCAACATCTGATACTGTAGGATTCTGGTCAATCGATATTAATGATTCAGCCACTTATAACCAGTTCCCGGGTTATTTTAAGATGGTTGAAAAAACTAATGAAGTGACTGGGCTTCCATACTTAGAACGTGGCGAAGAAGTTAAATCTCCTGGTACATTGACTCAGTTTGGTAACACGCTTGATTCGCTTTACCAAGATTGGATTACTTATCCAACGACTCCAGAAGCACGTACCACTCGCTGGACACGTACATGGCAGAAAACTAAAAACTCTTGGTCAAGTTTTGTTCAGGTATTTGACGGAGGTAACCCTCCTCAACCTTCAGATATAGGAGCGATCCCATCTGATAATGGAATAATAGGTAATCTTACTATTCGCGATTTCTTGCGAATTGGTAATGTTCGCATTATTCCTGACCCAGTGAATAAAACTGTTAAATTTGAGTGGATTGAATAA

Genome Context

Tertiary structure

UDY80640.1
ColabFold structure
Source ColabFold
pLDDT 27.1
Oligomeric state monomer