Genbank accession
QHR69782.1 [GenBank]
Protein name
tail fiber
RBP type
TF
Evidence GenBank
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,89
Protein sequence
MSRIKHRIDNVFQLIDGHIQFLDRNTGLTVDPTVQHYVLNPQNVLANNRHFINWTAQEGQPNGDATTEGQSVLILGCAYAYLASGDTKYLDSAKKYWQAYIDYFFGGQPIPDPPAKYRPNWIINGKEPRLAHYPLTDDGYPTHGGFKGSLMTWTNGRTVIPHGAPHWGEYLDKAWFAFNGNLGWNSVNATVYAVNADGTTDWSKKGDQWDVDWIIDRLGRKVDWDGNILEEGFPTSQYGTVQLKNTSVNGTYKFNYATCNPVEHGGYLMERNTMWHNRPVNVPVEMGFQDNASDAETWWCDANYLMYQITGERKYWLCWQSSLLVCQDYSNIDMFDKFFRKSTYATIPFTDGISYDYSYPSTAIPKYSRDTLGYIVIRQDVAAQTTLEQQSIWFKVDQNSKLRVQFQGVDDAGHGILFRPELELSKTKDENNTVTYRCGLPLGTANMTSMDIPLSSFMRSTPPNGGTYIIADPRIIVDWGDNTVVQFKYVTGITGTNDDQIVTASMDTDGGVTVGFWLTPTSKANVKSITYRTYEDDFNMTITDAQGWRWWAMLPKTQGAWSTKTLSASDFKLSAYQPNHPETDPKPSAINLTAVDQVNLVLDTAPVNGLTGTIDFYCINDVPERYSSSSGDDYTMYFRITVQASSPHTAKLGDCTIIDYKLNSLNYTPGIIPFSNISDPNTALYDGWRGIPYPGYQYPSLYCFAGRDIDWTRLNNSINFLYDSQMWFYNTFDPVMPGPMAQAYVWDRWDARKYGEPNTFTMKHWNEKAWDGYEARAFYCACHAVYELVQRGETPPEKLVTVCKNWINYLKWFQDNNDGRTPTIFNPDGTVLAPIDDFTSHMSALFMAGCSIMGLAGYDSQIPNIGIVADRCFDLIQQNYIVLSPNHPMNGSWSVAPRPDSDNGMFFGFHAGELLRGFGLYALYRKLNPQNALPILDNSNIPTLTVLTMNDISVDVTK
Physico‐chemical
properties
protein length:958 AA
molecular weight: 108502,24410 Da
isoelectric point:5,05517
aromaticity:0,13466
hydropathy:-0,42182

Tail Spike Domain Segmentation

Segmented into three structural domains: N-terminal, central, and C-terminal.

QHR69782.1
1 958 aa
Domain Start End Length (AA) Confidence
N-terminal 1 10 10 0,2333
Central domain 11 288 279 0,8855
C-terminal 289 958 669 0,0555
N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Taxonomy

Coding sequence (CDS)

Genbank protein accession
QHR69782.1 [NCBI]
Genbank nucleotide accession
MN850601.1 [NCBI]
CDS location
range 66375 -> 69251
strand +
CDS
ATGTCAAGAATTAAGCACAGAATTGACAATGTTTTTCAACTGATCGATGGACATATTCAGTTCTTAGATCGTAATACAGGTTTAACTGTAGATCCTACAGTGCAACACTATGTATTAAACCCACAAAACGTTCTAGCTAATAACAGACACTTTATAAACTGGACTGCTCAAGAAGGGCAACCAAACGGGGATGCTACAACAGAAGGTCAATCCGTGCTTATTCTTGGTTGCGCTTATGCATACCTAGCTTCCGGCGATACAAAGTATTTAGACTCTGCTAAAAAATATTGGCAAGCCTATATAGATTACTTCTTTGGTGGTCAACCTATCCCAGATCCGCCAGCAAAGTATCGCCCTAACTGGATTATTAACGGTAAAGAACCACGTCTTGCACATTATCCTCTTACAGATGATGGCTACCCTACACACGGAGGTTTTAAGGGTAGCTTAATGACGTGGACTAACGGTAGAACAGTTATTCCTCATGGTGCTCCACATTGGGGAGAATACCTTGACAAAGCATGGTTTGCTTTTAATGGTAATCTAGGATGGAACTCTGTAAACGCTACAGTATATGCTGTTAATGCAGATGGTACAACAGATTGGTCTAAGAAGGGAGATCAATGGGATGTTGATTGGATCATTGATCGCCTAGGACGTAAAGTTGATTGGGATGGAAATATCTTAGAAGAAGGTTTTCCAACATCTCAATACGGAACAGTTCAACTAAAAAATACTTCTGTAAATGGTACATATAAATTTAACTACGCGACTTGTAACCCTGTTGAACACGGTGGTTATTTAATGGAGCGTAACACTATGTGGCATAACAGACCAGTTAACGTTCCGGTAGAAATGGGTTTTCAGGATAATGCGTCAGATGCTGAAACTTGGTGGTGTGATGCTAATTACCTGATGTACCAAATTACAGGAGAAAGAAAATATTGGCTATGCTGGCAGTCTTCACTGTTAGTGTGTCAAGATTATTCAAACATTGATATGTTTGATAAATTCTTCCGTAAGTCTACATATGCAACTATTCCGTTTACAGATGGCATCTCTTACGATTATTCGTATCCATCTACAGCAATACCTAAATATTCAAGAGATACTTTAGGTTATATTGTTATTAGACAAGATGTTGCTGCTCAAACAACATTAGAACAGCAATCCATTTGGTTTAAAGTTGATCAGAACTCTAAGTTACGAGTTCAGTTCCAAGGTGTAGATGACGCAGGACATGGTATTCTTTTCCGTCCAGAATTGGAGCTAAGTAAGACCAAAGATGAAAATAACACAGTAACTTACCGTTGTGGCTTACCATTAGGTACAGCTAATATGACAAGCATGGATATTCCATTATCCAGCTTTATGAGAAGTACCCCTCCAAATGGTGGAACATATATTATCGCAGATCCGCGAATTATTGTTGACTGGGGTGACAATACTGTGGTACAATTTAAGTATGTAACAGGTATTACTGGAACTAATGATGACCAGATTGTTACTGCATCAATGGATACGGATGGTGGTGTCACTGTTGGTTTTTGGTTAACCCCTACATCAAAAGCTAATGTTAAGTCTATCACATATAGAACATATGAAGATGACTTTAACATGACTATCACGGATGCTCAAGGTTGGAGATGGTGGGCTATGCTACCTAAAACGCAAGGAGCATGGAGTACGAAGACTTTATCAGCCTCTGATTTTAAGTTAAGTGCTTACCAGCCTAATCATCCAGAAACAGATCCTAAACCTTCAGCAATAAATCTTACTGCTGTAGATCAGGTAAATTTAGTTCTCGATACGGCTCCTGTCAATGGTTTAACAGGAACAATAGATTTCTATTGTATTAACGATGTGCCTGAAAGATATTCGTCATCTTCTGGTGATGATTATACCATGTACTTCCGTATCACTGTACAGGCTTCAAGTCCTCATACTGCTAAGTTAGGTGATTGTACTATTATTGACTATAAGTTAAATAGTCTTAATTACACACCAGGAATAATTCCATTCTCTAATATTAGTGACCCAAACACTGCATTGTATGATGGCTGGCGTGGTATTCCATACCCAGGATACCAATACCCTTCCTTATACTGTTTTGCAGGTAGAGATATTGATTGGACGCGTTTAAATAACAGTATCAATTTCTTGTATGATTCTCAAATGTGGTTTTATAACACATTCGATCCTGTGATGCCTGGGCCTATGGCACAAGCGTATGTGTGGGATCGTTGGGATGCAAGAAAATACGGTGAACCAAATACGTTCACAATGAAACACTGGAATGAAAAAGCGTGGGATGGTTATGAAGCTCGTGCATTCTACTGTGCTTGTCATGCTGTATACGAACTTGTACAAAGAGGAGAAACACCTCCTGAAAAACTAGTAACAGTTTGTAAAAATTGGATCAACTATCTTAAATGGTTCCAAGACAATAATGATGGAAGAACACCAACTATCTTTAACCCAGATGGTACAGTTCTTGCGCCTATAGATGACTTTACTAGTCATATGTCTGCACTGTTTATGGCGGGTTGTTCAATCATGGGCTTGGCAGGTTATGATTCACAAATTCCAAACATTGGTATTGTAGCAGACAGATGTTTTGATCTGATTCAGCAAAACTATATTGTGCTTTCCCCTAACCATCCGATGAATGGTTCCTGGAGTGTTGCACCACGCCCAGATTCAGATAACGGAATGTTCTTTGGTTTCCATGCTGGAGAACTATTACGTGGTTTTGGTTTATATGCCTTGTATCGTAAACTAAACCCTCAAAACGCTTTACCAATTTTGGATAATAGTAACATACCAACACTAACTGTTCTAACTATGAATGATATTAGTGTTGATGTAACCAAATAA

Genome Context

Tertiary structure

QHR69782.1
ESMFold structure
Source ESMFold
pLDDT 59.2
Oligomeric state monomer

Literature

Title Authors Date PMID Source
Exploring the Remarkable Diversity of Culturable Escherichia coli Phages in the Danish Wastewater Environment Olsen,N.S., Forero-Junco,L., Kot,W. and Hansen,L.H. 2020 GenBank