Genbank accession
XNS38628.1 [GenBank]
Protein name
tail fiber protein proximal subunit
RBP type
TSP
Evidence RBPdetect
Probability 0,61
TF
Evidence RBPdetect2
Probability 0,77
Protein sequence
MAEIKRKFRAEDGLDAGGDKIINVALADRTVGTDGVNVDYLIQENTVQQYDPTRGYLKDFVIIYNNRFWAATDNIPKPAGNFNRIRWKALRTDAVYTTVSSGPYQLKSGEAISVDTSVGNDIEFTLPPSPLDGETVIIQDIGGKPGINQVKINSSNQSIVNFRGEQVRSVLMTHPKSQMVFIFNNRLWQMYIADYSREAAIVTPSTAYQAQSNDFIVRRFTSAAPINVKLPRFANHGDIINFVDLDKLNPLYHTIVTTYDETTSVQEVGTHSIEGRTSIDGFLMFDDNEKLWRLFDGDSKARLRIITTNSNIRPNEEVMVFGANNGTTQTIELQLPTDISVGDTAKISMNYMRKGQTVKIKAAGEDKIASSVQLLQFPKRSEYPPEAEWVTVQELVFNGETNYVPVLQLAYIEDSDGKYWVVQQNVPTVERVDSLNASTRARLGVIALATQAQANADLENSPQKELAITPETLANRTATETRRGIARIATTAQVNQNTTFSFADDLIITPKKLNERTATETRRGVAEIATQQETNTGTDDTTIITPKKLQARQGSESLSGIVTFVSTAGATPASSRELNGTNVYNKNTNNLVVSPKALDQYKATPTQQGAVILAVESEVIAGQSQEGWANAVVTPETLHKKTSTDARIGLIEIATQSEVNTGTDYTRAVTPKTLNDRRATESLSGIAEIATQVEFDAGVDDTRISTPLKIKTRFNSTDRTSVVALSGLVESGTLWDHYTLNILEANETQRGTLRVATQVEAAAGTLDNVLITPKKLLGTKSTEAQEGVIKVATRSETVAGTSANTAVSPKNLKWIVQSEPTWAATTAIRGFVKTSSGSITFVGNDTVGSTQPLESYEKNGYAVSPYELNRVLANYLPLKAKAVDSNLLDGLDSLQFIRRDIAQTVNGSLTLTQQTNLSAPLVSSSTATFGGSVSANSTLTISNTGTATRLIFEKGPQTGTNPAQTMTVRVWGNQFSGESDTTRSTVFEVSDETSSHFYSQRNKAGNITFNINGTVTPINVNASGTLNANGVATFGNSVTATGEIISRSANAFRAINGNYGFIVRNDGSVTNFMLTASGDQTGGFNGLRPLSINNQSGQVTIGESLIIAKGATINSGGLTVNSRIRSQGTKTSDLYTRAPTSDTVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGAIPSDNGIIGNLTIRDFLRIGNVRIIPDPVNKTVKFEWVE
Physico‐chemical
properties
protein length:1289 AA
molecular weight: 140305,77290 Da
isoelectric point:5,55848
aromaticity:0,07292
hydropathy:-0,35128

Domains

View on InterPro
XNS38628.1
1 1289 aa
ATT 979–1092 · ATT 1139–1237 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Tail Spike Domain Segmentation

Segmented into three structural domains: N-terminal, central, and C-terminal.

XNS38628.1
1 1289 aa
Domain Start End Length (AA) Confidence
N-terminal 1 981 981 0,9001
Central domain 982 1180 200 0,3217
C-terminal 1181 1289 108 0,2414
N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Taxonomy

Phage
Escherichia phage Pinarejo [NCBI] · taxon 3233706

Coding sequence (CDS)

Genbank protein accession
XNS38628.1 [NCBI]
Genbank nucleotide accession
PP925831 [NCBI]
CDS location
range 149109 -> 152978
strand +
CDS
ATGGCCGAGATTAAAAGAAAGTTCAGAGCAGAAGATGGTCTGGACGCAGGTGGCGATAAAATAATCAACGTAGCTTTAGCTGATCGTACCGTAGGAACTGACGGTGTTAACGTTGATTACTTAATTCAAGAAAACACAGTTCAGCAATATGATCCAACTCGTGGATATTTAAAAGATTTTGTAATCATTTATAATAATCGTTTTTGGGCAGCAACGGATAATATTCCAAAACCTGCTGGAAATTTTAATAGAATTCGTTGGAAAGCATTACGTACTGATGCCGTATATACAACTGTATCATCTGGACCATATCAATTAAAATCCGGAGAAGCAATTTCAGTAGATACATCAGTTGGCAATGACATTGAGTTTACTTTACCACCTTCTCCGCTTGATGGAGAAACCGTAATAATTCAAGATATCGGTGGAAAACCTGGCATAAATCAGGTTAAAATAAATTCTTCAAATCAGAGTATTGTCAATTTTAGAGGTGAACAGGTACGTTCAGTTTTAATGACTCATCCAAAGTCACAGATGGTATTCATTTTTAATAATCGTTTGTGGCAAATGTATATTGCTGATTATAGCAGAGAAGCTGCGATTGTTACTCCATCGACTGCATATCAAGCACAATCTAATGATTTTATCGTACGTAGATTTACTTCTGCCGCACCGATTAATGTTAAACTTCCAAGATTTGCCAATCATGGAGATATCATTAATTTCGTTGATTTAGATAAATTAAATCCACTTTATCATACAATTGTTACTACATACGATGAAACGACTTCAGTACAAGAAGTTGGAACTCATTCCATTGAAGGCCGTACATCGATTGACGGTTTCTTGATGTTTGACGATAATGAGAAATTGTGGAGATTGTTTGACGGGGATAGTAAAGCACGTTTACGCATTATAACAACTAATTCAAATATTCGTCCAAATGAAGAAGTCATGGTATTTGGCGCGAATAATGGAACAACCCAAACAATTGAACTTCAGCTTCCGACTGATATTTCTGTTGGTGATACTGCTAAAATTTCCATGAATTACATGAGAAAAGGACAAACAGTTAAAATCAAAGCTGCTGGTGAAGATAAAATTGCTTCTTCAGTTCAATTGCTGCAATTCCCAAAACGTTCAGAATATCCGCCTGAAGCTGAATGGGTAACAGTTCAAGAATTAGTTTTTAATGGTGAAACTAATTATGTACCAGTTTTGCAACTTGCTTATATAGAAGATTCTGATGGAAAATACTGGGTTGTACAGCAAAACGTTCCAACTGTAGAAAGAGTAGACTCTTTAAATGCTTCTACTAGAGCAAGATTAGGCGTAATTGCTTTAGCTACGCAAGCTCAAGCAAATGCTGATTTAGAAAATTCTCCACAAAAAGAATTAGCAATTACTCCAGAAACGTTAGCTAATCGTACTGCTACTGAAACTCGCAGAGGTATTGCAAGAATAGCAACTACTGCTCAAGTAAATCAGAACACTACATTCTCTTTTGCAGATGACCTTATCATCACTCCTAAAAAGCTGAATGAAAGAACTGCTACAGAAACTCGTAGAGGTGTCGCTGAAATTGCTACGCAGCAGGAAACTAATACAGGTACTGATGATACTACAATCATCACTCCTAAAAAGCTTCAAGCTCGTCAAGGTTCTGAATCATTATCTGGTATTGTAACTTTTGTATCTACCGCAGGAGCTACTCCAGCTTCTAGTCGTGAATTAAATGGTACGAATGTTTATAATAAAAACACTAATAATTTAGTTGTTTCACCTAAAGCTTTGGATCAGTATAAAGCTACTCCAACGCAACAAGGCGCAGTAATTTTAGCAGTTGAAAGTGAAGTAATTGCTGGACAAAGCCAAGAAGGATGGGCAAATGCGGTTGTAACGCCAGAAACGTTACATAAAAAGACATCAACTGATGCAAGAATTGGTTTAATTGAAATTGCTACACAAAGTGAAGTTAATACAGGAACTGATTATACTCGTGCAGTCACTCCTAAAACTTTAAATGACCGTAGAGCAACTGAAAGTTTAAGTGGTATAGCTGAAATTGCTACACAGGTTGAATTCGACGCAGGCGTCGACGATACTCGTATCTCTACACCATTAAAAATTAAAACCAGATTTAATAGTACTGATCGTACTTCTGTTGTTGCTCTATCTGGATTAGTTGAATCAGGAACTCTCTGGGACCATTATACCCTTAATATTCTTGAAGCAAATGAGACACAGCGTGGTACACTTCGTGTAGCTACACAAGTTGAAGCTGCTGCAGGAACATTAGATAATGTTCTAATAACTCCTAAAAAGCTTTTAGGTACTAAATCTACTGAAGCACAGGAAGGCGTTATTAAAGTTGCAACTCGGTCTGAAACTGTAGCTGGAACGTCAGCAAATACTGCTGTATCTCCAAAAAATTTAAAATGGATTGTGCAGAGTGAACCTACTTGGGCAGCGACTACTGCGATAAGAGGTTTTGTTAAAACTTCATCTGGTTCAATTACATTCGTTGGTAATGATACGGTAGGTTCAACACAGCCATTAGAATCATATGAGAAAAATGGTTATGCAGTATCACCATATGAATTAAATCGCGTATTAGCAAATTATTTGCCATTAAAAGCAAAAGCTGTAGATAGTAATTTATTAGATGGTCTAGATTCGCTCCAGTTCATTCGTAGGGATATTGCACAAACAGTTAATGGTTCACTAACCTTAACCCAACAAACGAATCTGAGTGCCCCTCTTGTATCATCTAGTACTGCTACATTCGGTGGATCAGTTTCAGCAAATAGTACATTAACTATTTCTAATACTGGAACGGCAACTCGTCTGATTTTTGAGAAAGGACCTCAAACTGGAACAAACCCAGCTCAAACGATGACAGTCAGAGTGTGGGGAAATCAATTTAGCGGGGAATCAGACACAACACGTTCTACCGTATTTGAAGTTAGTGATGAAACGTCTAGTCATTTTTATTCTCAGCGTAATAAAGCTGGAAATATAACATTTAATATCAACGGTACAGTAACACCGATAAATGTTAATGCTTCAGGAACATTGAATGCAAATGGTGTAGCAACATTTGGTAATTCAGTCACTGCAACTGGTGAAATTATTTCTCGAAGCGCAAATGCTTTCCGTGCTATTAACGGAAATTATGGTTTCATTGTTCGCAATGATGGATCAGTAACGAATTTTATGCTTACTGCATCGGGTGATCAGACTGGTGGATTTAATGGATTACGTCCATTGTCCATTAATAATCAATCTGGGCAGGTCACAATTGGTGAAAGCTTGATCATTGCTAAAGGTGCTACTATAAATTCAGGTGGTTTAACTGTTAACTCGAGAATTCGTTCTCAGGGCACTAAAACATCTGATTTATATACCCGTGCGCCGACATCTGATACTGTAGGATTCTGGTCAATCGATATTAATGATTCAGCCACTTATAACCAGTTCCCGGGTTATTTTAAAATGGTTGAAAAAACTAATGAAGTGACTGGGCTTCCATACTTAGAACGTGGCGAAGAAGTTAAATCTCCTGGTACATTGACTCAGTTTGGTAACACACTTGATTCACTTTACCAAGATTGGATTACTTATCCAACGACCCCAGAAGCACGTACCACTCGCTGGACACGTACATGGCAGAAAACCAAAAACTCTTGGTCAAGTTTTGTTCAGGTATTTGACGGAGGTAACCCTCCTCAACCTTCAGATATAGGAGCGATCCCATCTGATAATGGAATAATAGGTAATCTTACTATTCGTGATTTCTTACGAATTGGTAATGTTCGCATTATTCCTGACCCAGTGAATAAAACTGTTAAATTTGAATGGGTTGAATAA

Genome Context

Tertiary structure

XNS38628.1
ColabFold structure
Source ColabFold
pLDDT 27.5
Oligomeric state monomer