Genbank accession
XZS47729.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence GenBank
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,80
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MADQNLKQIQFKRSSTENKAPGADIVARGEIALNTHGRTLAIYTKDENDTVVQLAGKGVPFLDTSGTLSVDGTTTLKDNVTVSPNKSISFETTDLSGEITRHIVGKCATNDGWYIGAGGTSNSGILEIGTIDDGAETIQFVQRGPGNVEARKLVLLDGSGNTTLPGDLRLSSNKAIKIYSGSTLALEMGVGSNDVYIKNQRGVGVLQLTNDSNLTFRNSQVYYAMTGKGPGKDGTLLTNVENERQLKQDNFPVTTGGEVRWTKVALLKDPGSSQSRLQLMVTNGGNYGNTRSSIDFIDCSARSFPTSLTSSNIRTYLQVRRLGDPALDETNQLRYSLVRTSEGLELWFTQRAFIGGVKVALLSIAGGTEYYLPTGYTVSSTEPEGLVESTAIRIYDELNKPNVDGGTEGVLPINRGGTGGTSAAAARSNLGLGTAAIRDVGESSGNLLEVGAFGIGGNGRSLVDITSDVDLMTRLKALGGTVFRANTASGYTGAPYYSHGTGFYGRASDTMAALNIDYATGNVRVFAINDSGLASGRVNSNVLYGTANKPSKADVGLGNLTNDAQVKKAGDTMSGDLLISKESPGLFLNATNDTGNSVIWFRNKGVETGAVWAIPNTESSGEVRIRARTTAGVTGGEFKFKSDGTFTSPGSIDITNGAFNGKTVNTEYANFNNTSSTTTEQTVSISGSQHTPLLLDRPTNANLSIGFKLSGMNMKRLGIDINGDIRYGEAENQANNAWLLTSDTVNRWIVNFGRDIKVAGVVNSTGGFAGPVAAYDLADAKLDLNDLTLTGAAPGHVKVYSCPSMGGGSNITNKPSGVGGNFIVIVECIRKINDTDYTNRQVLRTSDSKRSWERWLTVSGTSKIWTPWRMIVVSGIDSDVSFNSVTTTTGNLNSGNDLIVANNARVGGNLGLGGASSTKYADKGVVIGQGSALLETTDGRVIVGSSGGGNAVELRPGGPTQTNNLVKVTATSGSGGDTAIEYAQGAKIRANNGGALIISSKQGQTIYLRPQGDANGGNEVRIDSNTMVVTGGFEAQNTKIAGNLNVSEDNRMIVLGRNTDIGLVKKSNMPGKMAIGKSNSFTVMVSTNTNNQINPADTFNDIFKVDADGNQTVYGNAQINRQLTVTSNTNLNSVLIVQGNTTLNTDLSVKGNSSFTGVINADGNINVASGKFVIAGQAPTDNSHLTNKKYVDDKVASAISNAGDTYLPLAGGTVTGTLIVTGNQLKTTSLWTTGDAAVNGVLTVDGRARFNQEFIVSTSVNVQNTGNSHLVFRKADGTEKGLIWADEPGSVSIRAGGISGKTWNFWNSGSCQFPGAISNFNGISSTTNYPAGQPNGTYSNTAGLVTRFSNGAYASLYFQEYVGHYHQAILNVNGFGRDDNFYFRSGGDFFCTRNGSFDNVEIRSDRRAKSDIKVIENALEKVETLSGNTYELHNTSGGTTRSAGLIAQEVQEVLPEAVTQDNEEDGGMLRLNYNSVIALLVESVKELSAEVKGLKAEIEELKSK
Physico‐chemical
properties
protein length:1504 AA
molecular weight: 158819,39280 Da
isoelectric point:5,86802
aromaticity:0,06649
hydropathy:-0,29428

Domains

Domains [InterPro]
DC_1942
ATT
4–604
DC_1159
STR
440–1054
IPR030392
CHP
1404–1459
XZS47729.1
1 1504
Architecture
ATT
STR
RBD
ATT 4-604 | STR 605-1054 | RBD 1089-1504
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout
N-terminal
Central
C-terminal
XZS47729.1
1 1504
Domain Start End Length (AA) Confidence
N-terminal 1 732 732 0,1813
Central domain 733 948 217 0,4101
C-terminal 949 1504 555 0,7408
Legend: N-terminal Central domain C-terminal
3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring
N-terminal
1-732
Central
733-948
C-terminal
949-1504

Taxonomy

  Name Taxonomy ID Lineage
Phage Klebsiella phage Kp1Bj_HH11_M23
[NCBI]
3448943 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Klebsiella sp.
[NCBI]
576 cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
XZS47729.1 [NCBI]
Genbank nucleotide accession
PV784030.1 [NCBI]
CDS location
range 79799 -> 84313
strand +
CDS
ATGGCCGATCAGAACTTAAAACAAATACAATTTAAAAGAAGCAGTACAGAGAATAAAGCACCTGGTGCCGATATCGTAGCCCGTGGCGAAATCGCATTGAATACCCATGGGCGTACTCTTGCCATTTATACTAAAGATGAAAATGATACCGTAGTACAGCTCGCCGGTAAAGGGGTTCCATTTTTAGATACCTCTGGTACTCTTAGTGTTGATGGAACCACTACATTAAAAGACAACGTAACAGTTTCTCCGAATAAATCGATCAGTTTTGAAACTACTGATTTAAGCGGTGAAATAACTCGTCATATCGTTGGCAAATGCGCCACTAACGACGGTTGGTATATCGGCGCCGGTGGTACAAGCAATAGCGGTATTCTTGAAATCGGTACTATTGATGACGGCGCTGAAACTATTCAATTCGTACAACGCGGCCCGGGCAACGTTGAAGCCCGAAAACTGGTCTTACTTGATGGTTCGGGTAATACTACTCTTCCGGGTGATTTAAGATTATCTAGCAATAAAGCCATTAAAATTTACAGTGGAAGCACTCTTGCTCTTGAAATGGGTGTAGGCTCTAACGACGTCTATATTAAAAACCAACGAGGCGTAGGTGTTCTTCAATTAACTAATGATAGCAATCTGACCTTCAGAAATTCCCAGGTTTATTATGCCATGACTGGAAAAGGTCCTGGTAAAGATGGTACTCTTCTGACTAATGTAGAAAACGAGCGCCAACTTAAGCAGGATAATTTCCCTGTAACGACCGGCGGCGAAGTTAGATGGACCAAAGTTGCCCTTTTAAAAGACCCGGGGTCAAGCCAGAGTCGCTTGCAACTGATGGTGACTAATGGCGGTAACTACGGTAACACTCGCAGTTCTATTGACTTTATTGATTGCAGCGCTAGAAGCTTTCCAACCTCGTTAACAAGCAGTAACATTCGTACTTATCTGCAGGTCCGTCGACTTGGTGATCCGGCACTTGATGAGACCAATCAATTGCGTTATAGTCTAGTTCGTACCTCTGAAGGTTTAGAACTGTGGTTTACGCAGCGCGCATTTATCGGTGGAGTTAAAGTTGCACTGTTATCTATTGCCGGTGGTACTGAATACTATTTGCCTACTGGTTACACAGTTTCTTCAACAGAGCCGGAAGGTTTAGTTGAGAGTACGGCTATTCGTATCTACGACGAATTGAACAAGCCTAATGTTGATGGTGGCACTGAGGGTGTTCTGCCTATTAACCGTGGCGGTACTGGTGGTACTTCTGCAGCGGCAGCCCGTAGTAACTTAGGCCTTGGAACTGCGGCTATCCGTGATGTTGGTGAATCTAGCGGAAACTTGTTGGAAGTTGGTGCCTTTGGTATTGGCGGTAACGGAAGATCACTAGTAGATATTACTTCTGACGTTGATTTAATGACTCGCCTTAAGGCTCTTGGTGGTACAGTGTTCAGAGCTAACACAGCGAGTGGTTATACAGGGGCTCCTTATTACTCCCATGGCACCGGATTTTACGGAAGAGCTTCTGACACAATGGCTGCGCTTAATATAGATTATGCAACCGGTAATGTCAGAGTATTTGCTATAAACGATAGTGGTTTAGCAAGTGGAAGAGTAAATTCTAATGTTCTCTACGGCACAGCAAATAAGCCATCTAAGGCCGATGTCGGACTTGGTAATCTGACAAATGACGCCCAGGTTAAAAAAGCTGGTGATACAATGTCTGGTGATTTGCTTATCAGTAAAGAGTCACCTGGGTTGTTTTTGAATGCCACTAATGATACCGGAAACTCTGTAATTTGGTTTAGAAACAAAGGAGTTGAGACAGGTGCTGTATGGGCAATACCTAACACCGAGTCTTCGGGTGAGGTTCGAATTCGTGCTAGAACGACTGCTGGGGTCACAGGCGGCGAGTTCAAATTTAAATCTGACGGTACGTTTACATCTCCAGGTAGTATTGATATTACTAATGGTGCCTTTAATGGTAAAACGGTTAATACCGAATATGCCAACTTTAATAACACAAGTTCAACCACAACCGAACAAACAGTTTCTATTAGTGGTTCACAGCACACTCCTCTGTTACTGGATAGACCGACTAACGCGAACTTGTCTATCGGGTTTAAACTTTCCGGAATGAACATGAAACGTTTGGGTATTGATATAAACGGTGATATTCGTTACGGTGAAGCAGAAAACCAGGCAAACAACGCATGGCTGTTGACTTCGGATACAGTAAACAGATGGATTGTTAACTTTGGTCGTGATATTAAAGTTGCTGGTGTGGTTAATTCGACTGGTGGATTTGCTGGCCCTGTTGCAGCGTACGATTTGGCTGATGCTAAACTAGATCTTAATGATTTAACGCTAACTGGTGCTGCCCCAGGCCATGTTAAAGTTTATTCATGCCCTAGTATGGGTGGCGGTAGTAACATCACCAATAAACCTTCTGGCGTCGGTGGTAACTTTATTGTTATTGTTGAATGTATCCGTAAAATAAACGATACCGATTACACTAACCGCCAAGTATTACGCACATCTGATAGTAAGCGCAGTTGGGAACGTTGGTTAACTGTTAGCGGTACTTCTAAAATCTGGACGCCGTGGAGAATGATCGTTGTTAGCGGAATCGACTCCGATGTATCATTTAACTCTGTTACCACGACTACAGGAAACCTGAACAGCGGAAATGATTTGATTGTTGCTAACAACGCTCGCGTAGGTGGTAACTTAGGGTTAGGTGGTGCTTCTTCAACGAAATACGCTGATAAAGGTGTTGTGATTGGCCAAGGTAGTGCTCTGTTAGAAACTACTGATGGTCGTGTTATCGTTGGTAGTTCTGGTGGTGGTAATGCTGTTGAATTGCGTCCTGGTGGCCCAACTCAAACCAACAACCTGGTCAAAGTAACTGCTACATCTGGAAGTGGTGGTGACACTGCTATCGAGTATGCACAAGGCGCTAAAATTCGGGCTAATAACGGCGGCGCATTAATTATTTCTTCTAAACAAGGCCAAACAATCTATCTGAGACCGCAAGGTGATGCAAACGGTGGAAATGAAGTTCGTATTGATTCAAACACTATGGTCGTCACAGGCGGATTTGAGGCTCAGAACACTAAAATCGCAGGTAATTTAAATGTATCTGAAGATAATAGAATGATTGTTCTTGGCAGAAATACCGATATCGGTTTAGTCAAGAAAAGTAATATGCCAGGAAAAATGGCTATCGGTAAATCTAACTCGTTTACTGTTATGGTATCAACCAATACCAACAACCAAATTAATCCTGCGGATACGTTTAATGATATATTCAAGGTAGATGCTGACGGAAACCAAACCGTTTACGGAAATGCCCAAATTAACAGACAGCTTACAGTAACAAGTAATACTAACTTGAACTCTGTTCTTATTGTTCAAGGTAATACTACTCTTAATACTGATTTGTCTGTTAAAGGCAACTCCAGCTTCACCGGTGTGATTAACGCTGATGGAAACATCAACGTCGCTTCTGGTAAGTTTGTTATTGCGGGTCAAGCTCCTACTGATAACTCGCATCTGACCAACAAAAAATACGTTGACGATAAAGTTGCTTCTGCTATTAGTAATGCTGGTGATACTTATCTTCCGTTAGCGGGTGGTACTGTGACTGGTACATTAATAGTTACAGGTAATCAACTGAAAACTACTTCTCTGTGGACTACCGGAGACGCTGCAGTTAATGGTGTTTTAACTGTTGATGGAAGGGCTAGATTTAATCAAGAGTTCATTGTATCAACTTCAGTTAACGTCCAGAACACCGGTAACAGTCATTTAGTCTTCCGTAAAGCAGATGGTACGGAAAAAGGCCTTATTTGGGCTGATGAGCCTGGTAGCGTTAGTATAAGAGCTGGTGGTATCTCAGGGAAGACGTGGAATTTCTGGAACAGCGGTTCTTGTCAATTCCCAGGTGCTATTAGTAACTTTAACGGAATTAGCTCAACTACTAATTATCCCGCAGGACAGCCTAACGGTACGTACAGTAATACCGCAGGATTGGTAACTAGATTTAGTAATGGTGCTTATGCTTCGTTATATTTCCAAGAGTATGTAGGACATTATCACCAGGCTATTCTTAATGTTAACGGATTTGGTCGAGATGACAATTTCTATTTCAGATCCGGTGGTGACTTCTTCTGTACTCGTAATGGTTCTTTCGATAACGTTGAGATTCGTTCTGACCGTAGAGCTAAATCAGATATTAAAGTTATTGAAAATGCTTTGGAAAAAGTAGAAACCTTATCTGGTAATACTTATGAGCTTCACAATACATCTGGCGGTACTACCCGTTCTGCTGGTTTAATCGCACAAGAAGTTCAAGAAGTTCTTCCTGAAGCAGTTACTCAGGATAATGAAGAAGATGGTGGTATGCTTCGTCTGAATTATAACTCAGTAATTGCTCTTCTTGTTGAATCAGTGAAAGAACTTTCAGCTGAGGTCAAAGGTCTTAAAGCCGAAATTGAAGAACTTAAATCTAAATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
5e18242ba82d7e306b31a4bbcc9c6c2fdaa4a811e809fb5ab9c21ef8599cb931
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6919
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50