Protein

View in Explore

Genbank accession

YP_009850444.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,76

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADQNLKQIQFKRTSTENKAPGADIVARGEIALNTHGRTLAIYTKDENDKVVQLAGKGVPFLDTSGTLSVDGTTTLKDNVTISPNKSISFEASDLSGALVRHITGRCANNDGWYIGAGGASDRGFLEIGTYDNGDEPIYFVQRTGGTAQAEVRRLALLDGMGDTSIPGDLRLTGKTVKISNGSTLTLEMGVGANDAYIKNLRGSGVLQLTNDSNLTFRNSQVYYAMSGRGPGKDGTLLTNVINERQLKQDNFPITTGSETRWTKIALLKDPGSGQSRLQLMVSNGGNYGSTYSSIDFIDCSARNFPSSLTSSNIRNYLQVRRLGNPALDDTNQLRYSLIRTTEGLELWVMQRAFIGGVKVALLSAAGIEYYLPNGYTTTSTAPEGLVESTAIRIYDEVNKPNVVDGTEGVLSISRGGTGGTSAAAARNNLGLGTAAIRDVGEGTGNLLENGAYGLGGNGGKSIENITSNADMLNRLKAYGGTFWRGSIKSGVSVQNGLYSHGSGIFMNAGDTMSAINIDYASARVRVYAANNSSLAAGNVRYNELYGTANKPSKADVGLGNLTNDTQVKKAGDTMTGDLTAPNLHASGTGTASVYVNAGSGNAHVWFRTDGNERGVIWATPNTADLGQINIRAKTTGGTSAGDFSFRSDGRLDVPVAVKVGGAAMLTKDGNITSGSMFGGNLNNYLTSIKNDIVAGDNKQVSKTGDTMTGNLTIKANLKVENPNGSMVDFGSENSDKYSRITLARKVGSGAAVAMLKVTPEGHVQFGYQDAVATPAPTKYLLVKSNGLEVEGDLVFNQTYCGTEDAINISDKTNDLNNMVIKGSDLGTRLLYKCTSTGGASNISNKPTSDGNFVLEVLSLRKISDNDWTCKQTFTTKNGNVEGTYVRYCQNGTWSAWKEVVAGVQPINLGGTGATSVAAARNNLGVGEGQTATFGGLNVNGIGTNDPYITFKNGARIREGQGNGIGALILSASSSTDSKYLALRPYGDTSGVDIKVKANGSSEALLEWSYGPGIRSNSSGAFVIYSKAGQALHLRPNGDSSNQATVIDQNGKMTVGGEFEAQNSKITGNLNVSEDNRMIVLGKNSDIGLVKKNGMPGKMAISKSNSFTVMVSTNTNNRINPADTFNDIFKVDADGNQTVYGNSTISRALTVSSVINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLAGGTVTGNLDVTGTRLKTWQLEVDGKSTLRGGLDVSNSLRVSSGNLVAADTTNAGGLFAKNGNVYCDAGSPGTNSNYWFRDSAGNVRGVIWSNGQNGDMIIRNQSGRELVFRNDGYLQLAHLAPGNTNTGNTVNGIRLQRGDTFFDSFNSWQSGEYVRAGWHFYNTIAAGNPGSVDQWLTITDTGVKIWGSAANLRVEGVGNFWDVEIRSDRRVKSNIAKIDNALDKVSKLSGNVYDLQLPNGDTKPSAGLIAQEVQEVLPEAVTTDNDKDALLRLNYNAVIALLVESVKELKAEIEELKSKQ

Physico‐chemical properties

protein length:	1508 AA
molecular weight:	159674,67230 Da
isoelectric point:	7,49117
aromaticity:	0,06698
hydropathy:	-0,34562

Domains

Domains [InterPro]

DC_1942
ATT
4–609

DC_1942 cd19958 DC_0246

DC_1159
STR
442–1094

DC_1159 IPR030392 Coil

IPR030392
CHP
1415–1508

IPR030392

YP_009850444.1

1 1508

Architecture

ATT

STR

RBD

ATT 4-609 | STR 610-1094 | RBD 1115-1508

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1942	ATT	DC_1942	4	609	Novel HMM	DC_1942	N-terminal	Low	Positional only	254 proteins / 254 hits
DC_1159	STR	DC_1159	442	1094	Novel HMM	DC_1159	Central	Low	Positional only	94 proteins / 94 hits
cd19958	STR	DC_0464	813	900	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_0246	RBD	DC_0246	1115	1508	Novel HMM	DC_0246	C-terminal	Low	Positional only	127 proteins / 127 hits
IPR030392	CHP	DC_0088	1415	1470	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1415	1508	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1487	1507	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009850444.1

1 1508

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	335	335	0,0905
Central domain	336	534	200	0,2191
C-terminal	535	1508	973	0,6479

Note: Constraints were applied during segmentation.
Fixed 17 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-335

Central
336-534

C-terminal
535-1508

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage Marfa [NCBI]	2587809	Uroviricota > Caudoviricetes > Marfavirus >
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009850444.1 [NCBI]

Genbank nucleotide accession

NC_048798.1 [NCBI]

CDS location

range 154414 -> 158940
strand +

CDS

ATGGCCGATCAGAACTTAAAACAAATACAATTTAAAAGAACTAGTACAGAGAATAAAGCGCCTGGTGCCGATATCGTAGCCCGTGGCGAAATCGCACTGAATACCCATGGTCGTACTCTAGCCATTTATACTAAAGATGAAAATGACAAAGTAGTACAGTTAGCTGGTAAAGGTGTTCCATTTTTAGATACTTCCGGTACTCTTAGTGTTGATGGAACCACTACATTAAAAGATAACGTAACTATTTCTCCGAATAAATCGATCAGTTTTGAAGCTTCGGATTTAAGCGGAGCATTAGTACGTCATATCACCGGTAGGTGTGCTAATAATGATGGCTGGTACATTGGAGCTGGCGGCGCATCTGACCGGGGATTTCTTGAAATCGGTACGTATGATAACGGAGACGAACCTATCTATTTTGTTCAAAGAACCGGTGGAACGGCTCAAGCTGAAGTTCGTCGTTTAGCATTATTAGATGGGATGGGTGATACATCTATACCTGGGGACCTTCGTTTAACTGGTAAAACAGTAAAAATTTCAAACGGCAGCACTCTTACTTTGGAAATGGGCGTAGGTGCTAATGACGCTTACATTAAAAACTTGAGAGGTTCTGGTGTTCTTCAACTAACTAATGATAGTAATCTGACGTTCAGAAATTCCCAGGTTTATTACGCCATGAGTGGAAGAGGTCCTGGTAAAGATGGTACTCTTCTGACTAATGTGATAAATGAGCGCCAGCTTAAACAAGATAATTTCCCTATAACTACCGGTTCCGAAACTAGATGGACTAAAATTGCTCTTTTAAAAGACCCCGGGTCAGGCCAGAGTCGCCTGCAATTAATGGTGTCTAATGGCGGTAATTACGGTAGTACTTATAGTTCTATTGACTTTATCGATTGTAGCGCTAGAAATTTCCCGTCCTCATTAACAAGCAGTAACATTCGTAATTATCTGCAAGTTCGTCGACTTGGTAATCCGGCGCTTGATGACACTAACCAGTTGCGGTATAGTTTAATTCGTACAACTGAAGGTTTAGAACTGTGGGTTATGCAGCGCGCATTCATCGGCGGTGTTAAAGTTGCATTGTTATCTGCTGCCGGTATTGAATATTATCTGCCTAACGGTTACACAACTACTTCAACTGCGCCTGAAGGTTTAGTTGAGAGTACGGCTATTCGTATCTATGATGAGGTAAACAAGCCTAACGTTGTTGATGGTACTGAGGGCGTTCTGTCTATTAGCCGAGGCGGTACTGGTGGCACTTCTGCTGCAGCTGCTCGTAATAACTTAGGTCTTGGCACTGCGGCCATCCGCGATGTCGGTGAAGGCACTGGTAACCTTTTAGAAAATGGCGCTTACGGTTTAGGCGGTAATGGTGGTAAATCAATCGAAAACATTACCTCTAATGCTGATATGCTGAATCGTTTAAAAGCATATGGCGGTACTTTCTGGCGCGGCTCTATTAAATCTGGGGTTAGTGTTCAAAATGGTCTTTATAGCCATGGCTCCGGTATTTTTATGAATGCTGGTGATACCATGTCCGCTATTAATATCGACTACGCCAGTGCTAGAGTTCGTGTATATGCAGCTAACAACAGCAGTCTTGCGGCGGGAAATGTTAGATACAACGAACTTTATGGTACAGCAAATAAACCATCTAAGGCTGATGTTGGGCTTGGTAATCTGACAAACGATACCCAAGTTAAGAAAGCTGGCGATACAATGACCGGCGATTTAACTGCTCCTAATTTGCACGCTTCCGGCACTGGTACTGCATCGGTATATGTTAATGCAGGAAGCGGAAATGCACATGTATGGTTTAGAACAGACGGTAACGAACGCGGTGTAATTTGGGCAACTCCGAATACTGCTGACTTAGGTCAGATTAATATTCGTGCAAAAACTACTGGAGGCACTTCTGCTGGTGATTTTAGCTTCCGTTCTGATGGCCGACTTGATGTTCCTGTAGCAGTTAAAGTTGGTGGAGCAGCAATGCTAACCAAAGACGGGAATATTACCTCTGGTTCAATGTTTGGTGGTAACCTTAACAACTATTTGACTTCTATTAAAAACGATATCGTTGCTGGCGATAATAAGCAAGTAAGTAAGACTGGTGACACCATGACCGGTAACTTGACTATTAAAGCTAACTTAAAAGTCGAAAACCCTAATGGGTCAATGGTTGATTTTGGTTCAGAGAACTCAGATAAGTATAGCAGAATAACTCTTGCACGCAAAGTTGGCTCTGGCGCTGCCGTAGCAATGCTTAAAGTTACTCCTGAAGGACACGTGCAATTTGGCTATCAAGATGCAGTTGCTACTCCAGCTCCTACCAAGTACCTCCTGGTTAAATCTAACGGCCTTGAGGTAGAAGGGGATTTAGTTTTTAATCAGACTTATTGTGGTACTGAAGATGCAATTAATATTAGTGATAAGACTAATGACCTTAACAACATGGTTATTAAAGGCAGTGATTTAGGTACTCGTCTATTATACAAGTGTACTTCTACCGGCGGTGCTTCTAATATATCTAATAAACCTACATCTGACGGCAACTTTGTTCTTGAAGTTCTGTCTTTGCGTAAAATTTCTGACAATGATTGGACGTGTAAGCAGACCTTTACTACAAAGAATGGTAATGTTGAAGGTACATATGTTCGATACTGCCAAAACGGTACATGGTCTGCATGGAAAGAGGTTGTTGCTGGTGTTCAACCGATCAATCTAGGCGGTACTGGAGCAACTTCTGTAGCTGCTGCCCGTAATAACCTTGGCGTTGGTGAAGGACAAACGGCAACGTTTGGTGGATTGAATGTCAACGGCATTGGAACCAACGACCCCTATATCACATTTAAAAATGGCGCAAGAATACGAGAAGGACAAGGCAATGGTATTGGAGCTTTGATTTTATCAGCTTCTTCATCCACTGACTCAAAATACCTTGCATTACGCCCTTATGGTGATACCTCAGGTGTTGATATTAAAGTAAAAGCCAACGGGTCGAGTGAAGCATTGCTTGAATGGTCTTATGGCCCAGGTATTCGTTCGAATTCATCGGGTGCTTTTGTTATCTACTCAAAAGCCGGCCAAGCACTTCATTTAAGACCAAATGGCGACAGCTCGAACCAAGCTACAGTTATTGATCAGAACGGTAAAATGACGGTCGGCGGTGAGTTCGAGGCGCAGAACTCGAAAATCACAGGCAACTTGAACGTCTCTGAAGATAACAGAATGATCGTTCTTGGTAAAAACTCTGATATAGGTTTAGTCAAGAAAAACGGTATGCCAGGAAAAATGGCTATCAGTAAATCTAACTCGTTTACTGTTATGGTATCAACAAATACCAACAACCGAATTAATCCTGCTGATACGTTTAATGATATATTCAAAGTAGATGCTGATGGAAACCAAACTGTTTATGGAAATTCAACAATTTCTAGGGCTTTGACAGTATCAAGCGTTATTAATGCCAACGGCGGTATTATTGTTCCTACTACCAAGTATGTTCAAATTGCCGATGCTCCTACGCAGAATAACCAAGCCACTAACAAGAAATATGTTGATGATAAGGTTGCTTCTGCTATTAGTAATGCTGGCGATACCTATCTTCCGTTAGCGGGTGGTACTGTAACTGGTAACCTCGATGTAACTGGCACCAGATTAAAAACATGGCAGTTAGAAGTTGATGGCAAAAGTACTCTAAGAGGCGGGCTAGATGTTAGTAACAGTCTTAGAGTTTCTAGCGGAAACTTAGTCGCCGCGGACACAACCAATGCTGGCGGTCTTTTTGCTAAAAACGGTAATGTTTACTGTGATGCAGGTTCACCTGGTACAAACTCTAACTATTGGTTCCGCGATTCTGCTGGAAATGTCAGAGGTGTTATTTGGTCAAATGGTCAAAACGGTGACATGATTATCCGTAACCAAAGTGGCCGAGAGCTTGTATTCAGAAATGATGGATATCTGCAATTAGCCCACTTGGCGCCAGGAAACACAAATACTGGAAACACTGTAAATGGAATACGTTTACAGCGCGGTGATACGTTTTTCGATAGCTTTAACTCATGGCAGTCGGGTGAATATGTTCGCGCTGGTTGGCACTTCTATAATACAATCGCGGCGGGTAACCCAGGAAGTGTTGATCAATGGTTAACGATCACAGACACCGGGGTAAAAATCTGGGGTAGTGCTGCTAATCTACGTGTTGAAGGTGTTGGTAATTTCTGGGACGTTGAAATTCGTTCTGACCGTCGTGTGAAATCAAATATTGCTAAGATTGATAACGCCCTTGATAAAGTGTCGAAGCTATCTGGTAATGTTTATGATTTACAGCTTCCAAACGGTGATACTAAACCATCGGCGGGTCTTATCGCACAAGAAGTGCAGGAAGTTCTTCCTGAAGCAGTTACAACTGATAACGATAAAGATGCATTACTTCGTTTAAACTATAATGCAGTAATTGCGTTATTAGTCGAATCTGTTAAAGAGCTTAAAGCAGAAATTGAAGAACTTAAATCTAAACAATAA

Genome Context

Tertiary structure

PDB ID

82e640e43970a9d485ac4559e9ef6d8ccc24e5fd097d80bba80946c07ffe2bd6

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6525

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence