Protein

View in Explore

Genbank accession

UZT48287.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,90

Protein sequence

MLPKFNQPKGSTIGVLKDGRTVQQAIDDTVALPHVSPMWQKVRSSMDDVYIVIMGDSTGNETFEWVYQWATHLAQTVKTHSVRYRLWVDGSGWQAEERMSTGTTERSIYIDNVSVPGSTERYFQGSATSSIFNSGRVYDLVLLNYGHNEGTSVPSITISAGFTEAIFACRQINPMAPIVVTAQNPRRDFPDHSARAVACWADIAGVNGLGVIDVYSAFIKLGSPPELYIDMIHPNAEGHKVWLEVVKGALSDTPAYQFDRVAEPYSGPLRMNLIPNPAFVIWGVNVPALWEANAVTVTQDLARRESFAYSVKVTCTDVNSPLLYVDLSDTLTASRGQWVTFAARVWRPSGISTNAGRLQISGSGMNTVTSRSKANEAENGWMWAVCHAFVPKGTTSLQARFLGGTVVGDSFNVDRVWFGIGKVPSDIDFMGQPAVTLADYYQAENVGVPVGYDTQVSVDGNHIVATPVTSKARFFININYLTPGQTYRVTWSKASSADGYAYARSSGGGLGAILDTVRLSAGTTSTFVAPSKTCSFVMESDGRNPLDVTIASIVKV

Physico‐chemical properties

protein length:	556 AA
molecular weight:	60442,44810 Da
isoelectric point:	6,01899
aromaticity:	0,10072
hydropathy:	-0,07014

Domains

Domains [InterPro]

DC_1550
ATT
1–40

DC_1550 DC_0332 DC_0332

IPR036514
STR
33–252

IPR036514

SSF52266
STR
47–251

SSF52266

cd00229
ENZ
84–246

cd00229

IPR013830
ENZ
110–241

IPR013830

UZT48287.1

1 556

Architecture

ATT

STR

ATT 1-40 | STR 41-546 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1550	ATT	DC_1550	1	40	Novel HMM	DC_1550	N-terminal	Low	Positional only	65 proteins / 65 hits
IPR036514	STR	IPR036514	33	252	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
DC_0332	STR	DC_0332	40	250	Novel HMM	DC_0332	Central	Low	Positional only	32 proteins / 32 hits
SSF52266	STR	SSF52266	47	251	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
cd00229	ENZ	DC_0001	84	246	InterPro cluster	cd00229	C-terminal	High	Text match	480 proteins / 783 hits
IPR013830	ENZ	DC_0001	110	241	InterPro cluster	SGNH hydrolase-type esterase domain	C-terminal	High	Text match	480 proteins / 783 hits
DC_0332	STR	DC_0332	250	546	Novel HMM	DC_0332	Central	Low	Positional only	32 proteins / 32 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

UZT48287.1

1 556

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	45	45	0,6407
Central domain	46	244	200	0,2232
C-terminal	245	556	311	0,9223

Note: Constraints were applied during segmentation.
Fixed 46 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-45

Central
46-244

C-terminal
245-556

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage vB_KpnP_K2044-EW [NCBI]	2996176	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

UZT48287.1 [NCBI]

Genbank nucleotide accession

OP620755.2 [NCBI]

CDS location

range 34940 -> 36610
strand +

CDS

ATGTTACCAAAATTTAATCAGCCGAAAGGCTCAACCATTGGTGTGCTCAAGGATGGGCGCACTGTTCAACAGGCCATTGACGATACGGTGGCCCTACCTCATGTTTCCCCGATGTGGCAGAAGGTGCGCAGTTCGATGGACGATGTGTATATCGTTATCATGGGAGACTCCACTGGTAACGAGACGTTCGAGTGGGTGTACCAGTGGGCAACTCACCTCGCACAGACAGTCAAGACCCACTCTGTGAGGTACCGACTGTGGGTGGATGGCTCAGGGTGGCAGGCGGAGGAGCGCATGAGTACAGGGACTACGGAGCGGTCTATCTACATTGATAACGTGTCTGTACCAGGAAGCACAGAGCGATACTTCCAAGGTTCTGCAACCAGCAGTATCTTCAACTCAGGTCGAGTGTATGATTTGGTTCTACTCAACTACGGACACAACGAAGGGACCAGCGTTCCGTCTATCACCATTAGTGCTGGGTTCACCGAGGCAATCTTCGCGTGTCGACAGATTAACCCGATGGCACCAATCGTCGTAACAGCGCAGAACCCTCGTCGTGATTTCCCAGACCACTCTGCCCGTGCGGTAGCGTGCTGGGCCGATATAGCTGGTGTGAACGGACTTGGTGTAATCGACGTGTACTCTGCGTTCATTAAGTTAGGGTCACCTCCTGAGCTGTACATCGACATGATTCACCCCAACGCTGAGGGCCACAAGGTATGGTTAGAAGTCGTGAAGGGGGCGCTTAGCGATACCCCGGCTTACCAGTTCGACAGGGTGGCCGAGCCTTACAGCGGACCGCTTCGTATGAACCTAATCCCAAACCCAGCGTTTGTAATATGGGGTGTTAACGTTCCGGCGCTGTGGGAAGCCAACGCAGTGACTGTGACTCAGGACCTAGCCCGCCGTGAGAGCTTTGCGTACTCAGTCAAGGTAACCTGTACCGACGTGAACAGTCCACTGCTCTACGTTGACCTATCGGACACCTTGACCGCCTCTCGTGGCCAGTGGGTAACATTCGCTGCCCGAGTGTGGAGACCTTCTGGCATCTCAACGAACGCTGGTCGCCTTCAGATTAGCGGCAGTGGGATGAATACCGTAACGTCTCGCAGTAAGGCTAACGAAGCGGAGAACGGTTGGATGTGGGCAGTGTGCCATGCGTTTGTACCAAAAGGGACCACATCCCTACAGGCTCGCTTCTTGGGTGGTACTGTTGTGGGTGATTCCTTCAACGTTGACCGTGTGTGGTTCGGAATCGGTAAGGTGCCTAGCGACATCGACTTCATGGGACAACCAGCGGTAACTCTGGCAGATTACTACCAAGCCGAGAACGTTGGGGTTCCTGTGGGCTACGACACTCAGGTGTCTGTGGATGGTAACCATATTGTGGCAACCCCTGTGACCTCGAAGGCGCGATTCTTCATCAACATTAACTATCTGACCCCGGGGCAGACCTACAGGGTCACTTGGTCCAAAGCCTCCTCGGCTGATGGTTATGCTTACGCCCGGTCGTCTGGTGGTGGTCTTGGTGCGATTCTGGATACTGTTCGTCTATCTGCCGGGACCACGAGTACGTTTGTGGCACCGTCTAAGACCTGCTCGTTCGTAATGGAGTCCGACGGTAGAAACCCGCTCGATGTAACCATCGCGTCCATCGTTAAGGTATAA

Genome Context

Tertiary structure

PDB ID

1f83f9827c1d2375e9df5e1a2df935199e1822f1294a33ee93bf4511f0b3576d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8014

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence