Protein

View in Explore

Genbank accession

WWS24015.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 0,68

TSP

Evidence RBPdetect

Probability 0,72

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADQNLKQIQFKRTSTENKAPGADIVARGEIVLNTHGRTLAIYTKDEADNVVQLAGKGVPFLDTAGNLNVDGTTTLKDNVTISPNKAINFEASDLSGALVRHITGKCANNDGWYIGAGGASDQGFLEIGTYDNGNEPIYFVQRTGGTTQAEVRRLALLDGFGDTSIPGDLRLTGKTVKISNGSTLTLEMGVGSNDAYIKNLRGTGVLQLTNDSNLTFRNSQVYYAMNGRGPGKSGTLLTNVENNRQAWQYVISAATAGTPRWVKVATIKHPGDASSQLDLMITGGIDSGHGKHYVDFITLSGRNLTSWSTSNLDNWVEWRRVGSPNKGNVPEYYVVKNDAATDSEASFDFYAKVPRYGNGLYVTVLNTAGYNGQDSGKVIIYETGQDTGATGPSGSILVSMKQIFDSYAKPDFSDTTGTLPVNRGGTGATNAGDARNNLGLRTAAVRDVGESSGNVMEVGAFGVGGNGKSLVNITSDVDLMTRLKALGGTVFRANTASGYTGAPYYSHGTGFYGRASDTMAALNIDYATGNVRVFAINDSGLASGRVNSNVLYGTANKPSKDDVGLGNLTNDTQVKKAGDTMTGDLTVPNLHASGPGTASVYVNAGSGNAHVWFRTDGNERGVIWATPNTADLGQINIRAKTTGGTSAGDFSFRSDGRLDVPVAVKVGGAAMLTKDGNITSGSMFGGNLNNYLTSIKNDITTGDNKQVSKTGDTMTGNLTINANLKVENPSGTFVDLGSKNSDKYSRLTLARKVGDGAAVAMLKITPEGYVQFGYQTAVATPSPTKYIRVKPDGLDVEGDLVFNQTYRGTEEAVDISDKTIDLNSLVIKRTDPGTRQLYKCVSSGGGNNISNKPTSDGNFVLEVLSLRKVSNTDWSCKQTFTTKKGGVEGTYIRYAQNGSWSAWKEVVAGVQPINLGGTGATSVASARNNLGVGEGQTVSFGNLVTNDLTANGNARLVGRLNLGSTSATGVLRANETGAVVLGSASGQNIHVRAGSPDTSSGETRFEPNGNVVVGGAITASGSLQVNGEAAMSRSLIVSQNIKNTNDNSFILMGKDSDLGFVKKSGAGSKLVFASGKTFTVAKSSATAISNPASETYTDVFKVDADGNQTVYGNAQVNRQLTVSSSATVSGIINANGGIIVPTTKYVQIADAPTQNNQATNKKYVDDKVASAISNAGDTYLPLAGGTVTGNLDVTGTRLKTWQLEVDGKSTLRGGLDVSSSLKVSSGNLVAADTTNAGGLFAKNGNVYCDAGSAGTNSNYWFRDSAGNTRGVIWSNGQNGDMIIRNQSGRELVFRNDGYLQLAHLAPGNTDTGNTVNGIRLQRGDTVFDSFNSWQSGQYVRAGWHFYNASGVDQWLALTDTGVKIWGSAANLRVEGVGNFWDVEIRSDRRVKSNIAKIDNALDKVSKLSGNVYDLQLPNGDTKPSAGLIAQEVQEVLPEAVTTDNDKDALLRLNYNAVIALLVESVKELKAEIEELKSK

Physico‐chemical properties

protein length:	1479 AA
molecular weight:	155804,86930 Da
isoelectric point:	7,16498
aromaticity:	0,06964
hydropathy:	-0,33049

Domains

Domains [InterPro]

DC_1942
ATT
4–618

DC_1942 cd19958 DC_0246

DC_0468
STR
484–1004

DC_0468 IPR030392

IPR030392
CHP
1387–1442

IPR030392 Coil

WWS24015.1

1 1479

Architecture

ATT

STR

RBD

ATT 4-618 | STR 619-1004 | RBD 1084-1479

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1942	ATT	DC_1942	4	618	Novel HMM	DC_1942	N-terminal	Low	Positional only	254 proteins / 254 hits
DC_0468	STR	DC_0468	484	1004	Novel HMM	DC_0468	Central	Low	Positional only	72 proteins / 72 hits
cd19958	STR	DC_0464	820	907	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_0246	RBD	DC_0246	1084	1479	Novel HMM	DC_0246	C-terminal	Low	Positional only	127 proteins / 127 hits
IPR030392	CHP	DC_0088	1387	1479	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1387	1442	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1459	1479	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WWS24015.1

1 1479

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	365	365	0,0946
Central domain	366	586	222	0,2069
C-terminal	587	1479	892	0,6297

Note: Constraints were applied during segmentation.
Fixed 300 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-365

Central
366-586

C-terminal
587-1479

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage vB_Kpn_AM_K3 [NCBI]	3127573	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WWS24015.1 [NCBI]

Genbank nucleotide accession

PP355765.1 [NCBI]

CDS location

range 34211 -> 38650
strand +

CDS

ATGGCCGATCAAAACTTAAAACAAATACAATTTAAAAGAACTAGCACAGAGAATAAAGCACCAGGTGCAGATATCGTAGCCCGTGGCGAAATAGTGTTGAATACACATGGGCGTACTCTTGCCATTTACACTAAAGATGAAGCCGATAACGTTGTTCAGCTTGCAGGTAAAGGGGTTCCTTTCTTAGATACTGCAGGTAATCTTAATGTTGATGGAACTACTACGTTAAAAGACAACGTTACTATTTCTCCGAATAAAGCGATCAATTTTGAAGCTTCGGATTTAAGCGGAGCATTAGTACGTCATATCACCGGTAAGTGTGCTAATAATGATGGCTGGTACATTGGAGCTGGCGGTGCATCTGACCAGGGATTTCTTGAAATTGGTACGTATGATAACGGAAATGAACCGATCTATTTTGTTCAAAGAACCGGTGGAACGACACAGGCCGAAGTTCGTCGTTTAGCATTATTAGATGGGTTTGGCGATACCTCTATACCTGGGGACCTTCGTTTAACTGGTAAAACAGTAAAAATTTCAAACGGCAGCACTCTTACTTTGGAAATGGGTGTAGGTTCTAATGACGCATACATTAAAAACCTGAGAGGAACTGGTGTTCTTCAATTAACCAATGACAGTAATCTGACATTCAGAAATTCACAGGTTTATTACGCCATGAACGGAAGAGGTCCTGGTAAATCCGGTACTCTTCTGACAAATGTAGAAAACAATCGCCAAGCATGGCAATACGTAATTTCTGCTGCAACCGCTGGAACTCCACGTTGGGTTAAAGTAGCTACAATTAAACATCCAGGAGACGCGTCTTCACAGCTGGATTTAATGATTACTGGTGGCATTGATTCTGGGCATGGCAAACATTATGTTGATTTTATCACGTTATCTGGTCGCAATTTAACATCCTGGAGCACTAGCAATTTAGATAACTGGGTTGAATGGCGTCGAGTCGGTTCTCCTAATAAAGGAAACGTTCCAGAATATTACGTTGTTAAAAACGATGCTGCTACAGATTCAGAGGCTTCATTTGATTTTTACGCTAAAGTTCCTCGATATGGTAATGGCCTTTACGTTACAGTGTTAAACACTGCCGGATACAACGGTCAAGATAGCGGTAAAGTAATTATCTACGAAACTGGCCAAGATACTGGTGCTACTGGACCGTCCGGAAGTATTCTTGTTTCAATGAAACAGATTTTTGACAGTTACGCAAAACCAGATTTCAGCGATACTACCGGTACTCTTCCGGTTAACCGTGGTGGTACAGGTGCTACTAACGCAGGAGATGCCCGAAACAACCTGGGCCTTAGAACTGCGGCTGTTCGCGATGTTGGTGAATCCAGCGGAAACGTGATGGAAGTTGGTGCCTTTGGTGTCGGTGGTAACGGAAAATCACTGGTAAATATTACGTCTGACGTTGATTTAATGACTCGCCTTAAGGCTCTTGGTGGTACAGTATTCAGAGCCAACACAGCAAGTGGTTATACAGGGGCTCCTTATTACTCCCATGGCACCGGATTTTACGGAAGAGCTTCTGACACAATGGCTGCGCTTAATATAGATTATGCAACTGGTAACGTCAGAGTATTTGCTATAAACGATAGCGGTTTAGCAAGTGGAAGAGTAAATTCTAATGTTCTCTACGGCACAGCAAATAAGCCATCTAAGGATGACGTCGGACTTGGTAATCTGACAAACGATACCCAAGTTAAGAAAGCTGGCGACACCATGACTGGTGATTTAACTGTTCCTAATTTACATGCTTCCGGCCCGGGTACTGCATCAGTATATGTTAATGCAGGAAGCGGAAATGCTCATGTGTGGTTTAGAACAGACGGTAACGAACGCGGTGTAATTTGGGCAACTCCAAATACAGCGGACTTAGGACAAATTAATATTCGTGCAAAAACTACTGGAGGCACTTCTGCTGGTGATTTTAGCTTCCGTTCTGATGGCCGCCTTGATGTTCCTGTAGCAGTTAAAGTTGGTGGAGCAGCAATGCTAACCAAAGACGGGAATATTACCTCTGGTTCGATGTTTGGTGGTAACCTTAACAACTATTTGACTTCTATTAAAAATGATATCACCACTGGAGATAATAAGCAAGTAAGCAAGACTGGTGATACCATGACCGGTAACTTGACTATTAACGCTAACTTAAAAGTCGAAAATCCTAGTGGAACATTTGTTGATTTAGGTTCAAAGAACTCTGATAAGTATAGCAGATTAACCCTTGCTCGTAAAGTTGGCGATGGCGCTGCTGTGGCAATGCTTAAAATTACTCCTGAAGGATACGTGCAATTTGGCTATCAAACTGCAGTTGCTACTCCATCTCCTACCAAGTACATCAGAGTTAAACCTGACGGTCTTGATGTAGAAGGGGATTTAGTTTTTAATCAGACCTATCGCGGCACTGAAGAGGCAGTTGATATTTCTGATAAGACCATTGACCTTAATAGTCTTGTCATTAAAAGAACCGACCCAGGTACTCGTCAGTTATATAAATGCGTATCTTCTGGCGGTGGAAATAATATATCGAACAAACCTACCTCTGATGGCAACTTTGTTCTTGAAGTTCTGTCTTTACGCAAGGTTTCTAATACCGATTGGTCATGTAAACAAACCTTTACTACAAAGAAGGGCGGTGTTGAAGGTACATATATCCGCTACGCACAAAACGGCTCATGGTCTGCGTGGAAAGAGGTTGTTGCTGGTGTTCAACCGATCAATTTAGGCGGTACTGGAGCAACTTCTGTAGCTTCTGCCCGTAATAACCTCGGTGTTGGTGAAGGACAAACTGTATCATTCGGTAATTTAGTTACCAACGACTTAACTGCAAACGGAAACGCTAGATTAGTTGGAAGACTGAACCTTGGTTCTACTTCTGCGACTGGCGTATTACGAGCTAATGAAACTGGTGCGGTTGTCTTAGGTTCTGCTAGTGGTCAAAACATCCACGTTAGAGCAGGAAGCCCCGATACTTCTTCTGGTGAAACCCGCTTTGAGCCAAACGGAAATGTTGTGGTTGGTGGTGCTATTACGGCTTCCGGAAGCCTGCAAGTAAATGGCGAAGCCGCGATGAGCAGAAGCTTGATCGTTTCTCAAAACATAAAGAATACTAACGATAACAGTTTTATTCTGATGGGAAAAGATTCGGATTTAGGTTTCGTTAAAAAATCTGGTGCAGGTTCTAAACTGGTCTTTGCTTCAGGAAAAACATTTACTGTTGCTAAATCATCAGCAACTGCTATAAGTAATCCGGCTTCAGAGACTTATACTGATGTGTTTAAAGTTGATGCAGACGGAAACCAAACCGTTTACGGAAATGCCCAAGTTAATAGACAGTTAACTGTTTCTAGCTCAGCTACTGTTAGCGGCATTATTAATGCAAACGGCGGTATTATTGTTCCTACTACCAAGTATGTGCAAATTGCCGATGCTCCTACACAGAATAACCAAGCCACCAACAAAAAATATGTTGATGACAAGGTTGCTTCTGCTATTAGTAATGCTGGCGACACGTATCTTCCATTAGCGGGTGGTACTGTAACTGGTAACCTTGACGTAACTGGCACCAGATTAAAAACCTGGCAGTTAGAAGTTGATGGAAAAAGTACTTTAAGAGGCGGGTTAGATGTTAGTAGCAGTCTTAAAGTTTCTAGTGGAAACTTAGTCGCCGCTGACACAACCAACGCTGGTGGTCTTTTTGCTAAAAACGGTAATGTTTACTGCGATGCCGGTTCAGCTGGTACAAACTCTAACTACTGGTTCCGCGATTCAGCTGGTAACACCAGAGGCGTTATCTGGTCTAACGGTCAAAATGGTGACATGATTATCCGTAACCAAAGTGGTCGAGAGCTTGTATTCAGAAATGATGGATATCTGCAATTAGCCCACTTAGCACCAGGAAACACAGATACTGGGAACACTGTAAATGGAATACGTTTACAGCGCGGTGATACGGTTTTCGATAGCTTTAACTCATGGCAGTCGGGTCAATATGTTCGCGCTGGTTGGCACTTCTATAACGCCTCTGGAGTTGACCAGTGGTTAGCACTTACAGATACTGGGGTAAAAATCTGGGGTAGTGCTGCTAATCTACGCGTTGAAGGTGTTGGTAATTTCTGGGACGTTGAAATTCGTTCTGACCGTCGTGTGAAATCAAATATTGCTAAGATTGATAACGCTCTTGATAAAGTGTCGAAGTTATCTGGTAATGTTTATGATTTACAGCTTCCAAATGGTGATACTAAACCATCGGCTGGCCTTATCGCACAAGAAGTGCAGGAAGTTCTTCCTGAAGCAGTTACAACTGATAACGATAAAGATGCATTACTTCGCTTAAACTATAATGCAGTAATTGCGTTATTAGTCGAATCTGTTAAAGAGCTTAAAGCAGAAATTGAAGAACTTAAATCTAAATAA

Genome Context

Tertiary structure

PDB ID

448b6b138cc80a5291fd96cc19ab7e127c869b4f04b150eab59a3cf957960775

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4980

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence