Protein

View in Explore

Genbank accession

QKN86330.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,85

Protein sequence

MTERVNDKDIDFNLIFASAAPSVRELEEAQYLKGWSFLGDEIPPEFEDFDSVMRLQDRKIQILKQASDGVDDKIAAVSQKVDDGIDGVNQKVDEEIAALDKKIEKSGGGYVTQVMWHSTRKHLPAGCLLSDGQEVDRATWPSLFEEIEAGRVPVVPEADWLANPKLRGSYTLGDGVNTFRVPDYNGRSVGSLGRIFLGGDGQNAGLEGQIQESANKRHNHAITDNGHSHGVNDAGHSHEKSAWVANPAGGGQIYRDPEVWITTNAADKVEVHYKTGVSTSGISLQESESGITLAEDGEADARPSNVAGCYIIRGAGEKMNEGSVDALQLATLVNQLAAKVASLEEQGNAGYVGKVDWHPLRESVPHGRIPADGQLLSRELYPALWEAVRDRRVPVTTEELWNSDGKRRGCYTEGDGSTNFRVPDYNGKTSGSLGAGFLRGDGLNSLSESGMIQGDAIRNIKGYAGAVANYKALASSGALSLDADQGPMYVNGANTGVWAALRNMSIDVSKAVPTAADNHPVNVTGCFVIQYAGAVINSGYVDAVKAIEQISKLDSRVGALESKPQLFEIMYPYGTPDTPATLGTNQRLVFHPPAKFNGRTIQCKLQLRYNGFWHDWSTFIYDSNGSASSSTGAMAGVVNNGGSATDTKPTYIVIQTSKDALGTESRFDGNIAGLSGWLTEAHYRVLIWSVD

Physico‐chemical properties

protein length:	691 AA
molecular weight:	74386,67470 Da
isoelectric point:	5,09189
aromaticity:	0,07670
hydropathy:	-0,39247

Domains

Domains [InterPro]

SSF88874
STR
121–313

SSF88874 Coil SSF88874 DC_0781

DC_2049
STR
199–472

DC_2049

QKN86330.1

1 691

Architecture

STR

RBD

STR 121-533 | RBD 534-691

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
SSF88874	STR	SSF88874	121	313	Merged direct domain	SSF88874	Central	Low	Positional only	109 proteins / 109 hits
DC_2049	STR	DC_2049	199	472	Novel HMM	DC_2049	Central	Low	Positional only	66 proteins / 66 hits
Coil	Unmapped	-	326	346	Coils	Coil	-	-	-	-
SSF88874	STR	SSF88874	351	533	Merged direct domain	SSF88874	Central	Low	Positional only	109 proteins / 109 hits
DC_0781	RBD	DC_0781	534	691	Novel HMM	DC_0781	C-terminal	Low	Positional only	14 proteins / 14 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QKN86330.1

1 691

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	562	562	0,6467
Central domain	563	680	119	0,0341
C-terminal	681	691	10	0,9936

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-562

Central
563-680

C-terminal
681-691

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Yersinia phage vB_YenM_12 [NCBI]	2736208	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Yersinia enterocolitica [NCBI]	630	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QKN86330.1 [NCBI]

Genbank nucleotide accession

MT366931.1 [NCBI]

CDS location

range 38920 -> 40995
strand +

CDS

GTGACAGAAAGAGTTAACGACAAAGACATAGATTTCAATCTGATTTTCGCGAGTGCAGCGCCAAGTGTTCGCGAACTTGAGGAGGCGCAATATCTGAAAGGGTGGTCTTTCTTGGGGGACGAGATCCCCCCTGAATTTGAGGATTTCGATTCTGTGATGCGCCTGCAAGATAGAAAGATCCAGATTCTAAAACAGGCGTCCGATGGCGTAGATGATAAAATCGCAGCCGTAAGCCAAAAGGTTGACGACGGAATAGATGGCGTAAACCAAAAGGTTGACGAGGAGATCGCGGCGCTCGACAAGAAGATAGAGAAATCAGGCGGCGGCTACGTGACGCAAGTTATGTGGCATTCAACACGGAAGCACTTACCGGCTGGTTGCTTACTGTCTGACGGGCAAGAGGTAGACCGTGCAACTTGGCCTAGCCTGTTCGAGGAAATAGAAGCTGGACGCGTTCCGGTTGTTCCGGAGGCTGATTGGTTGGCTAACCCGAAATTACGCGGTAGCTACACGTTAGGCGACGGGGTTAATACTTTCCGTGTTCCGGATTATAACGGGCGCTCGGTTGGCTCACTTGGTCGAATCTTCTTGGGCGGTGACGGTCAAAATGCAGGGCTTGAGGGTCAGATCCAAGAGTCGGCAAATAAGCGACACAATCACGCGATAACCGACAACGGACACAGCCACGGAGTGAATGACGCAGGTCATAGTCATGAAAAATCTGCTTGGGTAGCCAATCCAGCTGGCGGCGGTCAAATATACAGAGATCCGGAAGTATGGATTACAACCAACGCAGCGGATAAAGTGGAGGTTCATTACAAAACCGGAGTATCCACAAGCGGAATCTCATTGCAGGAAAGCGAAAGCGGCATAACGTTAGCGGAAGATGGAGAAGCCGACGCGCGTCCGTCAAACGTGGCAGGCTGCTACATTATTCGCGGCGCTGGCGAGAAAATGAATGAGGGTTCAGTGGATGCTCTGCAACTGGCAACTCTTGTAAACCAACTAGCCGCTAAGGTGGCAAGTCTGGAGGAGCAAGGAAACGCCGGTTATGTTGGAAAGGTTGATTGGCACCCATTACGCGAAAGCGTGCCGCATGGCAGAATTCCGGCAGACGGGCAACTGTTGAGCCGCGAACTGTATCCGGCATTGTGGGAGGCTGTGAGGGATAGGCGCGTACCGGTAACAACTGAGGAGCTATGGAATTCTGACGGAAAACGACGTGGTTGTTATACCGAGGGTGACGGCTCCACAAACTTCCGCGTTCCGGACTATAACGGCAAAACTTCCGGATCTCTTGGCGCTGGGTTCTTGCGCGGTGACGGGCTGAACTCGCTTAGTGAAAGTGGCATGATTCAGGGCGACGCAATCAGAAACATTAAAGGTTATGCTGGCGCTGTTGCGAACTATAAAGCTCTCGCGAGTAGTGGGGCATTGTCTCTTGATGCTGATCAAGGCCCAATGTATGTAAATGGGGCGAATACTGGAGTTTGGGCAGCACTGCGAAATATGTCGATTGATGTATCCAAGGCTGTTCCAACGGCGGCAGACAACCATCCGGTAAACGTGACAGGTTGCTTTGTCATCCAGTATGCGGGTGCTGTAATTAATTCCGGTTACGTGGATGCCGTGAAAGCGATTGAGCAGATATCAAAACTGGATAGCAGGGTTGGCGCTCTTGAGTCTAAGCCGCAACTGTTTGAGATTATGTACCCGTATGGCACCCCTGATACTCCGGCGACACTTGGTACAAACCAGAGATTGGTTTTCCATCCACCTGCCAAATTTAACGGGCGCACAATACAATGCAAATTGCAATTGAGGTACAACGGATTTTGGCATGACTGGAGCACTTTTATTTATGATTCAAACGGTAGTGCGTCTTCATCTACCGGAGCAATGGCTGGTGTTGTGAATAATGGCGGCTCAGCAACAGACACAAAACCTACTTACATCGTGATTCAAACATCAAAGGACGCGCTAGGAACGGAGTCAAGATTTGATGGTAATATTGCTGGATTAAGCGGCTGGCTAACCGAGGCGCACTATAGGGTGCTAATTTGGAGTGTAGATTAA

Genome Context

Tertiary structure

PDB ID

e4a01c5641c3f32ff8a2ab974da83f2361c339348b4a5da2579b5b0d19c7d407

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7127

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Sequences of Yersinia phage genomes	Hammerl,J.A. and Hertwig,S.	2018-05-10	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature