Protein

View in Explore

Genbank accession

NP_052117.1 [GenBank]

Protein name

tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,90

Evidence RBPdetect2

Probability 0,96

Evidence UniProt/TrEMBL

Probability 1,00

Protein sequence

MATTIKTVMTYPLDGSTTDFNIPFEYLARKFVRVTLIGVDRKELILNQDYRFATKTTISTTRALGPADGYTLIEIRRFTSATDRLVDFTDGSILRAYDLNISQVQTLHVAEEARDLTADTIGVNNDGNLDARGRRIVNVADAQDVGDAINLGQIQRWNDSALNSANRAKQEADRATARANDANNSANASASSASSSAGSAELAKRWATSDTVVESDLESSRTYALHSMLYRNETKDSADRAAVSETNAKASEGGAANSAAAAKVSETNAKASEERAITEASKLGNMNDFAAAIESVTGNDVKMKGAVSSPGNITGGGLVSTGAASIQKGALVGEDLIVGRDITAKQDMYSQRNIAVAGVTYAQGGIEQTLATNIYNKLYRLHINSNPQHVGQRQGLHIGWNESGSGESNFITNRGAGSGGFVFRTVNAENSVETGRVDITGGGVIYANHLQVRSGARIEGNNNIVGQNLYAGMGSTMFEGNGNLTGGIWAQWGNLWSGLNNNSLFAKPPGGVQLFTARGGYYLEGRVDGTAVGFRWFQSDRRLKEDIKVVRSADDMLNIIRSYIPVSYKYKDASYTDNRGRTNTIEGKRSRAGFITQDLIRLWPEAVDVMSDGMQSPDPNQIIGGLMLLVKNLDARIQELEKDKT

Physico‐chemical properties

protein length:	645 AA
molecular weight:	69439,22840 Da
isoelectric point:	6,02365
aromaticity:	0,06667
hydropathy:	-0,40636

Domains

Domains [InterPro]

IPR005604
ATT
1–131

IPR005604 Coil IPR030392

DC_0657
STR
1–624

DC_0657

IPR030392
CHP
539–607

IPR030392 Coil

NP_052117.1

1 645

Architecture

ATT

STR

CHP

ATT 1-131 | STR 132-624 | CHP 625-644 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR005604	ATT	DC_0240	1	131	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
DC_0657	STR	DC_0657	1	624	Novel HMM	DC_0657	Central	Low	Positional only	143 proteins / 143 hits
Coil	Unmapped	-	158	185	Coils	Coil	-	-	-	-
IPR030392	CHP	DC_0088	539	644	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	539	607	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	623	643	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

NP_052117.1

1 645

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	213	213	0,8747
Central domain	214	440	228	0,6513
C-terminal	441	645	204	0,8412

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-213

Central
214-440

C-terminal
441-645

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Yersinia phage phiYeO3-12 [NCBI]	110457	Uroviricota > Caudoviricetes > Autographivirales > Studiervirinae > Teetrevirus
Host	Yersinia enterocolitica [NCBI]	630	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales
Host	Yersinia enterocolitica (type O:3) [NCBI]	34051	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Yersinia

Coding sequence (CDS)

Genbank protein accession

NP_052117.1 [NCBI]

Genbank nucleotide accession

NC_001271.1 [NCBI]

CDS location

range 33972 -> 35909
strand +

CDS

ATGGCTACAACTATTAAGACCGTGATGACTTACCCGCTGGATGGCTCCACTACGGACTTTAATATTCCGTTCGAGTATCTGGCGCGTAAGTTTGTCCGAGTGACCCTTATCGGTGTTGACCGAAAGGAACTCATCTTGAATCAAGACTATCGTTTTGCAACTAAGACCACAATCTCCACAACGAGAGCGTTGGGGCCAGCGGACGGTTATACTTTGATTGAAATCCGTCGATTCACCTCTGCTACCGATAGGCTGGTGGACTTTACCGACGGCTCAATCCTGCGGGCATATGATTTGAACATATCTCAGGTTCAGACACTTCACGTTGCTGAGGAAGCCCGTGACCTTACCGCTGATACAATTGGCGTTAACAATGATGGGAACTTGGATGCTCGTGGTCGTCGTATTGTGAACGTTGCGGATGCGCAAGATGTAGGTGACGCAATCAACTTAGGTCAAATCCAACGGTGGAACGACTCTGCGTTGAACTCTGCGAATCGAGCGAAACAGGAAGCTGACCGTGCGACCGCTCGTGCAAACGATGCGAACAACTCTGCGAACGCATCTGCAAGCTCTGCAAGCTCTTCTGCTGGGTCTGCTGAGTTGGCGAAACGCTGGGCTACCAGTGATACAGTAGTTGAGAGTGACCTTGAGTCTTCTAGAACCTACGCGCTTCACTCCATGTTATATCGTAATGAGACTAAAGACTCTGCTGACCGTGCCGCTGTTTCCGAGACCAATGCTAAGGCCTCAGAAGGGGGCGCTGCTAACTCGGCTGCTGCCGCTAAGGTATCAGAGACCAACGCTAAGGCCTCCGAGGAGAGAGCAATCACTGAGGCGAGCAAGCTGGGAAACATGAATGACTTTGCGGCTGCCATAGAGTCAGTGACAGGGAACGATGTGAAGATGAAGGGCGCTGTGTCCTCACCCGGCAATATCACAGGTGGTGGTTTAGTCTCCACAGGTGCGGCGAGTATCCAGAAAGGTGCGCTTGTTGGAGAGGACTTGATTGTTGGAAGGGATATTACCGCAAAGCAGGATATGTACTCTCAGCGAAACATTGCCGTAGCTGGGGTCACGTATGCTCAGGGGGGCATTGAGCAAACACTAGCAACCAACATTTATAATAAGCTGTACCGACTTCACATTAACAGCAATCCACAACATGTGGGACAACGGCAGGGTCTACATATTGGATGGAACGAGAGTGGTAGCGGTGAGTCAAACTTTATCACCAACCGTGGTGCTGGTTCGGGCGGATTCGTGTTCCGCACAGTCAATGCTGAGAACTCAGTAGAGACTGGTAGAGTTGATATTACCGGAGGCGGTGTTATCTACGCAAACCACCTACAGGTTCGTTCAGGTGCCCGAATTGAGGGGAACAACAATATCGTTGGTCAGAACCTCTACGCAGGAATGGGAAGTACGATGTTTGAAGGTAACGGTAATCTAACTGGTGGCATCTGGGCGCAGTGGGGTAACTTATGGAGCGGGCTAAATAACAACTCACTCTTCGCCAAACCACCCGGCGGTGTTCAGTTATTTACCGCAAGGGGCGGTTATTATCTTGAAGGTAGGGTTGATGGTACAGCCGTTGGTTTCCGCTGGTTCCAGTCTGACAGAAGGCTGAAAGAAGACATTAAGGTTGTTCGCTCTGCTGACGACATGTTGAACATCATTCGGTCGTACATCCCGGTGTCCTACAAATATAAGGACGCATCCTATACAGATAACAGGGGTAGAACAAACACCATTGAAGGTAAGCGGTCACGGGCTGGCTTCATCACACAGGATTTAATACGCTTGTGGCCCGAGGCTGTGGACGTAATGTCAGATGGAATGCAGTCCCCTGACCCGAACCAGATTATTGGTGGACTCATGTTACTCGTTAAGAACCTAGATGCTCGCATTCAGGAGTTGGAGAAGGACAAGACTTAG

Genome Context

Tertiary structure

PDB ID

237c0c8d6d1fc671fe1d6b4fc132154cf7b8044ec87216cbfb35e32c9c2f3c0d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6502

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence