Protein

View in Explore

Genbank accession

XPN63007.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,88

Evidence RBPdetect2

Probability 0,92

Protein sequence

MPHVVVTRDAAVVGVSTVDGQAGAVDLTGKYLQKTDAAATYQTKAEGASKDFVLDSIQPIMSGALFRADPWVVNDTPFRSTGANGVESVDMMKVTPDNSIKIGSYASSVQGVEIHSAGRLQVVDQNDSGVETKYPVYSKRYRPEIEDLPFAAIGSYVKDSKGRTVGVTRTGINSDIKQLTQKVTFTQPVTVPDAVGDYDAVTLRQLRNSGGGSGGPTMSGISNFGIGDFHLRDSRAFIPAFEVVSDGQLLNRADYPDLWAYAQLLSPIEDSLWLSDKFQRGRYSKGDGSTTFRVPDRNGVQEGSIRALYGRGDGGSSTTNGAIFDSAAPNITGGFEIVTNTTVLENADLEGAIFGARKGYKYAQLNTIELPSSGDIYPKQMRIDASRSSPIYGASYDEIMGRNFVGVWTIRAHGGFTAANTSWSVINSDADKPSSGTSVSGGSILSEYKIGTEVEGYASFRMVGTIGATYAARVTVFNKSSGANETFDFGSDGNLNIPGSLRTNEGDVIAKSQLISQGGRIVLIGNSNQSQSFVEFKSNNGYTVNSRVYSERDGELTISTSTAGANQKYFQFLKDGSATSSGGWIHSSDMRIKENIKPIENPLEKMKNIKGVSWKLRNGGKIGFGFIAQDVEVDFPDAVSISGDMEMEDGSVVKGVRSVDTYGVSAALHHEAILELMKQIEDLKKEIAELKSGK

Physico‐chemical properties

protein length:	694 AA
molecular weight:	74411,96380 Da
isoelectric point:	5,39382
aromaticity:	0,08357
hydropathy:	-0,32579

Domains

Domains [InterPro]

DC_1514
STR
8–328

DC_1514 DC_1985

IPR030392
CHP
588–687

IPR030392

IPR030392
CHP
588–639

IPR030392 Coil

XPN63007.1

1 694

Architecture

STR

RBD

STR 8-328 | RBD 430-694

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1514	STR	DC_1514	8	328	Novel HMM	DC_1514	Central	Low	Positional only	115 proteins / 115 hits
DC_1985	RBD	DC_1985	430	694	Novel HMM	DC_1985	C-terminal	Low	Positional only	107 proteins / 107 hits
IPR030392	CHP	DC_0088	588	687	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	588	639	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	666	693	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XPN63007.1

1 694

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	112	112	0,5366
Central domain	113	311	200	0,2569
C-terminal	312	694	382	0,9054

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-112

Central
113-311

C-terminal
312-694

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage vB_EcoM_PE006 [NCBI]	3388329	Viruses >
Host	Escherichia sp. [NCBI]	1884818	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XPN63007.1 [NCBI]

Genbank nucleotide accession

PQ812250.1 [NCBI]

CDS location

range 18855 -> 20939
strand +

CDS

ATGCCTCATGTAGTTGTAACCAGAGATGCGGCTGTTGTCGGTGTTTCTACTGTAGATGGACAGGCTGGTGCTGTTGACCTTACTGGAAAGTATTTACAGAAAACCGATGCGGCTGCTACATACCAAACTAAAGCAGAAGGTGCATCTAAAGATTTTGTACTGGATTCAATTCAACCTATTATGTCTGGTGCTTTATTCAGAGCAGACCCTTGGGTTGTTAACGACACCCCATTCCGATCTACTGGAGCTAACGGTGTAGAATCAGTTGATATGATGAAAGTAACCCCTGATAACTCAATCAAGATTGGTAGTTATGCCTCTTCAGTTCAAGGTGTAGAGATTCATTCTGCTGGTCGTCTTCAGGTTGTTGACCAGAATGATTCTGGGGTAGAAACTAAGTATCCGGTTTATTCTAAACGTTATCGTCCTGAGATTGAGGATTTGCCTTTTGCTGCAATTGGTTCTTATGTTAAAGATTCTAAGGGTCGTACTGTTGGGGTTACTCGTACAGGGATTAACTCTGATATCAAACAACTTACCCAGAAGGTAACTTTCACTCAACCAGTTACCGTTCCTGATGCAGTTGGGGATTATGATGCAGTTACTTTGAGACAGCTTCGTAATAGTGGTGGCGGTTCTGGTGGTCCTACAATGAGTGGTATATCTAACTTCGGTATTGGTGATTTCCACTTACGTGACAGTCGAGCTTTTATTCCAGCTTTTGAAGTAGTGTCTGACGGACAGCTTTTGAACCGTGCTGACTATCCAGACCTTTGGGCATACGCTCAATTGCTGTCTCCTATTGAAGACTCTCTGTGGTTGTCTGATAAATTTCAACGTGGCAGATACTCAAAAGGTGATGGTTCTACTACATTTCGTGTTCCGGATAGGAATGGTGTTCAGGAAGGGTCTATTCGGGCTTTATATGGTAGAGGTGATGGTGGCTCTTCTACTACTAATGGAGCTATCTTTGATTCAGCTGCCCCTAACATAACAGGCGGTTTTGAAATCGTAACAAACACTACCGTACTTGAGAATGCTGATCTTGAAGGGGCAATATTTGGTGCGCGGAAAGGGTACAAATATGCCCAATTGAATACTATTGAACTTCCTTCTTCCGGTGATATATATCCCAAACAGATGCGGATTGACGCGTCACGTTCAAGCCCTATCTACGGGGCGTCCTATGACGAGATTATGGGTCGTAACTTTGTAGGTGTTTGGACTATTCGTGCTCATGGTGGATTCACAGCAGCTAACACTTCTTGGTCTGTTATTAACAGCGATGCAGATAAACCTAGCAGCGGAACTTCTGTAAGTGGTGGGTCAATTCTCTCCGAGTATAAAATAGGAACTGAAGTTGAAGGTTATGCGTCTTTTAGGATGGTGGGAACTATCGGTGCTACTTATGCTGCTCGTGTAACCGTTTTTAATAAGTCTTCAGGAGCCAACGAAACCTTCGATTTTGGAAGTGATGGAAACTTAAACATTCCGGGAAGTTTGCGTACTAACGAAGGTGACGTCATCGCTAAGAGTCAACTGATATCTCAAGGAGGTCGGATAGTTCTTATAGGTAATAGTAATCAAAGCCAATCTTTTGTTGAATTTAAGAGCAACAATGGTTATACTGTGAATTCAAGAGTTTATTCTGAGCGTGATGGCGAACTCACCATATCAACATCTACAGCTGGAGCTAATCAGAAATATTTTCAATTTCTTAAGGATGGTAGTGCTACAAGCTCTGGTGGCTGGATCCACTCTTCTGATATGAGAATTAAAGAGAATATTAAACCAATAGAAAACCCTCTGGAAAAGATGAAAAACATCAAAGGTGTTTCTTGGAAGCTTAGAAACGGGGGTAAGATTGGTTTTGGTTTCATAGCTCAAGATGTTGAAGTAGACTTCCCTGATGCGGTATCTATTTCTGGTGATATGGAGATGGAAGATGGGTCTGTAGTTAAGGGTGTAAGATCGGTTGATACTTATGGTGTTTCCGCCGCTTTACACCACGAAGCTATTCTTGAACTTATGAAACAGATCGAAGACCTTAAGAAAGAGATAGCAGAACTTAAATCTGGTAAATAA

Genome Context

Tertiary structure

PDB ID

d98e456d6b55e9c96b177efd58ed462c57dc8f808acd88c401ec38a6c191d330

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6525

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence