Protein

View in Explore

Genbank accession

AGX01836.1 [GenBank]

Protein name

putative EPS-depolymerase

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,90

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MSTLQATAQQTPLQQLQELVDSGNKLIMLQNGSPVEFPLSLLTQVMGDAVTLEKLSAVDSTAMFGSVQSFADLRKLKPTANNVRVNLRGWNNGSDLGGGQFIGRIGVAKASMKKDDGGVIATSGTDWYWERAIGDINTLDVTHFGAVADGVTDSLPAVLAMFKWSQASGGFQAIQFPAGKFFLSQFEYLAEIARFRLNGTATNHFGYFNATTLTSDSNENVLFSLNARWVEISGFVFEGRTDIDGNKKGFYKNIIAGGQYTRISMMRWSKVGGTCVDMLDTLDSKIDQWYASGCTGDVIKGYWSGRAAGVWDHMTAVELSNFNVQNCRGGKVLNLPRCTQSFIWNGWIEHSDNPGDLSNGQWIINGLNIEDCKMSPLKLTFARIINFQLGLQSGSSVSYDVQDGDVEWLSQWERGHVDIDNHGIYIDGTIDAAIVGSRNKLSNSSDKAKWFCLGRFFTPSEGDQIDINMVGTGNFLSISTTMADIDDTRQGGGNTLIRYQAKKGAAGLSLMPMGSSPIKAVAYTSTSAGNITLYVQLKPYTRNVIPIITATGLTHFEAGVSVYWRPDRKALTDEEMAAIVDVKPVVEQWSIGQLAGIGATQEGYLLVKSKVENGHLAVKVNGKVQYLQLKASPQ

Physico‐chemical properties

protein length:	634 AA
molecular weight:	69084,30990 Da
isoelectric point:	5,84409
aromaticity:	0,09464
hydropathy:	-0,15442

Domains

Domains [InterPro]

DC_0813
ATT
1–65

DC_0813 IPR059934 IPR011050

IPR012334
STR
138–506

IPR012334

DC_0716
STR
168–633

DC_0716

AGX01836.1

1 634

Architecture

ATT

RBD

STR

ATT 1-65 | RBD 66-132 | STR 137-633 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0813	ATT	DC_0813	1	65	Novel HMM	DC_0813	N-terminal	Low	Positional only	10 proteins / 10 hits
IPR059934	RBD	DC_0541	65	132	InterPro cluster	Phage tail protein-like, small four-stranded beta-sheet domain	C-terminal	Low	Positional only	683 proteins / 690 hits
IPR011050	STR	IPR011050	137	324	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	138	506	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
DC_0716	STR	DC_0716	168	633	Novel HMM	DC_0716	Central	Low	Positional only	81 proteins / 81 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AGX01836.1

1 634

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	155	155	0,9909
Central domain	156	430	276	0,9843
C-terminal	431	634	203	0,9769

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-155

Central
156-430

C-terminal
431-634

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Erwinia phage PhiEaH1 [NCBI]	1401669	Uroviricota > Caudoviricetes > Chimalliviridae > Iapetusvirus EaH1 >
Host	Erwinia amylovora [NCBI]	552	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

AGX01836.1 [NCBI]

Genbank nucleotide accession

KF623294 [NCBI]

CDS location

range 92611 -> 94515
strand +

CDS

ATGAGTACCTTACAAGCCACTGCGCAGCAAACCCCACTTCAACAGCTCCAGGAATTAGTAGACTCCGGGAACAAATTGATAATGCTGCAAAATGGTTCACCAGTTGAATTCCCCCTGAGCCTTTTGACCCAGGTAATGGGGGATGCGGTGACACTGGAGAAGTTGTCAGCGGTCGACAGCACTGCCATGTTTGGGAGTGTGCAGTCCTTTGCTGATTTACGTAAACTCAAACCGACAGCAAACAATGTCCGGGTTAACCTGCGTGGTTGGAACAACGGTTCCGACCTCGGAGGCGGTCAGTTCATTGGGCGTATCGGTGTGGCGAAAGCGAGCATGAAGAAAGACGATGGCGGTGTGATTGCCACGTCTGGTACCGACTGGTATTGGGAGCGTGCTATCGGGGACATCAACACGCTGGACGTGACGCACTTCGGTGCGGTAGCTGACGGCGTGACAGACAGCCTCCCGGCGGTACTGGCGATGTTTAAGTGGTCACAGGCGAGTGGCGGGTTCCAGGCGATTCAATTCCCGGCAGGGAAGTTCTTCCTGTCGCAGTTTGAATACCTGGCTGAGATTGCCCGCTTCCGTCTGAACGGCACAGCAACCAATCACTTCGGTTACTTCAATGCAACTACCCTGACGTCGGACTCGAACGAGAACGTCCTGTTCAGTCTGAACGCACGTTGGGTCGAGATTTCCGGATTTGTCTTTGAAGGTCGCACGGACATTGACGGGAACAAGAAGGGGTTCTACAAAAACATCATTGCCGGGGGACAGTACACCCGTATCAGCATGATGCGTTGGTCCAAGGTGGGCGGGACTTGCGTGGATATGCTGGATACCCTTGACTCGAAGATTGACCAGTGGTACGCCAGTGGTTGTACTGGCGATGTCATCAAAGGGTATTGGTCGGGGCGTGCCGCGGGCGTATGGGACCACATGACGGCGGTGGAGCTGAGTAACTTTAACGTCCAGAACTGTCGGGGCGGAAAGGTACTGAACTTGCCGCGTTGCACGCAATCCTTCATCTGGAACGGCTGGATTGAGCACAGTGACAACCCAGGCGACCTGTCGAACGGCCAGTGGATTATCAACGGACTGAACATCGAAGACTGTAAAATGTCTCCGTTGAAACTGACTTTTGCACGCATCATCAATTTCCAGCTGGGTCTGCAATCCGGTTCGAGCGTCTCTTACGACGTACAGGACGGGGACGTAGAATGGCTGAGTCAGTGGGAGCGTGGGCATGTCGACATTGACAACCACGGTATCTACATTGACGGGACGATTGACGCTGCGATTGTAGGGTCGCGCAACAAACTCAGTAACTCTTCTGACAAAGCGAAATGGTTCTGTCTGGGACGGTTCTTCACGCCTTCTGAAGGGGACCAAATCGACATCAACATGGTGGGGACGGGGAACTTCCTGTCCATCTCTACCACCATGGCAGATATCGACGACACCCGACAGGGCGGAGGTAACACCCTGATTCGCTACCAGGCGAAGAAAGGGGCGGCAGGGTTGTCGTTAATGCCGATGGGCTCAAGTCCAATCAAAGCAGTAGCGTACACCTCAACCAGCGCAGGGAACATCACGCTTTACGTGCAGCTGAAGCCGTACACCCGTAACGTGATTCCTATCATCACGGCGACCGGGTTAACGCACTTCGAAGCCGGGGTGAGTGTATACTGGCGTCCAGACCGTAAAGCCCTGACCGATGAGGAGATGGCGGCAATTGTCGACGTTAAACCTGTGGTCGAGCAGTGGTCGATTGGTCAGCTCGCGGGTATCGGTGCCACGCAGGAGGGATACCTGTTAGTGAAGTCTAAAGTGGAGAACGGACACCTCGCCGTCAAGGTTAACGGTAAAGTGCAGTACCTCCAGTTGAAAGCTTCACCGCAGTAA

Genome Context

Tertiary structure

PDB ID

de8c6ec21e342b40bd0c41d33ccf3da5dce37b21d6f77aeb462a72d7c8db1872

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6524

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence