Protein

View in Explore

Genbank accession

YP_009784224.1 [GenBank]

Protein name

colanic acid degradation

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MARDVYADIGMPSTPFLRLDRFAALVNGKIYVGVKDTDPLNPANQTQVFVEDEDGTLTPIPQPVRTNVSGYPVWNGQVVKLITKIESSMKVMDANDVQQFYFGNLFKYDPVQMWNLLTSPTGWEYVGTNYGVLKESIQGWITPFQFVGKAPFTSVSAAIQTMFDTAQAQKLAVWAIGWEGTLDGNVTATDILIMGGTWKGTPDFFMDNSTLKGATIKNARIRVWGGDVRIRDCLFDGKPTTSKVASVMMQALPKNATVEVTESEFRNGLYGILQQGTGELVTRGLYRNLSFYDMGGDGIELNVVQRHYDDGCVIENIYLENIDSTGQAPINPSNWGIGIGVAGQSPYGIDTPDENFAKNITIRNVTGVGVRQLVHFEMVRDSVIENINGDPDQNVSNGSGLTLATVLCYGSRRVSIDGVRGEPIVTSGTLASDVRVVMLEWGTNAGVGARGPCQDMTVRNVYSKTGRFYAGVGTEKAGATNRCRFSNINVAKFSVFGVATELDLNDISGDIFDAIGDDSSGGTPSNGYIAGGRTVLRMNNVNFGAYPDQGWSRCAYSQIDCVNSNVFARPYPRSGTNGGVGAEMQPSNHTYLIPTPDQMDGVGIWDGNAFPTGREFMEGDLLVRNDGKIFAVETSGAYLPAVAELQIKATAAGQTYLAQNYAMAGNKSDQVWFYKTPLTQGTRVTIPGAGAGGAPLNTVITRAPYSTNPSNPTAEIRIDIADAIVTATVAGVQLAATKPISFRTPA

Physico‐chemical properties

protein length:	746 AA
molecular weight:	80358,51280 Da
isoelectric point:	4,96241
aromaticity:	0,09115
hydropathy:	-0,16381

Domains

Domains [InterPro]

IPR036730
ATT
4–110

IPR036730 DC_0354 IPR023882 DC_0045

IPR036730
ATT
4–100

IPR036730 IPR011050

IPR036730
ATT
8–108

IPR036730

IPR009093
ATT
9–111

IPR009093

YP_009784224.1

1 746

Architecture

ATT

STR

RBD

ATT 4-111 | ATT 124-182 | STR 183-387 | RBD 388-745 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR036730	ATT	IPR036730	4	110	Merged direct domain	Phage P22 tailspike-like, N-terminal domain superfamily	N-terminal	Low	Positional only	43 proteins / 43 hits
IPR036730	ATT	IPR036730	4	100	Merged direct domain	Phage P22 tailspike-like, N-terminal domain superfamily	N-terminal	Low	Positional only	43 proteins / 43 hits
IPR036730	ATT	IPR036730	8	108	Merged direct domain	Phage P22 tailspike-like, N-terminal domain superfamily	N-terminal	Low	Positional only	43 proteins / 43 hits
IPR009093	ATT	DC_0597	9	111	InterPro cluster	Bacteriophage P22 tailspike, N-terminal	N-terminal	Medium	Text match	110 proteins / 110 hits
DC_0354	ATT	DC_0354	124	182	Novel HMM	DC_0354	N-terminal	Low	Positional only	37 proteins / 37 hits
IPR011050	STR	IPR011050	155	387	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR023882	RBD	DC_0588	213	430	InterPro cluster	Colanic acid biosynthesis WcaM	C-terminal	Low	Positional only	146 proteins / 146 hits
DC_0045	RBD	DC_0045	430	745	Novel HMM	DC_0045	C-terminal	Low	Positional only	142 proteins / 142 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009784224.1

1 746

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	152	152	0,9925
Central domain	153	611	460	0,9873
C-terminal	612	746	134	0,8139

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-152

Central
153-611

C-terminal
612-746

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Enterobacteria phage IME_EC2 [NCBI]	1414766	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009784224.1 [NCBI]

Genbank nucleotide accession

NC_047742 [NCBI]

CDS location

range 13993 -> 16233
strand -

CDS

ATGGCCCGCGACGTATACGCTGATATTGGTATGCCTTCGACGCCTTTCCTACGTCTGGACCGCTTCGCGGCGCTGGTCAACGGGAAGATCTACGTAGGCGTGAAAGATACCGACCCGCTGAACCCAGCGAACCAGACCCAGGTCTTTGTCGAGGACGAGGACGGAACGCTGACGCCAATCCCGCAGCCAGTACGGACCAACGTCTCCGGCTATCCGGTCTGGAACGGTCAAGTAGTCAAACTGATCACCAAGATCGAATCATCCATGAAGGTGATGGACGCGAACGACGTCCAGCAATTCTATTTCGGGAACCTGTTCAAATATGATCCGGTCCAGATGTGGAACCTTCTCACCTCGCCGACGGGCTGGGAGTACGTGGGGACGAATTACGGCGTTTTGAAAGAGTCGATTCAGGGCTGGATCACTCCTTTTCAGTTCGTCGGGAAAGCGCCATTCACCAGCGTGTCCGCAGCCATCCAGACCATGTTTGACACGGCTCAGGCCCAAAAGCTGGCGGTCTGGGCCATTGGCTGGGAGGGAACGCTGGACGGCAACGTGACCGCGACGGATATCCTCATCATGGGGGGAACGTGGAAAGGTACGCCGGACTTTTTCATGGACAATTCCACGCTGAAAGGCGCGACCATTAAAAACGCCCGTATTCGCGTATGGGGCGGCGACGTAAGGATCCGGGATTGCCTGTTTGACGGCAAGCCGACCACGAGCAAGGTCGCAAGCGTAATGATGCAAGCCCTACCGAAAAACGCGACTGTGGAAGTCACGGAGAGCGAGTTCCGCAATGGCCTTTACGGCATCTTGCAGCAGGGGACCGGGGAACTCGTCACGCGTGGCCTGTATCGTAACTTGTCGTTTTACGACATGGGCGGCGACGGGATCGAGCTTAACGTGGTGCAGCGCCACTATGACGACGGTTGCGTGATCGAAAATATCTACCTGGAGAACATCGACTCCACCGGACAGGCTCCGATCAACCCGTCCAACTGGGGGATCGGGATCGGCGTCGCTGGTCAATCTCCGTATGGTATCGACACGCCTGACGAGAACTTTGCGAAGAACATCACGATCCGCAACGTGACGGGCGTCGGCGTCCGCCAGCTTGTTCACTTCGAAATGGTCCGCGACTCCGTGATCGAGAACATCAACGGCGACCCGGATCAGAACGTGTCTAACGGCTCCGGCCTGACGCTGGCGACGGTCCTCTGTTATGGCTCGCGCCGCGTGTCGATCGATGGCGTTCGCGGGGAGCCGATCGTGACCTCCGGGACCCTGGCCTCCGACGTCCGCGTGGTTATGCTGGAGTGGGGGACTAACGCCGGAGTGGGCGCTCGTGGTCCTTGCCAGGACATGACCGTGAGGAACGTCTATTCCAAGACCGGGCGCTTTTACGCTGGCGTGGGTACGGAAAAGGCCGGAGCAACCAACCGTTGCCGATTCAGTAACATCAACGTGGCTAAATTCTCCGTTTTCGGCGTGGCTACCGAACTGGATTTAAACGATATCTCCGGCGATATCTTCGACGCGATCGGGGATGATTCCAGCGGCGGGACGCCTTCGAATGGTTATATCGCTGGCGGTCGCACCGTGTTACGCATGAATAATGTTAACTTCGGCGCGTACCCGGATCAGGGCTGGAGCCGTTGCGCATACAGCCAGATTGATTGCGTTAATTCGAACGTGTTCGCCCGTCCGTACCCTCGTTCGGGGACTAACGGCGGCGTAGGCGCTGAAATGCAGCCCTCTAACCATACTTACCTGATCCCGACTCCTGACCAGATGGACGGCGTAGGGATCTGGGATGGTAACGCGTTCCCGACCGGGCGCGAGTTCATGGAGGGCGATCTCCTGGTCCGCAACGATGGCAAGATCTTTGCCGTCGAGACGTCCGGCGCATACCTCCCGGCGGTCGCAGAATTGCAGATTAAAGCGACGGCAGCGGGCCAGACCTACCTCGCGCAAAATTACGCGATGGCTGGCAACAAGTCGGATCAGGTCTGGTTTTATAAGACCCCGCTTACGCAGGGGACCCGCGTCACGATCCCCGGAGCCGGGGCTGGCGGCGCTCCGCTTAACACGGTGATCACTCGCGCACCGTACAGCACCAACCCAAGCAACCCGACCGCAGAGATCAGGATCGACATTGCGGACGCTATCGTGACGGCAACCGTGGCGGGCGTTCAACTGGCGGCAACGAAGCCGATCTCCTTCCGAACTCCGGCATAA

Genome Context

Tertiary structure

PDB ID

8ccad70a5d9627a912d7a19754417dbec5a0d21cd3240346109881fee90b594a

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6961

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence