Protein

View in Explore

Genbank accession

YP_006987233.1 [GenBank]

Protein name

colanic acid degradation

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,90

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MSDLSVVAERYLISESSVCHASDGQLLDDIKIVVHSDDSEWYVPTLPKGTLLKSLSLSSNVDGTCTCKLVHTNGSTDLVSATHISSNISGNTAIRQLPANDSRLIRFLSFEQYGAISGGTVECSAAINACLNDARKYNLPIWSTGKYYINNIVDFSNVTASGFTLVGGASSPNSYCVLVNGSANIDNVNFEKVYLQHTNGDLKLTNFTFKKVGATAAVLSLNLTSEGSVTLQYGTFRQCNYGYLRQGDPLWGSALRFQHLKNLQFFDMNGDCIELNLGIKDRNTEVSDILVDNVNHTGKNLFWGIALGFAGKTPYGLDADDSSYMSDVSIKRVKVYGARQCLHFEKCRNIYLEDIEMYPDSTKSVNSGIDPAGIILYGSKDISIKDVKGKPDQASIKMIHTSWGVTDDAYICAERNILVRDVDVDGNIELNMSTNDVYNSYLRVYNVSCNVFAITGQASEFHVENVRCSNILLDFQPVTNTSKDQLRRHNRITATFKDIVSKDENQDCVCSIKNIAIDELTVQNCNFPFFKQSTSTITRGTPITKLDGIYHYDSEGFPNGYQFKVGDRIIDSTGKMYVVKQSGAVFSSYEKVRSAVCGQNYLVSYNMNWLSAYKTAGTRIRIPGAGENGTDLVCTVVRSSHVNNGMYRIILSDTIKTDIPDGTQILPENICKY

Physico‐chemical properties

protein length:	673 AA
molecular weight:	74296,81400 Da
isoelectric point:	5,84938
aromaticity:	0,09064
hydropathy:	-0,20921

Domains

Domains [InterPro]

DC_2249
ATT
18–238

DC_2249 IPR011050

IPR011050
STR
109–359

IPR011050 DC_0045

IPR023882
RBD
234–430

IPR023882

YP_006987233.1

1 673

Architecture

ATT

STR

RBD

ATT 18-238 | STR 239-524 | RBD 525-673

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2249	ATT	DC_2249	18	238	Novel HMM	DC_2249	N-terminal	Low	Positional only	44 proteins / 44 hits
IPR011050	STR	IPR011050	109	359	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR023882	RBD	DC_0588	234	430	InterPro cluster	Colanic acid biosynthesis WcaM	C-terminal	Low	Positional only	146 proteins / 146 hits
IPR011050	STR	IPR011050	324	524	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_0045	RBD	DC_0045	401	673	Novel HMM	DC_0045	C-terminal	Low	Positional only	142 proteins / 142 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_006987233.1

1 673

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	122	122	0,9543
Central domain	123	549	428	0,9861
C-terminal	550	673	123	0,8937

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-122

Central
123-549

C-terminal
550-673

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cronobacter phage vB_CsaM_GAP32 [NCBI]	1141136	Uroviricota > Caudoviricetes > Mimasvirus >
Host	Cronobacter sakazakii [NCBI]	28141	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_006987233.1 [NCBI]

Genbank nucleotide accession

NC_019401 [NCBI]

CDS location

range 70351 -> 72372
strand +

CDS

ATGAGTGATCTTTCAGTAGTCGCGGAACGCTATTTAATTTCCGAAAGTTCAGTATGTCATGCATCTGATGGTCAATTACTTGATGATATTAAAATAGTAGTTCACTCTGATGATAGTGAGTGGTATGTTCCAACTTTACCAAAGGGAACATTATTAAAATCATTATCACTATCATCTAATGTTGATGGAACGTGTACTTGTAAATTGGTACATACGAATGGAAGTACTGATTTGGTTAGTGCTACGCACATATCAAGTAATATCTCAGGTAATACTGCAATACGTCAACTACCAGCTAATGATTCAAGGCTAATACGGTTTTTAAGCTTTGAACAATATGGTGCTATTTCTGGTGGTACAGTTGAATGTTCTGCCGCAATAAATGCATGTTTAAATGATGCACGAAAATATAATCTCCCAATATGGAGTACTGGAAAATACTATATTAATAATATAGTCGATTTTTCAAACGTCACTGCAAGTGGATTCACATTAGTTGGTGGGGCAAGTTCACCAAATTCATATTGTGTACTTGTAAATGGTTCTGCCAATATTGATAATGTAAACTTTGAAAAAGTTTATCTTCAGCATACGAATGGTGATTTGAAGTTAACCAATTTTACATTTAAAAAAGTTGGAGCTACCGCAGCAGTACTTTCATTGAATTTAACAAGTGAAGGTTCCGTAACACTCCAATATGGAACATTTAGACAATGTAACTACGGTTATTTACGTCAAGGTGATCCATTGTGGGGAAGTGCATTACGATTCCAACACTTGAAAAATCTACAGTTCTTTGATATGAACGGAGATTGTATTGAATTAAATTTGGGCATTAAAGATAGAAATACCGAAGTTTCTGATATCCTTGTTGACAACGTTAACCATACTGGTAAAAACCTTTTTTGGGGAATTGCACTAGGATTCGCAGGTAAAACTCCTTACGGTCTTGATGCTGACGATAGTTCATATATGTCAGATGTAAGTATTAAACGTGTCAAGGTGTATGGTGCTCGCCAATGTCTTCACTTCGAAAAATGTAGAAATATATACCTAGAAGATATTGAAATGTATCCAGACAGTACTAAGAGTGTTAACTCTGGTATTGATCCTGCTGGAATTATTCTTTACGGTTCAAAAGATATATCAATAAAGGACGTGAAAGGTAAACCTGATCAAGCTTCAATCAAAATGATTCACACGTCATGGGGCGTTACTGATGATGCATATATTTGTGCTGAACGTAATATTCTTGTCCGAGACGTTGATGTTGATGGAAACATTGAGTTGAATATGAGCACTAATGATGTATATAACTCATATCTAAGAGTTTACAATGTTAGTTGTAATGTATTTGCAATAACTGGACAAGCGTCAGAATTTCATGTTGAGAATGTAAGATGTTCTAATATACTTTTGGACTTCCAACCAGTAACTAATACCAGTAAAGACCAACTCAGAAGACACAACCGTATTACTGCAACATTCAAAGATATTGTCAGTAAAGATGAAAATCAAGATTGTGTATGTAGCATTAAAAATATTGCGATTGATGAATTAACAGTTCAGAACTGTAATTTTCCATTCTTTAAGCAAAGTACTTCTACCATTACACGTGGAACACCAATAACAAAACTCGACGGTATATATCACTATGATAGTGAAGGATTCCCAAATGGATACCAGTTCAAGGTTGGTGACAGAATTATAGATAGTACTGGAAAAATGTATGTTGTCAAACAATCTGGTGCTGTTTTCAGTTCATATGAGAAGGTTCGTTCTGCTGTATGTGGTCAGAATTATCTAGTTTCATATAATATGAACTGGTTGTCAGCATATAAAACTGCTGGCACTCGTATTCGCATTCCTGGTGCTGGAGAGAATGGAACAGACTTAGTGTGTACTGTAGTAAGAAGTTCACATGTCAATAATGGGATGTATAGAATTATATTATCCGACACAATTAAAACAGATATTCCAGATGGAACTCAAATACTTCCAGAGAATATATGTAAGTACTAA

Genome Context

Tertiary structure

PDB ID

2a6765fd23d196326c3c4abec2952e22f2e2b4c524127496078e2c1a15c686df

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7221

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence