Protein

View in Explore

Genbank accession

WAV88278.1 [GenBank]

Protein name

colanic acid biosynthesis protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MEIQMARDVYADIGMPSTPFLRLDRFAALVDGKIYIGVKDTDPLNPANQTQVFVEDEDGTLTPVPQPIRTNVSGYPVWNGQVVKLITKIESSMKVLDRNDVQQFYFGNLFKYDPVQMWNLLTSPTGWEYVGTTYGTVKESIQGWLTPFQFVGKAPFTSVAAAIQTMFDTAQAQKLAVNAVGWTGTLDGNVTATDILIMGGTWKGTADVFLDNAVLKGATVNNLRVRFWGGDVRIRDCLFDGKPTASKVGSIVLQANPKTGTIEVTECEFKNGLYGILQQGTGEAVTRGVYRNLSFYKMDGDGIELNVVQKHYDEGCLIDGIQLDTIGSANPSWGIGIGIAGGGPYGWDIPDSQYAKNVTITNVSAVRCRQCIHLEVARDCTVTNVDVNPDMGYGVGSGLTVGGVVCYGSKRITIDGVSGEPVATGTTDVHSLRMVMLEWGVTAGAPSNPCFDMTVRNVHTKQGRVYAGVAAGNGFENRMVFENIDCYTLSLFGVASLLEMSNISCRAFDAVGDDSSGGTTSDGFVTRGLSRLRMINVNAIDVNGYGDQAWSKCSYSDIESIGSNVIATPYPPQGIAGGIGAIMTNSNRTYINKGSSGAWDGNAFPTGKEFMAGDLIVREDGKIFTVTASGAYIPATDNFKIAATAVGDKKLICNVTPIANETSRPWLFGNPLSPGTRILIPGAGAGGATLSTRITRGPYQTPPSNSTAPVTIDIADAIVTATPAGTQLAAAKPIQFRTPA

Physico‐chemical properties

protein length:	740 AA
molecular weight:	78845,34230 Da
isoelectric point:	5,12542
aromaticity:	0,08514
hydropathy:	-0,04892

Domains

Domains [InterPro]

IPR036730
ATT
8–114

IPR036730 DC_0354 IPR023882 DC_0045

IPR036730
ATT
12–112

IPR036730 IPR011050

IPR009093
ATT
13–115

IPR009093

WAV88278.1

1 740

Architecture

ATT

STR

RBD

ATT 8-115 | ATT 128-186 | STR 187-484 | RBD 485-740

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR036730	ATT	IPR036730	8	114	Merged direct domain	Phage P22 tailspike-like, N-terminal domain superfamily	N-terminal	Low	Positional only	43 proteins / 43 hits
IPR036730	ATT	IPR036730	12	112	Merged direct domain	Phage P22 tailspike-like, N-terminal domain superfamily	N-terminal	Low	Positional only	43 proteins / 43 hits
IPR009093	ATT	DC_0597	13	115	InterPro cluster	Bacteriophage P22 tailspike, N-terminal	N-terminal	Medium	Text match	110 proteins / 110 hits
DC_0354	ATT	DC_0354	128	186	Novel HMM	DC_0354	N-terminal	Low	Positional only	37 proteins / 37 hits
IPR011050	STR	IPR011050	160	484	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR023882	RBD	DC_0588	218	420	InterPro cluster	Colanic acid biosynthesis WcaM	C-terminal	Low	Positional only	146 proteins / 146 hits
DC_0045	RBD	DC_0045	437	740	Novel HMM	DC_0045	C-terminal	Low	Positional only	142 proteins / 142 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WAV88278.1

1 740

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	156	156	0,9917
Central domain	157	564	409	0,9945
C-terminal	565	740	175	0,9367

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-156

Central
157-564

C-terminal
565-740

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Phage ST231 [NCBI]	3003727	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Enterobacteriaceae bacterium [NCBI]	1849603	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WAV88278.1 [NCBI]

Genbank nucleotide accession

OP921041 [NCBI]

CDS location

range 21651 -> 23873
strand +

CDS

ATGGAGATCCAAATGGCCCGCGACGTATACGCTGATATTGGTATGCCTTCGACGCCTTTCCTCCGTCTGGACCGTTTCGCGGCCCTGGTGGATGGGAAAATCTATATCGGCGTGAAGGACACCGACCCATTGAACCCCGCCAACCAGACCCAGGTCTTTGTCGAGGACGAGGACGGAACGCTGACGCCAGTCCCGCAGCCGATCAGGACCAACGTCTCCGGCTATCCGGTCTGGAACGGTCAAGTAGTCAAACTGATCACCAAGATCGAATCGTCCATGAAGGTTTTAGACCGGAACGACGTCCAGCAATTCTACTTCGGGAACCTGTTCAAATATGATCCGGTCCAGATGTGGAACCTTCTCACCTCGCCGACTGGGTGGGAATATGTCGGGACGACCTACGGGACCGTGAAGGAGTCGATCCAGGGCTGGCTGACGCCTTTCCAGTTCGTGGGTAAAGCGCCATTCACCAGCGTAGCCGCAGCCATTCAAACGATGTTTGACACGGCCCAGGCGCAGAAACTCGCGGTTAATGCCGTGGGCTGGACCGGGACCCTGGACGGCAACGTGACCGCGACCGATATCCTGATCATGGGCGGGACCTGGAAGGGGACGGCAGACGTTTTCCTGGATAATGCAGTCCTGAAAGGCGCGACCGTGAATAACTTACGCGTTCGCTTCTGGGGCGGCGACGTTCGAATCCGTGATTGCCTGTTTGACGGCAAGCCTACGGCCTCCAAAGTGGGATCGATCGTTCTCCAGGCCAACCCGAAAACCGGGACGATCGAGGTCACGGAATGCGAGTTCAAAAATGGCCTTTACGGCATCTTGCAGCAGGGGACCGGGGAAGCCGTTACGCGTGGCGTTTATCGTAACCTTTCGTTCTACAAAATGGACGGCGACGGGATCGAGCTTAACGTGGTCCAGAAGCACTACGATGAAGGCTGTTTGATCGATGGGATCCAACTGGACACTATCGGATCTGCTAACCCGTCGTGGGGCATCGGGATCGGTATCGCTGGCGGTGGCCCGTATGGCTGGGACATCCCGGACAGCCAATACGCGAAGAACGTCACGATCACCAACGTGTCCGCCGTTCGATGCCGCCAGTGTATTCACCTGGAGGTCGCCCGCGACTGTACTGTGACCAACGTCGATGTAAACCCGGATATGGGCTACGGCGTCGGCTCCGGCCTGACCGTGGGGGGAGTGGTCTGTTACGGCTCCAAACGCATCACGATCGACGGCGTGAGCGGCGAGCCAGTGGCTACCGGGACGACCGACGTCCACTCTCTCCGCATGGTTATGCTGGAGTGGGGCGTGACCGCTGGCGCACCGTCTAACCCTTGCTTTGATATGACCGTCCGCAACGTTCACACCAAACAGGGCCGCGTCTACGCTGGCGTGGCGGCGGGGAATGGCTTCGAAAACCGCATGGTGTTCGAAAATATCGACTGTTACACGCTCTCTCTATTCGGCGTGGCGTCCCTGCTGGAAATGTCGAATATCTCTTGTCGCGCATTCGACGCGGTGGGCGACGACTCAAGCGGCGGGACCACTTCGGACGGCTTCGTGACGCGTGGCCTCTCTCGTCTGCGAATGATCAACGTGAACGCGATCGACGTGAACGGCTACGGCGATCAGGCGTGGAGCAAATGTTCTTATTCCGACATCGAGAGCATCGGATCCAACGTGATCGCCACCCCTTATCCTCCCCAGGGCATCGCGGGCGGAATCGGGGCCATCATGACGAACTCCAACCGGACCTACATCAACAAGGGATCGAGCGGGGCGTGGGATGGTAACGCGTTCCCGACCGGAAAGGAGTTTATGGCGGGCGATCTGATTGTTCGCGAGGACGGGAAGATCTTCACCGTGACGGCCTCCGGGGCGTACATCCCGGCTACGGATAATTTCAAGATCGCGGCGACCGCAGTCGGCGACAAAAAGCTGATCTGTAACGTCACCCCGATCGCGAACGAAACCTCCCGCCCGTGGCTGTTCGGGAATCCGCTCTCCCCTGGGACGCGCATCCTGATCCCTGGCGCTGGCGCTGGTGGCGCTACGCTCTCGACTCGCATCACTCGCGGGCCGTACCAGACGCCGCCGAGCAACTCCACGGCTCCGGTAACGATCGATATCGCGGACGCTATCGTGACGGCAACCCCGGCGGGGACGCAGTTAGCAGCAGCGAAGCCGATCCAATTCCGAACTCCGGCATAA

Genome Context

Tertiary structure

PDB ID

a239ccc18c392be618e2861f2a829bb46f6bb5d8dd6a5d09b82c0aced0048685

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7168

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence