Protein

View in Explore

Genbank accession

WNA14188.1 [GenBank]

Protein name

peptidase G2

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MPKYPYRKAGSGWDRVFRNNHNQNLDDIADDIKGSYSEIAAHKNAETAHTSDQIDHGGFSLRTYVDSLYNRMKNLILNADGTNVKEVVDSRVGTDGEVFPLLKERLDREYLKLLQKIKRTVNVDDFGADPTGVNDSTEAFQRAIGTGKVRVNLSAGTYIVKGVKLPSWTYMVGQGIGVTTLKLHEDTPASEWVVTNADHANGNRNITVEGMTLDWNPDRQGGVGATGGLHSSGLTLAQVKFGIVREVESVKPGLHSFDASAPTYDISATDYTQQGCRYIWFDRCVGSGYGDDGISTHYSEYIFITNCVMTNPRGTAHEDGRANSNGIEIDDGSKNVWVIDCYTEGNVRGVEVKAHAAWPASQNVHIRGHESYRDIRAYDLRHIGHHLATEPWSETARDVTLIDCTAREPIYNDLYAGLAPKALVISAYQRVLVSDFRAIGDPTYDYKGTDIIAFQYKSRKINVNGLQMYGFATAGSDVHIYGGDQRTDDVYISNFTIHDSAPVGIGIGGGVYYVTLSNGIVHTRGGTAGITSPNNQATIIAVRAVGYTDAAVLAGQKYKVVPNNLKGGFRAAASSGSPLTDTSAIIAGSGTIIAKGERNFIAGVAGGATTEGSRNGVLYSWNSHTKGESGSSAVIASKNVVNTKEYTVALGHGGGDPSEANKKIEIDAMGGRVRATGAIESASNLQDFGEYFESIDGQKIDASYLVTLEGDKIRKADRGDKILGVVSKTAGLVLGGAAFYWNDRYLHDEFGGLIYREIYEDGRLVTVPAENPDYDPSVEYTPREERDEWHVIGLIGQVYVRIDETVAVGDSVTAVGGIATKAESDGYGTVMKIKTPYNAEKGYGVAQMIVTPQH

Physico‐chemical properties

protein length:	854 AA
molecular weight:	92394,56630 Da
isoelectric point:	5,61913
aromaticity:	0,08665
hydropathy:	-0,35761

Domains

Domains [InterPro]

DC_0125
ATT
1–200

DC_0125 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 G3DSA:2.160.10.20 G3DSA:2.40.300.10

IPR012334
STR
114–562

IPR012334 IPR021865

IPR011050
STR
118–407

IPR011050 IPR021865

IPR024535
ENZ
121–331

IPR024535 DC_0616 G3DSA:4.10.80.40

WNA14188.1

1 854

Architecture

ATT

STR

RBD

ATT 1-200 | STR 201-645 | RBD 646-850 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0125	ATT	DC_0125	1	200	Novel HMM	DC_0125	N-terminal	Low	Positional only	68 proteins / 68 hits
IPR012334	STR	IPR012334	114	562	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	118	407	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR024535	ENZ	DC_0410	121	331	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
IPR006626	Unmapped	-	203	233	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	276	298	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	299	331	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	333	354	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_0616	STR	DC_0616	350	645	Novel HMM	DC_0616	Central	Low	Positional only	58 proteins / 58 hits
IPR006626	Unmapped	-	487	509	InterPro	Parallel beta-helix repeat	-	-	-	-
G3DSA:2.160.10.20	RBD	G3DSA:2.160.10.20	563	680	Merged direct domain	G3DSA:2.160.10.20	C-terminal	Low	Positional only	6 proteins / 6 hits
IPR021865	CHP	DC_0580	632	850	InterPro cluster	Peptidase G2, IMC autoproteolytic cleavage domain	C-terminal	High	Text match	84 proteins / 84 hits
IPR021865	CHP	DC_0580	645	850	InterPro cluster	Peptidase G2, IMC autoproteolytic cleavage domain	C-terminal	High	Text match	84 proteins / 84 hits
G3DSA:2.40.300.10	RBD	G3DSA:2.40.300.10	687	848	Merged direct domain	G3DSA:2.40.300.10	C-terminal	Low	Positional only	19 proteins / 19 hits
G3DSA:4.10.80.40	RBD	G3DSA:4.10.80.40	740	778	Merged direct domain	G3DSA:4.10.80.40	C-terminal	Low	Positional only	3 proteins / 3 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WNA14188.1

1 854

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	135	135	0,9882
Central domain	136	649	515	0,9796
C-terminal	650	854	204	0,8876

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-135

Central
136-649

C-terminal
650-854

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage phi18-2 [NCBI]	3062017	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus subtilis [NCBI]	1423	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

WNA14188.1 [NCBI]

Genbank nucleotide accession

OR208547 [NCBI]

CDS location

range 17019 -> 19583
strand +

CDS

ATGCCGAAATATCCGTACAGAAAAGCGGGATCGGGATGGGATCGTGTTTTTCGTAATAACCACAACCAAAACCTCGATGATATTGCGGATGACATTAAAGGATCATATAGCGAGATTGCTGCACATAAGAACGCAGAGACCGCCCACACGTCGGATCAAATCGACCATGGCGGTTTTTCTTTGCGCACATACGTGGACAGTCTTTATAACCGCATGAAAAACCTGATTCTTAACGCGGACGGTACCAACGTAAAAGAGGTCGTAGATTCGCGCGTAGGAACTGACGGTGAAGTATTTCCGTTACTAAAAGAACGGCTTGATCGCGAATACCTTAAGCTTCTACAGAAGATCAAACGGACGGTTAACGTTGATGACTTCGGAGCAGATCCGACCGGCGTTAACGATAGTACAGAAGCGTTTCAGAGGGCGATTGGTACAGGTAAAGTCCGTGTTAATTTATCTGCGGGCACGTATATCGTAAAGGGCGTTAAACTGCCGTCGTGGACTTATATGGTCGGCCAGGGTATCGGAGTTACAACGTTGAAGCTTCACGAAGATACGCCGGCTAGCGAATGGGTGGTCACTAACGCGGATCACGCAAACGGCAACCGAAATATTACCGTCGAAGGCATGACGTTAGACTGGAACCCAGATCGTCAAGGCGGCGTCGGAGCAACGGGCGGCTTACACTCGAGCGGCCTGACACTCGCGCAGGTTAAGTTCGGTATTGTTCGCGAAGTGGAAAGCGTTAAGCCGGGACTTCATAGCTTTGATGCTTCAGCGCCTACTTACGATATCAGCGCGACGGATTATACGCAGCAAGGCTGTCGTTACATTTGGTTCGATCGTTGCGTCGGCTCTGGATACGGAGATGACGGGATCTCTACGCATTATAGCGAGTACATTTTTATCACGAACTGTGTTATGACGAATCCGCGAGGAACTGCGCACGAAGACGGAAGAGCTAACTCGAACGGTATCGAAATTGATGACGGTTCTAAAAACGTATGGGTAATCGACTGTTATACCGAAGGGAACGTAAGAGGCGTAGAAGTAAAAGCGCACGCGGCTTGGCCGGCTTCCCAAAACGTACACATACGCGGACATGAATCTTACCGTGATATTAGGGCGTACGACTTGCGCCACATCGGACACCACTTGGCGACAGAACCGTGGAGTGAAACGGCGCGTGACGTTACTTTGATCGACTGCACAGCGCGAGAACCAATTTATAACGATCTGTATGCCGGTCTTGCTCCAAAGGCGCTCGTTATTTCGGCGTACCAACGGGTCCTCGTTTCAGATTTCCGAGCTATTGGCGATCCTACCTACGATTATAAAGGTACGGACATTATCGCGTTTCAGTATAAGAGCCGGAAGATAAATGTCAACGGCTTGCAGATGTACGGATTCGCGACAGCAGGGTCAGACGTTCATATTTACGGCGGAGATCAGCGAACAGATGACGTTTATATCTCTAACTTTACGATTCATGATTCGGCTCCTGTTGGTATCGGGATCGGAGGCGGCGTCTATTACGTTACGTTGAGCAACGGTATTGTTCACACTAGAGGCGGAACAGCCGGGATCACTTCTCCGAACAACCAGGCCACTATTATTGCGGTTCGTGCGGTGGGTTACACAGACGCAGCAGTATTAGCCGGACAAAAGTACAAGGTGGTTCCAAACAACCTGAAAGGCGGCTTTAGAGCGGCGGCTTCCTCCGGTTCTCCTCTAACGGACACAAGCGCTATCATCGCTGGCTCAGGGACGATTATCGCGAAAGGTGAACGGAATTTCATTGCTGGCGTAGCGGGCGGCGCGACAACGGAAGGTTCGCGGAATGGTGTTTTGTATTCGTGGAATTCGCATACGAAAGGTGAGAGCGGTTCCTCGGCAGTAATTGCGTCTAAAAACGTAGTAAACACGAAAGAATACACCGTTGCTTTGGGACATGGCGGTGGCGACCCGTCGGAAGCGAATAAGAAAATCGAGATTGACGCGATGGGTGGACGAGTTCGAGCTACGGGCGCAATCGAAAGTGCTTCGAATCTACAAGACTTCGGAGAATACTTCGAATCAATCGACGGACAAAAAATCGATGCTTCGTATCTCGTAACGTTGGAAGGCGATAAGATTCGAAAAGCGGACAGAGGCGATAAGATCCTGGGCGTTGTTTCTAAAACTGCGGGCTTGGTACTCGGTGGAGCAGCGTTCTATTGGAATGACCGTTACCTACACGACGAGTTCGGCGGACTTATTTATCGCGAAATTTACGAAGATGGCCGCCTCGTTACAGTTCCTGCGGAGAATCCGGACTACGATCCATCAGTTGAGTATACGCCGCGAGAGGAAAGAGACGAATGGCACGTAATTGGACTAATCGGGCAAGTTTACGTACGTATCGACGAAACCGTCGCGGTAGGAGACAGCGTGACTGCGGTCGGGGGTATCGCAACTAAAGCGGAATCGGACGGCTATGGAACGGTCATGAAAATTAAAACGCCTTATAACGCAGAAAAAGGATACGGTGTAGCGCAAATGATCGTTACGCCGCAGCACTAG

Genome Context

Tertiary structure

PDB ID

8ea341e72759bf088604b81fe3345ef4bb093858b09607e98eb6bac629b66b31

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2936

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence