Protein

View in Explore

Genbank accession

CAM0070044.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MTINFPNSPATGTVYNYGDYRYTFDGTKWTSVVKYGSSAVKIQSATAPAAPEPGLQWFDDESGRTYFWHVNEGSEQGQWVEDAPQGIVEGEEVSEAFVTATGSNTPRTVGDRFSDVVSVKDFGIEPNNNVDRTVEFLNAVASGKVIHIPEDVEFRIDPTGGMDWTTCPGINGYGKIHVDNGADILVGDNFFLDGIHIESGGAGDVSGFNLVGNPDPDASEDDMPENVKITNCTFRNNYPEGLATNYLVINAVSIKNLTVSSNTVTRGGFWFANIKGCVVDGNNIDVDNAGTAVRDLDAGSDGVKFTGGTFGTISNNVINNAGRDGIDIFHAGYYTAITGNVITNFYTEGIEIKTADSVVGGNDYCRYVTISGNIIANGGKDSSSEHAGIWITDNTTGAILPPREISVSGNTISKIGAEGRAGSLYSGIKIDGGKNVVIDGNIVTEIRSDSGYDCYGISCVRAENTIISDNVVNATDRGINIGSLSGGSITNNKVYDDSITGVSVDIGISLSASIEGVQVEGNEIKSRGLAFGTTGIATLTDCSFVNNHFVNDSGIVWRVHSIWGCVISNNIFTNGDAAFDVVYMGNTAGTPNYFTFTGNVVSNGVAGLYMRGTGATITGNRFTNVTGGVEGSAGASETDYNIITSNVVDGGSITLGDVGSNTITVNNILLP

Physico‐chemical properties

protein length:	671 AA
molecular weight:	70550,56930 Da
isoelectric point:	4,33752
aromaticity:	0,08644
hydropathy:	-0,12712

Domains

Domains [InterPro]

DC_0582
STR
1–42

DC_0582 DC_1082 IPR011050 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

IPR012334
STR
117–457

IPR012334 IPR012334

IPR006626
Unmapped
187–212

IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

IPR039448
ENZ
337–504

IPR039448

IPR011050
STR
406–576

IPR011050

CAM0070044.1

1 671

Architecture

STR

ATT

STR

STR 1-42 | ATT 94-125 | STR 126-670 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0582	STR	DC_0582	1	42	Novel HMM	DC_0582	Central	Low	Positional only	49 proteins / 49 hits
DC_1082	ATT	DC_1082	94	125	Novel HMM	DC_1082	N-terminal	Low	Positional only	52 proteins / 52 hits
IPR012334	STR	IPR012334	117	457	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	133	416	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	187	212	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	224	246	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	254	288	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	308	330	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	332	354	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR039448	ENZ	DC_0799	337	504	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR006626	Unmapped	-	365	393	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	402	432	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR011050	STR	IPR011050	406	576	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	433	461	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	462	483	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	484	505	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR012334	STR	IPR012334	504	670	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR006626	Unmapped	-	509	533	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	534	559	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	562	583	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	591	611	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	612	633	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAM0070044.1

1 671

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	132	132	0,9848
Central domain	133	660	529	0,9975
C-terminal	661	671	10	0,1802

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-132

Central
133-660

C-terminal
661-671

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage D148 [NCBI]	3104901	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAM0070044.1 [NCBI]

Genbank nucleotide accession

OZ196545.1 [NCBI]

CDS location

range 35082 -> 37097
strand +

CDS

ATGACTATCAATTTCCCAAATAGCCCGGCAACGGGTACAGTATACAACTACGGGGATTACCGCTACACGTTCGATGGAACGAAGTGGACATCTGTCGTAAAGTACGGCTCGTCAGCCGTAAAGATTCAAAGTGCAACAGCTCCAGCAGCGCCAGAGCCTGGACTACAGTGGTTCGATGACGAATCAGGTCGTACATACTTCTGGCATGTCAATGAAGGCTCTGAACAGGGCCAGTGGGTAGAAGATGCACCTCAGGGTATCGTTGAAGGCGAAGAGGTCTCTGAGGCTTTCGTTACTGCTACTGGTAGTAATACTCCTCGTACGGTAGGCGATCGCTTCTCTGATGTAGTGAGTGTCAAGGACTTCGGTATAGAACCAAATAACAATGTAGACAGAACTGTAGAGTTTCTAAATGCAGTAGCTTCAGGGAAAGTCATCCATATACCCGAGGATGTAGAGTTCCGTATAGACCCTACAGGAGGGATGGATTGGACCACTTGCCCCGGTATAAATGGTTATGGCAAGATACATGTAGATAACGGTGCGGATATCCTAGTAGGTGATAACTTCTTCCTGGACGGTATTCATATAGAATCAGGTGGTGCAGGTGATGTATCTGGATTTAACCTAGTAGGTAACCCGGACCCAGACGCATCAGAAGACGACATGCCGGAGAACGTTAAGATTACAAATTGCACGTTCAGAAACAACTACCCTGAAGGTCTGGCTACTAACTACCTTGTTATAAACGCAGTTAGCATCAAGAATTTAACGGTTTCATCAAACACAGTAACTCGAGGGGGCTTTTGGTTCGCCAATATTAAGGGGTGTGTAGTAGATGGTAATAATATTGACGTAGATAATGCAGGGACTGCGGTGAGAGATTTAGACGCTGGATCAGACGGTGTCAAGTTTACGGGGGGAACCTTTGGAACTATATCCAACAATGTTATAAACAACGCAGGAAGGGACGGCATTGATATATTCCACGCGGGATACTATACCGCAATAACTGGAAATGTTATAACTAACTTCTATACAGAAGGTATCGAGATAAAAACTGCGGACTCAGTAGTGGGTGGTAACGATTACTGTAGATACGTAACTATATCAGGAAACATTATCGCTAATGGCGGTAAGGATAGCTCTTCTGAGCACGCGGGGATCTGGATAACGGATAATACTACAGGTGCAATTCTCCCTCCTAGAGAGATATCGGTCAGCGGAAACACTATCTCCAAGATAGGTGCGGAAGGGCGTGCAGGATCGTTATACTCCGGAATAAAGATAGACGGAGGTAAGAACGTAGTTATAGACGGCAACATAGTTACTGAGATCCGTTCAGATAGCGGATATGATTGTTATGGTATCAGCTGTGTAAGAGCAGAGAATACTATTATATCAGATAATGTTGTTAATGCTACGGACAGAGGGATTAATATAGGGTCTCTATCTGGAGGCTCTATTACTAATAATAAGGTATATGATGATTCTATTACAGGAGTATCGGTAGACATAGGTATCTCCCTATCGGCTAGTATAGAAGGGGTTCAGGTAGAGGGTAATGAAATTAAGTCTAGGGGTCTGGCATTCGGTACCACAGGCATCGCTACCTTAACTGACTGCTCTTTCGTAAACAATCATTTCGTGAATGACTCCGGTATAGTATGGCGAGTACATAGTATATGGGGATGTGTTATATCAAATAACATATTCACCAACGGCGATGCAGCATTTGATGTAGTATATATGGGTAATACGGCAGGGACACCTAACTACTTTACGTTTACAGGTAACGTAGTGTCTAATGGCGTAGCGGGACTATATATGAGAGGTACTGGGGCTACTATAACAGGTAATAGGTTTACCAACGTTACTGGTGGAGTAGAAGGTTCTGCGGGAGCTAGTGAGACAGATTACAATATCATAACAAGTAATGTGGTTGATGGCGGTAGTATAACGCTAGGTGACGTAGGTTCTAACACCATTACAGTAAATAATATATTGTTACCATAA

Genome Context

Tertiary structure

PDB ID

d89ae4c7e1625cee0890d067acb38a044ceade1bbfdf882181bee2189bc7f7a1

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8458

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence