Protein

View in Explore

Genbank accession

CAH9016519.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MSCSDYPTAQTAKTFKLDAETTNEVVTLEQDRTSAASDGKTKKTFWGIENDATNQYNSIQKRADQQYAEVASKYAIRNVGNYADDPLISEYFEFVQFGDLIYFAINPPYQVDSATYPDPSGDSSNLRLGQATDASLVTSTGSTTPRTLADRFADVVNVKDFGATGDGSTDDATAINACFQSMTNGGTVYFPDGTYFIGTNITPLSNTTIQGGGNSIIKLKDHTVSVLFEFTSNNKMFNMKVDGNYLEWLVPDNFVVTIRNCFNFFMEYCEVYNGYGVGIGIGRGNHPASERVTIQNCIVHDMGSDTHPVITNPWANGIANTVGKDVKILNNYIYDVWGTGGINCEGLVNENILIADNTIFDIHEDCAGIKLYAGGAGQPPKNVVIRNNQLYNINDTLASPVQKEPAIWVSSGEDVQIIGNTISNCIYNDAISANPSGTLIIDSNIIKNCPEGRIRAAASQHIKVTNNIIDCPDGAVYTNEAPLWVESNTTPADGTCIVKGNSITNSPLNAAWINLGATAGEFTSNSFFNCHKDVGNPTVLVGTKDNWRNSIIGNNIISDDIGDVTSRLTYFYSLSGNKLGGGILLPDVWDMADDTHEGIKYDLGSNTEFFQSDLAAFSAAPSAGYNQRGDIVYNISPDVGDPIGWVCRLSGAPGTWNGFGEIMA

Physico‐chemical properties

protein length:	664 AA
molecular weight:	71756,62330 Da
isoelectric point:	4,43449
aromaticity:	0,09639
hydropathy:	-0,24352

Domains

Domains [InterPro]

DC_0489
STR
1–653

DC_0489

IPR011050
STR
153–395

IPR011050 IPR011050

IPR012334
STR
155–482

IPR012334 IPR006626

IPR024535
ENZ
156–371

IPR024535 IPR006626 IPR006626 IPR006626

IPR006626
Unmapped
261–283

IPR006626 IPR006626 IPR006626 IPR006626 IPR039448

CAH9016519.1

1 664

Architecture

STR

STR 1-653 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0489	STR	DC_0489	1	653	Novel HMM	DC_0489	Central	Low	Positional only	31 proteins / 31 hits
IPR011050	STR	IPR011050	153	395	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	155	482	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR024535	ENZ	DC_0410	156	371	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
IPR006626	Unmapped	-	261	283	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	289	322	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	323	346	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	349	373	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	380	411	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR039448	ENZ	DC_0799	382	527	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR011050	STR	IPR011050	406	630	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	412	435	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	459	480	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	493	515	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAH9016519.1

1 664

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	169	169	0,9837
Central domain	170	601	433	0,9773
C-terminal	602	664	62	0,9524

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-169

Central
170-601

C-terminal
602-664

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 242E40-1 [NCBI]	2963182	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAH9016519.1 [NCBI]

Genbank nucleotide accession

OX241574.1 [NCBI]

CDS location

range 32877 -> 34871
strand +

CDS

ATGAGTTGCAGCGACTACCCAACAGCGCAAACCGCCAAGACATTTAAGTTAGACGCAGAAACCACCAATGAGGTGGTAACTCTGGAGCAGGACAGAACAAGTGCAGCCAGTGATGGTAAAACAAAGAAAACATTTTGGGGCATTGAGAATGATGCCACAAATCAGTATAACTCAATCCAAAAGAGAGCAGACCAGCAATATGCAGAAGTTGCCAGCAAATACGCAATCAGAAATGTTGGTAATTACGCAGATGACCCGCTGATTTCTGAATATTTTGAGTTTGTTCAATTTGGTGATTTGATATATTTTGCTATCAATCCACCATATCAAGTTGACAGCGCTACATACCCAGACCCTTCTGGCGATAGCTCAAACCTAAGGCTAGGGCAAGCAACGGATGCAAGTTTAGTTACATCAACAGGATCTACCACTCCGCGCACACTAGCAGATCGTTTTGCTGATGTAGTGAATGTTAAAGATTTCGGCGCTACTGGTGATGGTTCCACAGACGACGCAACTGCGATAAATGCCTGTTTCCAATCTATGACAAACGGGGGTACTGTTTATTTCCCTGACGGAACGTATTTTATCGGAACAAATATTACCCCATTGAGTAATACGACTATACAAGGTGGCGGGAACAGTATTATAAAACTGAAAGACCATACCGTTTCAGTCCTGTTCGAGTTTACATCAAATAATAAAATGTTCAACATGAAGGTTGACGGGAACTACCTTGAATGGCTTGTCCCTGATAATTTCGTCGTGACTATTAGAAACTGTTTCAACTTCTTCATGGAATACTGTGAAGTTTATAACGGCTACGGCGTAGGTATAGGAATCGGGCGTGGCAATCATCCTGCGTCTGAACGTGTGACCATTCAAAACTGTATCGTGCATGACATGGGTTCAGATACCCACCCTGTAATCACAAACCCATGGGCTAATGGTATTGCCAACACTGTAGGTAAGGACGTCAAGATTCTTAATAACTATATCTATGATGTGTGGGGTACAGGGGGTATTAACTGTGAAGGTCTTGTAAACGAGAATATCCTAATTGCTGATAACACGATTTTCGATATTCATGAAGACTGTGCGGGTATCAAATTATACGCAGGCGGTGCAGGCCAACCCCCTAAAAACGTAGTAATACGAAACAATCAACTTTACAACATCAATGATACTCTTGCCTCCCCTGTTCAAAAAGAGCCTGCTATCTGGGTGTCATCTGGTGAAGATGTGCAGATTATCGGCAATACTATATCTAACTGTATCTACAATGATGCAATTTCCGCAAACCCATCAGGGACACTTATCATTGATAGCAATATCATTAAAAACTGCCCAGAAGGGCGTATCCGCGCCGCCGCATCTCAACACATAAAAGTTACAAATAACATCATAGACTGCCCTGATGGAGCGGTGTATACCAATGAAGCGCCTTTGTGGGTAGAGAGTAACACAACACCCGCAGACGGTACTTGTATCGTGAAAGGTAACAGTATAACAAACTCCCCTCTCAATGCAGCATGGATCAACTTAGGTGCAACAGCCGGTGAATTTACGAGCAATAGTTTCTTCAATTGCCATAAAGATGTAGGTAATCCGACGGTGTTGGTTGGTACGAAAGACAATTGGAGAAATTCAATCATTGGTAATAATATTATCTCTGACGATATAGGTGATGTAACTTCGCGTTTAACATACTTCTATTCACTTAGCGGCAATAAGCTCGGCGGCGGTATTTTATTACCTGACGTGTGGGACATGGCAGACGATACACACGAAGGTATTAAGTATGACTTAGGTTCTAATACAGAATTCTTCCAATCGGACCTAGCTGCGTTCTCCGCCGCACCGTCAGCAGGCTACAACCAACGTGGCGATATAGTATACAACATCAGTCCAGATGTTGGGGACCCTATTGGTTGGGTATGTCGATTATCAGGAGCGCCAGGTACTTGGAATGGCTTCGGGGAGATTATGGCTTAA

Genome Context

Tertiary structure

PDB ID

1077ad657d804316235131532e91eb04f75349471284e33c594f92e2d2c88cfa

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7834

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence