Protein

View in Explore

Genbank accession

QAY01958.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MPTPSGLVTKQELIDAQLDTAHLGRVVNSKDAAGNPISQSTNRTGGVNATLNALLGAIGLYSVGFWTDDPTLTEVNQYVRDNSTGLDYQPVTLPYTVNSALNPDPETLVTSGVLNRVNEVTQQDLIDQLGLLVGGSVYPGDDGAYVKNEDTVPSGTTHLIVQVSGVKTLVAMSPVASGAVSMLADDSAVIGGVTVALIPPNVTAIDKASALLTPFSTGTIVEVASCNFARFISVIASDTGGLYLGTLPNGNKLRHIPKAGTLLKMVSTSDFDIVQDADISQFLIDATSAGYGHIEIDNDYAVNQNVDTTGVKYLISNQGSQITVDDALGRIKNDTDGFEARGITFNKSGSYSDTTFEAYLLETNGEDVIVERCRFLGQWAGYKLQGNNSTVDLCFFSDGTFMLRVGEGVVSCKINGSFFTRGTRQYTEGGEQGDGIKITAQSAAQGYNENIIISNNIFYNVYRDCIDGYTGASRMIISGNMMINWGAHAMDIKSRVDDNVETPDGGPLARDILIEGNMIWKGVVRPDFDLTLAAVVMSVIPGTLPLPTSEADVRDKGLRGMEFRNNRLAYIGNGGFISATSTWRTVIENNTFTDLGQIGQVIYAPNCWHMKFNDNTVNIDPSNVNNVDFSLSMNQAEIKDNTFNRLLIATDGMTNIDLKSNKFNGQGALSRGLNIASEGVSAVDNKFDNFTSFGAQIFNAASKCRFDFNEIRNCPAPLGIENPSVNTYHSVRGNISMGSGAFTGLNRITDNGGVASMNDHVAYV

Physico‐chemical properties

protein length:	764 AA
molecular weight:	81872,58460 Da
isoelectric point:	4,61757
aromaticity:	0,07723
hydropathy:	-0,11688

Domains

Domains [InterPro]

DC_0194
STR
9–764

DC_0194

IPR012334
STR
257–527

IPR012334

IPR011050
STR
339–521

IPR011050

QAY01958.1

1 764

Architecture

STR

STR 9-764

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0194	STR	DC_0194	9	764	Novel HMM	DC_0194	Central	Low	Positional only	163 proteins / 163 hits
IPR012334	STR	IPR012334	257	527	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	339	521	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QAY01958.1

1 764

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	278	278	0,9967
Central domain	279	747	470	0,9851
C-terminal	748	764	16	0,7922

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-278

Central
279-747

C-terminal
748-764

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage VpaJT_1 [NCBI]	2484247	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Vibrio parahaemolyticus [NCBI]	670	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

QAY01958.1 [NCBI]

Genbank nucleotide accession

MH925092.1 [NCBI]

CDS location

range 18782 -> 21076
strand +

CDS

ATGCCAACTCCATCAGGGCTTGTAACGAAGCAAGAACTTATCGACGCTCAGCTCGATACCGCGCACCTCGGTCGCGTCGTCAATTCTAAGGACGCTGCGGGTAATCCGATCTCCCAAAGTACGAACCGCACCGGCGGAGTGAACGCAACTCTTAACGCGTTGCTCGGCGCAATCGGCCTGTACTCTGTCGGATTCTGGACAGACGACCCAACGCTTACCGAAGTGAATCAATATGTCCGAGACAACTCGACCGGACTGGACTATCAACCCGTCACGCTGCCTTACACGGTGAACAGCGCGTTAAACCCCGACCCCGAAACGCTCGTCACGTCCGGCGTGTTGAACCGCGTGAACGAAGTTACACAGCAAGACCTTATCGACCAGCTAGGGCTTTTAGTCGGCGGGAGCGTTTATCCTGGCGACGACGGTGCGTACGTTAAGAACGAGGATACTGTCCCGAGCGGTACGACGCATTTGATTGTGCAGGTTAGTGGGGTTAAGACTTTAGTCGCGATGTCGCCCGTAGCGAGTGGCGCTGTGTCAATGTTAGCTGACGATTCGGCAGTTATAGGGGGTGTGACGGTAGCGCTAATCCCACCTAACGTAACCGCTATAGACAAAGCCTCCGCTCTCCTAACACCTTTCTCAACGGGGACAATTGTTGAGGTGGCTTCCTGCAATTTCGCAAGGTTCATTTCCGTCATTGCATCGGATACCGGTGGACTATATCTCGGCACACTGCCGAACGGGAATAAACTTCGCCACATCCCGAAAGCTGGAACACTGTTAAAAATGGTGAGCACCTCGGATTTTGACATTGTTCAAGACGCGGATATTTCTCAGTTTCTCATTGATGCGACGTCGGCAGGTTACGGTCACATAGAGATCGATAATGATTATGCGGTCAATCAAAACGTCGACACTACAGGCGTGAAATATCTAATAAGTAACCAAGGATCACAAATTACAGTAGATGACGCGCTCGGTAGGATAAAGAACGACACTGACGGTTTCGAGGCGAGAGGGATAACATTCAATAAGTCGGGTAGCTACTCAGACACCACGTTTGAAGCGTATTTGTTAGAAACGAACGGCGAAGACGTTATTGTTGAGCGATGCAGGTTTCTAGGCCAATGGGCTGGATACAAACTCCAAGGGAATAACTCAACCGTGGATTTGTGTTTCTTCTCAGACGGAACGTTCATGTTAAGAGTCGGGGAAGGCGTTGTAAGTTGTAAGATAAACGGTAGCTTCTTCACTAGAGGTACGCGTCAGTACACTGAAGGGGGAGAACAAGGTGACGGTATTAAGATAACTGCTCAAAGTGCCGCTCAAGGTTACAACGAGAATATAATTATTAGTAATAATATCTTCTACAATGTTTACCGAGATTGTATAGATGGTTACACGGGTGCTAGTAGGATGATTATCTCTGGTAACATGATGATCAACTGGGGTGCTCACGCTATGGATATTAAGTCTAGAGTCGATGACAACGTAGAGACACCTGACGGCGGACCTCTAGCACGAGACATATTGATAGAAGGCAACATGATATGGAAAGGCGTGGTTCGACCTGACTTCGACTTAACCCTAGCCGCTGTGGTTATGAGCGTCATACCAGGCACGTTACCACTACCAACGTCTGAAGCGGACGTACGGGATAAAGGCTTGCGAGGCATGGAGTTCCGCAACAACCGCCTCGCATATATAGGCAACGGGGGCTTCATTAGTGCCACTAGTACGTGGCGTACTGTTATTGAAAACAACACATTTACGGACTTAGGTCAGATAGGTCAGGTTATCTACGCCCCTAACTGCTGGCATATGAAGTTTAATGACAACACCGTTAATATTGACCCTTCAAATGTTAATAATGTTGATTTCTCATTGTCTATGAATCAAGCGGAGATCAAGGACAATACGTTCAATAGATTGCTTATTGCAACAGATGGTATGACCAACATAGACCTAAAGAGTAACAAGTTTAACGGTCAAGGGGCACTCAGTCGAGGTCTTAACATTGCCTCCGAAGGTGTTAGTGCGGTAGACAATAAGTTCGATAACTTTACGTCATTCGGTGCTCAGATATTTAACGCCGCTAGTAAATGTCGATTCGATTTCAATGAAATACGAAACTGTCCGGCACCGCTAGGGATAGAGAATCCTTCAGTGAACACATACCACAGTGTTAGAGGTAATATAAGCATGGGAAGTGGTGCGTTTACAGGCCTTAACCGGATAACGGATAACGGCGGTGTAGCTAGTATGAACGACCATGTGGCCTACGTATAG

Genome Context

Tertiary structure

PDB ID

7bc4afe34976b6b2fc6c31bda7d94226f8d8def092acfa544ebf653768e2d46d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7794

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Characterization and complete genomic analysis of VpaJT_1	Chen,L.	2024-12-16	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature