Protein

View in Explore

Genbank accession

YP_009618508.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

Protein sequence

MTLYIGRKNSGEPLLHLTNTARTEAEMKTGNTFSDTLFHSGMPFLTVIDIITITEFNDAGVYPGWSPYRAGTPKVTDPATVAKLDYYFNNGYLFDARAISIAPAGVDVQGLGTFGSSTSYNRLFSSPVLNGEYKNIRVSAGISNRSAASGTPPSFDNSISAIQIASSSSNLVTLSGGLARVGDLGLRFANTSNYISNSGSASGSPSLVTNWRNITTRMLYTTGASAVGPFSYPNNGSNTALRFKVQIYIFNLKKTSNGNDYEFGRAYGNNAAIRISGQEITVGDKSIKDLSFAYTSGSYSTSTGGGRRYDEAGVLGQSLLLEHYNRSCHDWWYNIYPAANMNLRITPGGNITTTAYIEITHMALRATYKYPTLKVGDPISFEMTANEIKMRDESNNSISIAKVGSGRRLKKSYPQFKVTLPGQTNLTPPTMRAGASVYTQPTSSVVIVGLTTYTKTEVISETPIPDEFFNRVKTCHISGGLINGTLSMSSYGMNKTIGLSNIRVTTSQINADTSLPVGQLASYNFYIEQNMSYYDFYYIQATYSNGNKGSVQINYNAEVIGNTYRITRVTRSTLSSSHIRGSVITDFNITRYYDEVQSGVADNQLVINYPEVRFNLLLLGVEDK

Physico‐chemical properties

protein length:	624 AA
molecular weight:	68121,45520 Da
isoelectric point:	9,10257
aromaticity:	0,10577
hydropathy:	-0,26186

Domains

Domains [InterPro]

IPR059609
RBD
1–52

IPR059609 DC_2140

YP_009618508.1

1 624

Architecture

RBD

STR

RBD 1-52 | STR 53-624

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR059609	RBD	DC_0630	1	52	InterPro cluster	Receptor-binding protein pb5	Central	Medium	Text match	299 proteins / 301 hits
DC_2140	STR	DC_2140	53	624	Novel HMM	DC_2140	Central	Low	Positional only	3 proteins / 3 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009618508.1

1 624

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,5414
Central domain	11	220	211	0,7904
C-terminal	221	624	403	0,5646

Note: Constraints were applied during segmentation.
Fixed 5 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-220

C-terminal
221-624

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage JSF10 [NCBI]	1983593	Uroviricota > Caudoviricetes > Demerecviridae > Jesfedecavirus > Jesfedecavirus JSF10
Host	Vibrio cholerae [NCBI]	666	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

YP_009618508.1 [NCBI]

Genbank nucleotide accession

NC_042074 [NCBI]

CDS location

range 85119 -> 86993
strand +

CDS

ATGACTTTATACATTGGAAGAAAAAATAGTGGTGAACCACTATTGCACCTTACAAACACTGCTAGGACAGAAGCTGAGATGAAGACAGGGAACACGTTCTCTGACACTCTTTTTCACTCTGGCATGCCATTTCTTACTGTAATTGATATAATTACTATTACAGAATTCAATGATGCAGGAGTATACCCTGGGTGGAGCCCTTATAGGGCAGGAACCCCTAAAGTAACAGACCCAGCTACTGTAGCAAAATTAGACTACTATTTTAACAACGGTTATTTATTTGATGCTAGGGCTATAAGCATAGCCCCTGCGGGGGTGGATGTGCAAGGGTTAGGTACGTTTGGTTCTAGCACCTCGTATAATAGGCTATTCTCTAGCCCTGTACTAAATGGTGAGTACAAAAATATCAGAGTTAGTGCGGGAATCTCTAACAGGTCTGCTGCCTCAGGAACTCCGCCATCTTTTGATAACTCTATTAGCGCTATACAGATAGCGTCTTCCTCAAGTAACCTAGTCACTCTATCTGGGGGTTTAGCTAGGGTAGGGGATTTAGGTTTAAGGTTTGCTAACACCTCAAACTATATCAGTAATAGTGGCTCAGCTAGCGGGAGTCCGTCGCTGGTAACAAACTGGAGAAATATCACAACTAGGATGCTCTATACTACGGGTGCATCGGCTGTAGGTCCATTCAGCTACCCCAATAACGGCAGCAACACTGCACTGCGTTTCAAGGTTCAAATATATATCTTCAATCTCAAGAAAACTTCCAACGGCAATGACTATGAGTTTGGTAGGGCATACGGAAATAACGCGGCAATAAGGATAAGCGGACAAGAGATTACTGTAGGAGATAAGAGTATAAAAGACCTCAGCTTTGCGTACACATCAGGAAGCTACTCTACTAGCACAGGAGGGGGTAGGAGGTATGACGAAGCGGGTGTGCTAGGCCAATCCCTACTTCTGGAGCATTATAACAGATCCTGTCATGACTGGTGGTATAACATTTACCCTGCGGCAAATATGAACCTTAGGATAACCCCCGGAGGTAATATAACCACAACAGCGTATATAGAGATAACGCACATGGCTTTGAGGGCTACATATAAATACCCTACATTGAAGGTTGGAGACCCTATAAGCTTTGAGATGACGGCTAACGAGATAAAGATGCGGGACGAATCTAACAACTCTATCAGTATAGCAAAAGTAGGCTCTGGAAGGCGCTTGAAGAAGTCTTACCCACAATTTAAGGTGACCCTCCCTGGCCAGACCAACCTAACACCGCCTACGATGAGGGCAGGGGCTAGTGTTTATACTCAACCCACTAGCTCTGTAGTCATTGTGGGATTGACCACGTACACTAAGACCGAGGTCATTTCAGAGACGCCTATACCGGATGAGTTCTTCAATAGAGTTAAAACTTGCCACATTAGTGGGGGGTTAATAAATGGAACCTTGTCGATGTCATCCTATGGCATGAACAAGACTATAGGGCTATCTAATATACGCGTGACTACTAGCCAGATTAACGCAGATACTAGCTTGCCCGTGGGGCAGCTAGCGTCATATAACTTCTACATAGAACAAAATATGAGTTATTATGACTTCTATTACATTCAAGCTACATATAGTAATGGGAATAAAGGGTCGGTTCAGATAAATTATAACGCCGAGGTTATAGGCAACACATATAGAATAACTAGAGTAACCAGAAGTACCTTGAGTAGCTCTCACATTCGTGGGTCTGTTATAACGGATTTTAACATAACTAGGTACTATGATGAGGTGCAGAGCGGAGTGGCGGACAATCAATTAGTCATAAACTACCCCGAGGTGAGGTTTAATCTACTGCTTTTGGGGGTTGAGGACAAGTAA

Genome Context

Tertiary structure

PDB ID

51a4d5e46110697ad67bf3f44c9640c1f33a3254c0447287d0da72ef6b063fd6

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,2327

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence