Protein

View in Explore

Genbank accession

YP_008241791.1 [GenBank]

Protein name

virion structural protein

RBP type

TSP

Evidence DepoScope

Probability 0,99

Protein sequence

MSRITLTISNKTPSSGEPSLIASFNVRFNYGVSDIVLDLVLTSSAGVGRFAWSTDLATSSANYAFAFNRDYKNVGGTNNLTATVVAYNQIAIESKVGVFLDAETDSNVAGLEYKIDTTIPVVDKLLLAITKQSTGDCSGVNYTAIATGGTKPYTLRVNNGALLSSNWDGSLLSFSLSRGTLHGVKITDATGDQNTQTANVPRNLNASEFTVSQVLSNGATNLSIANTNVVSGTTPITYSIDNVDYQTSTDFIGLPDDTYTIRIKDTYGCITTKEVVVLNEVIPVEEEATQYNHLFVSNFNSIAFSPKETFSAFNKKNFDNTLSYSEYIKADNSITQQFIEGDVDSYGIGTQFQSSYPYNKITIHNCDGSKVDIPSIMIQENIGTYEKVDCMLFPVSTGIGVYFDGGSAYDPNTDTVIGASDYISALPDWAVSGERVEITNFGVKEIIGFGYDSDLDRNYFIVSGSIGSITASKIQVKYDIQEYNLFEFYLNMSLVSNKAVITIEGGFSFNEINKTWVSECIEKIEDTDEHLLIRWSSYKNVGEMVFASGIQGVMRIKGKIRAYAKGESEVSETDSGSYPLRQSATLGQRVSIPYATPKIWDKLNAVSGISIVGTLTINGIELVRNSEIEQEEKGDSNISEVTMTFDYGYNYLISRQDEIVLNVSTGVEGAGGGEYDPINIVPFDNKTRIVDSSGKFITVGGSFATLN

Physico‐chemical properties

protein length:	707 AA
molecular weight:	76948,72100 Da
isoelectric point:	4,52066
aromaticity:	0,10042
hydropathy:	-0,13296

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_008241791.1

1 707

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	296	296	0,6285
Central domain	297	696	401	0,6163
C-terminal	697	707	10	0,1182

Note: Constraints were applied during segmentation.
Fixed 55 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-296

Central
297-696

C-terminal
697-707

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cellulophaga phage phi19:1 [NCBI]	1327970	Uroviricota > Caudoviricetes > Assiduviridae > Cellubavirus phi19una >
Host	Cellulophaga baltica [NCBI]	76594	cellular organisms > Bacteria > Pseudomonadati > FCB group > Bacteroidota/Chlorobiota group > Bacteroidota

Coding sequence (CDS)

Genbank protein accession

YP_008241791.1 [NCBI]

Genbank nucleotide accession

NC_021799 [NCBI]

CDS location

range 44226 -> 46349
strand +

CDS

ATGAGCAGAATAACATTAACAATAAGCAATAAAACACCATCAAGCGGCGAGCCTTCATTAATAGCTTCTTTCAATGTTAGATTTAACTACGGAGTGTCTGACATTGTACTTGATTTAGTTCTTACATCAAGTGCTGGTGTAGGTAGATTTGCATGGAGTACAGATTTGGCAACTAGTAGCGCTAATTACGCTTTCGCATTCAATAGAGATTATAAAAACGTCGGTGGAACAAACAACCTTACTGCGACCGTAGTAGCATACAATCAAATTGCTATAGAATCTAAAGTAGGTGTCTTTTTAGATGCAGAAACAGACTCAAATGTAGCTGGATTAGAATACAAAATAGACACCACAATTCCAGTTGTTGACAAGTTATTGTTGGCTATTACAAAGCAGTCTACAGGTGATTGTTCTGGTGTTAACTACACAGCAATAGCTACGGGTGGAACAAAACCGTACACTCTTAGAGTTAATAACGGTGCTTTATTGTCATCTAATTGGGATGGTTCTTTGCTGTCTTTCTCGTTGTCTAGAGGAACTTTACATGGCGTAAAAATTACAGACGCAACTGGAGATCAAAACACACAAACGGCAAACGTTCCTAGAAACTTAAACGCTTCTGAGTTTACAGTCTCACAAGTTTTGTCTAACGGAGCTACAAACCTATCTATAGCAAACACTAACGTTGTATCTGGAACTACACCTATAACGTATTCAATTGATAATGTAGACTACCAAACAAGCACAGATTTTATAGGATTACCAGATGACACATATACAATTAGAATAAAAGATACTTATGGATGCATAACAACTAAAGAGGTTGTTGTGTTAAACGAAGTAATACCAGTAGAAGAGGAAGCAACTCAGTATAATCATTTATTTGTAAGCAACTTCAATAGTATTGCGTTTTCACCTAAAGAAACATTTAGCGCATTCAATAAAAAGAATTTCGACAATACACTTAGCTACTCAGAATATATAAAAGCTGATAACTCTATAACGCAACAATTTATAGAAGGAGATGTAGATAGTTATGGTATTGGAACACAATTTCAATCCTCATACCCTTATAACAAAATTACTATTCATAATTGTGATGGTTCAAAAGTAGATATTCCATCTATAATGATTCAGGAAAATATAGGAACATACGAGAAAGTAGATTGTATGTTGTTTCCTGTTTCTACTGGAATAGGAGTTTATTTTGACGGTGGCAGCGCTTACGACCCAAACACAGATACAGTAATAGGGGCTAGTGATTACATATCCGCATTGCCTGATTGGGCTGTTAGCGGTGAGCGTGTAGAAATAACAAATTTTGGAGTTAAAGAAATTATAGGGTTTGGATATGATTCTGATTTAGATAGAAATTATTTTATTGTTAGTGGTTCTATTGGATCAATAACAGCATCTAAAATACAAGTTAAATATGACATTCAAGAATACAACCTATTTGAGTTTTATTTAAACATGTCTTTAGTTTCTAATAAGGCTGTTATAACTATAGAAGGTGGTTTTTCTTTTAATGAAATAAACAAAACATGGGTTTCTGAATGTATTGAAAAAATAGAAGATACAGACGAACACTTGTTAATTAGATGGAGTTCTTACAAGAATGTAGGGGAAATGGTTTTCGCTTCTGGTATTCAGGGTGTAATGAGAATAAAAGGTAAAATTCGTGCGTATGCTAAAGGAGAATCCGAAGTAAGCGAAACCGATTCTGGAAGCTATCCACTAAGACAATCAGCCACATTAGGTCAAAGAGTTTCGATACCTTATGCAACTCCTAAAATTTGGGATAAATTAAATGCGGTTAGTGGTATTTCAATCGTTGGAACATTAACAATAAACGGTATAGAATTAGTTCGTAATAGCGAAATAGAACAAGAAGAAAAAGGAGATAGCAATATTTCAGAGGTTACAATGACTTTTGATTATGGTTATAACTATTTAATAAGTAGACAAGATGAAATTGTATTAAACGTTTCTACAGGAGTAGAAGGCGCTGGAGGTGGTGAATATGATCCGATAAATATAGTTCCTTTCGACAACAAGACAAGGATTGTAGATTCATCAGGTAAGTTTATCACCGTCGGGGGTAGTTTCGCTACCCTTAACTAA

Genome Context

Tertiary structure

PDB ID

0b344948105cfdb2085908dbf40ca71c7697986d27a5be7f146b30b56ddc5ac8

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5846

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence