Protein

View in Explore

Genbank accession

XPZ22447.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MALEKLTQVKGSVSLYLRQLINKTISGTTNYLGYWGLTLSNSGLAGATVKFGGKVWELRSDNADISSSEPSDELWIDCGTDGFTFKSLADAKASLRIEGQGFYISSYHEGLNKGGGWFTWVPSSTAVEDDFLVIGTGSAGRHHRSVENGTVTPSDAGARGEGASSATQDTLAFLKVAACDYNVTCDYTDAGYYLTNQVSLSGTRRNWKIINLNGCDIQFVFDGSSSRNCFQMGDFSEIYGGTLLNNTDPSNSNGDGSFDNPVAVGTTANVAAKNVKIHTLEIYQNLEKTCIGIWGASHDIEVDNIFLRSSERAIIGVLAHWGVDTGDFTTASVSLHPYNLKMSNVTCKNFSGLAADSFAIVLSGVYNVTVDNLTAENMIGGCKVQPGTVGNSLASAEVREKILTNIRVNNINTFNVQQPAFADWSGDGVAWSGGSYDIESDIEFDGVNANESPTGGTAFIVQRLSNVTAKNLRIKNFFRAFHVLGIDGDEASDVTIDDLKAEDIKTIGGYVSGVYCKRFKLTSSEIKDCSDGISTIANESSCLLIESPDFTIENTRLGADSSEDAYRLLALTATATGGLVKGSEYKDVRSGGYHLFNDVPVTTQINTTTPDGFNMLSSNVVLSRLDYVDVGLNLSSNQSVSTGVSSTLNLDSVDHDYYSNYSSLGFLPKTSSMYTVEGLITLRDVLGEGTVNVDVYSGSTRIKRLVSESVNLDSSRNAGVKLSGSFKAEAGSVITLKLTQDIAASLELDSDNNTGTWVDFRQL

Physico‐chemical properties

protein length:	763 AA
molecular weight:	81783,62840 Da
isoelectric point:	4,69168
aromaticity:	0,08650
hydropathy:	-0,15963

Domains

Domains [InterPro]

DC_1719
ATT
1–85

DC_1719 IPR059934 IPR011050

DC_1579
RBD
561–763

DC_1579

XPZ22447.1

1 763

Architecture

ATT

RBD

STR

RBD

ATT 1-85 | RBD 86-145 | STR 423-564 | RBD 565-763

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1719	ATT	DC_1719	1	85	Novel HMM	DC_1719	N-terminal	Low	Positional only	4 proteins / 4 hits
IPR059934	RBD	DC_0541	85	145	InterPro cluster	Phage tail protein-like, small four-stranded beta-sheet domain	C-terminal	Low	Positional only	683 proteins / 690 hits
IPR011050	STR	IPR011050	423	564	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_1579	RBD	DC_1579	561	763	Novel HMM	DC_1579	C-terminal	Low	Positional only	4 proteins / 4 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XPZ22447.1

1 763

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	166	166	0,9873
Central domain	167	619	454	0,9866
C-terminal	620	763	143	0,9834

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-166

Central
167-619

C-terminal
620-763

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Marinomonas phage CB5A [NCBI]	2022859	Uroviricota > Caudoviricetes > Autographivirales > Colwellvirinae > Murciavirus
Host	Marinomonas sp. [NCBI]	1904862	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Oceanospirillales

Coding sequence (CDS)

Genbank protein accession

XPZ22447.1 [NCBI]

Genbank nucleotide accession

MF481197 [NCBI]

CDS location

range 41955 -> 44246
strand +

CDS

TTGGCACTAGAAAAACTAACACAAGTTAAAGGTAGCGTCTCATTATACCTTAGACAGCTTATTAATAAAACTATCTCTGGGACAACTAATTACCTTGGTTACTGGGGACTGACACTATCTAATTCAGGTCTAGCTGGAGCAACCGTTAAGTTCGGCGGTAAGGTCTGGGAGCTAAGATCAGATAATGCAGACATCAGCTCATCTGAACCGAGTGATGAATTATGGATAGACTGCGGAACTGACGGGTTTACGTTCAAGTCGCTTGCAGATGCTAAAGCTTCTCTTAGAATAGAAGGTCAGGGATTCTATATAAGCTCTTATCATGAAGGCTTAAACAAGGGTGGTGGCTGGTTCACTTGGGTGCCATCTTCAACAGCGGTCGAGGATGACTTTCTTGTTATCGGCACTGGCTCCGCAGGCAGGCACCACAGATCAGTTGAAAACGGGACAGTTACGCCGTCAGATGCAGGAGCAAGAGGGGAGGGGGCATCATCAGCTACGCAAGATACGCTCGCATTCTTAAAAGTCGCAGCATGTGACTACAATGTTACTTGTGACTATACAGATGCAGGGTACTACTTGACAAATCAAGTGTCGTTGAGTGGAACAAGACGAAATTGGAAAATAATCAATCTTAACGGGTGCGATATTCAGTTCGTGTTCGATGGGTCGTCCTCACGAAACTGTTTCCAAATGGGAGACTTCTCTGAAATATATGGAGGGACGCTCCTAAACAATACCGATCCTAGTAACTCAAATGGGGATGGCAGCTTTGATAATCCTGTGGCTGTAGGCACGACAGCTAATGTAGCAGCTAAAAACGTCAAGATTCATACACTAGAGATCTATCAGAATCTAGAGAAGACCTGCATAGGTATATGGGGAGCGTCACATGATATAGAGGTTGACAACATCTTCCTACGCAGCAGCGAAAGAGCCATTATAGGGGTCTTAGCTCATTGGGGGGTAGATACGGGCGATTTCACGACAGCTTCGGTTTCTTTGCATCCGTACAATTTGAAGATGAGTAATGTTACATGTAAAAACTTTTCGGGTCTAGCTGCGGACAGCTTCGCCATAGTCCTCAGTGGAGTTTACAACGTAACTGTAGACAACTTGACAGCAGAGAATATGATAGGAGGCTGCAAAGTGCAGCCAGGGACTGTGGGTAATTCGTTAGCTTCGGCAGAGGTTCGAGAGAAAATTCTAACTAATATCCGAGTTAACAACATTAATACATTCAATGTACAACAACCAGCGTTTGCAGATTGGTCAGGCGATGGGGTTGCTTGGAGCGGGGGTTCTTATGATATCGAATCAGACATTGAATTTGATGGGGTAAATGCTAATGAAAGTCCTACAGGTGGGACAGCTTTTATAGTGCAGCGTCTTTCTAATGTCACAGCAAAGAACTTGAGAATCAAGAACTTTTTCAGAGCGTTTCATGTCTTGGGTATAGATGGGGACGAGGCATCAGACGTAACAATTGACGACTTGAAAGCAGAGGATATTAAAACTATCGGTGGTTATGTATCTGGCGTTTATTGCAAGAGATTTAAGCTAACAAGCTCTGAAATTAAAGACTGTTCAGACGGAATTAGCACTATAGCGAATGAGTCTAGCTGTCTGCTGATAGAGAGTCCTGATTTTACTATAGAGAATACTAGACTAGGAGCTGATTCGAGCGAGGATGCTTATCGACTACTAGCTCTTACTGCGACAGCGACAGGTGGTTTAGTTAAAGGCTCTGAGTATAAAGACGTAAGGAGTGGGGGCTATCATCTATTCAATGATGTTCCGGTCACTACTCAAATAAATACTACAACCCCTGACGGTTTCAACATGCTATCTTCTAATGTAGTTCTAAGTAGATTGGATTACGTAGATGTTGGATTAAACCTCTCTAGTAATCAGTCTGTCTCGACCGGTGTATCTAGTACTCTGAACCTAGATAGTGTTGATCATGACTACTACAGTAACTACAGTTCGCTTGGGTTCCTTCCAAAAACAAGCTCTATGTATACGGTTGAAGGGCTAATAACGCTACGGGATGTATTAGGTGAAGGTACTGTGAACGTTGATGTTTACTCGGGATCTACGCGTATTAAAAGACTAGTATCAGAGAGCGTAAACCTCGACAGTTCAAGGAACGCTGGTGTGAAGCTTAGTGGGTCTTTTAAAGCGGAAGCTGGTTCAGTAATTACACTGAAACTAACTCAGGACATAGCCGCATCACTGGAGCTTGATTCAGACAACAACACAGGTACATGGGTAGATTTCAGGCAACTATGA

Genome Context

Tertiary structure

PDB ID

e4dd2dd567bfaed1834b8b53eb23500b3535410bb12023d1ff4bdc6fe53942c9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8098

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence