Protein

View in Explore

Genbank accession

XUK81534.1 [GenBank]

Protein name

major capsid protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MPNLTKYSLDHEVRSSFEMGQLIPFLCQEVVPGDKYRVQSSTLVRLQPMLSPLMHRLDYFQRYYYVPYRLLIPNYEQLLTDPDSGNTVPGMDKYLQYSAKTFKDLFLEKPLLEYFGLATANGDVNPDKVIRDLNATPLLAYYLIYNHYYMRSDLDKRYIDQLRPEHFSSAELRQYIGNVMYVNEGLDYYTSAKTSTQYGNMVQLDMDGNNTITVPEMRLAERLQSFRERLMRVGGKYVNYIKEFFGVEPLDARVQIPKYLGGDSYVLNVSDVDQTAPSELGAVGESYGKSVSVNRTGQIEYDVYEHGLIIGLHFVRPRPSNIGGCPKLFTRRTYFDFFNPHFSALGYQEIEERELDVTRSKDGAFGYVPRYDEYRYGNDIVSGDFRRSLNYWHMSRDISKEQLSVDFVTCHPDNRVFSFENPDVVLYRVALRGAFIGLNSNVILDGYVWAPKGSLSIGSDVGFVMYKKSGSDPKFVFGGRLATMVEVSSGVFVKDSTVGIGDDESLVFRRLDDGETASNSFILDRHSTLFIYDSGNTDVGHLGDFSVLLSSNGSHPFLIDFSSTVSLSGDASGVLSLFKNGVSDFAKYLSFSHMSYKVAPYDVYKPVDNHVLSVTYNSVDVLRPLARYDGNVLR

Physico‐chemical properties

protein length:	634 AA
molecular weight:	72043,34130 Da
isoelectric point:	5,53415
aromaticity:	0,13091
hydropathy:	-0,29227

Domains

Domains [InterPro]

IPR037002
ATT
3–433

IPR037002

IPR016184
Unmapped
6–376

IPR016184

IPR003514
STR
201–411

IPR003514

XUK81534.1

1 634

Architecture

ATT

ATT 3-433 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR037002	ATT	IPR037002	3	433	Merged direct domain	Microviridae F protein superfamily	N-terminal	Low	Positional only	30 proteins / 30 hits
IPR016184	Unmapped	-	6	376	InterPro	Capsid/spike protein, ssDNA virus	-	-	-	-
IPR003514	STR	DC_0747	201	411	InterPro cluster	Microviridae F protein	Central	Low	Positional only	25 proteins / 34 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XUK81534.1

1 634

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	455	455	0,7733
Central domain	456	623	169	0,2001
C-terminal	624	634	10	0,8237

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-455

Central
456-623

C-terminal
624-634

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Microviridae sp. [NCBI]	2202644	Viruses > Monodnaviria > Sangervirae > Phixviricota > Malgrandaviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

XUK81534.1 [NCBI]

Genbank nucleotide accession

PV067918 [NCBI]

CDS location

range 1 -> 1905
strand +

CDS

ATGCCAAATCTAACTAAATATTCACTTGACCACGAAGTTCGGTCGAGTTTTGAGATGGGGCAACTCATCCCGTTTTTGTGCCAGGAAGTAGTTCCAGGCGATAAATATCGTGTTCAGTCTAGCACACTCGTGCGTCTTCAGCCTATGTTATCCCCGCTGATGCATAGACTTGATTACTTCCAGAGGTATTATTATGTGCCTTATCGTCTGTTGATACCTAACTATGAGCAGTTGCTTACTGATCCTGATAGCGGTAACACTGTGCCAGGTATGGATAAGTATCTTCAATACTCTGCTAAGACCTTTAAGGATTTGTTCCTTGAAAAACCTTTGCTGGAGTATTTTGGTCTCGCTACTGCTAATGGTGATGTTAATCCTGATAAGGTTATAAGGGATCTTAATGCGACTCCCCTACTTGCTTATTATCTGATTTACAATCATTATTATATGAGGTCAGACCTCGATAAGCGATATATTGATCAGTTGCGCCCTGAACACTTTAGTAGTGCCGAGTTGCGTCAGTATATTGGTAATGTTATGTATGTCAATGAAGGACTTGATTACTATACTTCGGCTAAGACCTCTACACAGTACGGCAATATGGTACAGCTGGATATGGACGGTAATAATACCATTACTGTACCAGAGATGCGTTTGGCTGAGCGTTTGCAGTCTTTCCGCGAGCGCCTTATGCGTGTTGGTGGTAAGTATGTGAACTATATTAAGGAGTTCTTCGGAGTCGAGCCGCTCGATGCCCGTGTTCAGATACCTAAGTATCTAGGCGGTGATTCGTATGTACTTAATGTGTCTGATGTTGACCAGACAGCGCCCTCTGAGCTTGGTGCCGTTGGTGAGTCTTATGGTAAGTCTGTTTCTGTTAATCGTACTGGCCAAATAGAGTACGATGTTTACGAACATGGTTTGATTATTGGTCTTCATTTTGTGCGTCCCCGTCCGTCAAATATAGGTGGCTGTCCTAAGCTATTTACTAGACGTACGTATTTCGATTTTTTCAATCCTCACTTCTCCGCCTTGGGTTATCAAGAGATAGAAGAGCGTGAGCTTGATGTTACTCGTTCTAAAGATGGTGCTTTCGGGTATGTCCCGAGGTATGACGAATACAGATACGGCAATGATATTGTTTCCGGAGACTTTAGACGATCGCTAAATTATTGGCATATGTCTCGAGATATCAGTAAGGAGCAGTTATCAGTTGATTTTGTTACTTGTCATCCTGATAATCGTGTGTTTTCTTTTGAGAATCCTGATGTAGTTCTTTATAGGGTTGCTTTGAGAGGTGCTTTTATTGGTTTGAATTCGAATGTTATTTTGGATGGTTATGTTTGGGCGCCTAAAGGTTCCTTGAGTATAGGTTCTGATGTTGGATTCGTTATGTATAAGAAATCTGGCTCTGATCCTAAGTTTGTTTTTGGTGGTCGACTTGCTACTATGGTTGAGGTTTCTTCAGGAGTATTTGTTAAGGATTCTACTGTTGGTATAGGTGATGATGAATCTCTTGTTTTTCGTCGTTTGGACGATGGTGAGACAGCTTCTAATAGTTTCATATTGGATCGTCATTCAACCTTATTTATTTATGATTCAGGTAATACAGATGTAGGTCATTTGGGTGATTTTTCTGTTTTACTTTCTTCAAATGGTTCACATCCGTTTTTGATTGATTTTTCAAGTACTGTTTCTTTGTCTGGTGATGCTTCCGGTGTTTTATCTTTGTTTAAGAATGGTGTTTCAGACTTTGCTAAGTATTTATCTTTCAGTCATATGTCTTATAAGGTCGCTCCTTATGATGTGTATAAGCCAGTAGATAATCACGTATTGTCAGTGACTTATAATAGTGTTGATGTTCTTCGTCCGCTGGCTCGTTATGACGGTAATGTTTTAAGGTGA

Genome Context

Tertiary structure

PDB ID

c3a4ec99b057fe5abe7fa9e88fe2f78846abd61ec8781cb2762846f984fab62f

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4018

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence