Protein

View in Explore

Genbank accession

QIR31073.1 [GenBank]

Protein name

putative tail protein VP1

RBP type

TSP

Evidence RBPdetect

Probability 0,53

Protein sequence

MAYTSKLKEWGAVAEERSEFPDGYRYTKENPPVTHYDNFLVHNLIEDVQHLVDLTNAIDPDNDGQVADAETVQGNTPEQLGGFQYVQGTNPDVGNKGTTWLKNTSNLLFVSDGERYDIEPETGYDETHDFSGSEGFWLTHETPARTRLDAGSLKLINEQVVADFNSGISPDHGAWSWSSTSGISHDSANGRAEITSSGDATTPQLQRDVPVAQDIEFTFTVSEDTANINDESIIRLDDENGNRELEIQFNDGAGNVSLSDGTELLSSWTAGQTYVFEVDPDFGAGTVDVVIDGQTIISGRPMDATGISNIWFGSKTTDSGSVRSVFVDNVHTGAREYGEVVVSCPEPDSRIEGWDLLRFDRTMAGESVVVDVEDETGTTLVSDIQSNEDLSVAIDAATNPQIRVTFSREDTTNNPSFDYLYRRWSLRPGDNGVNIRAFGSGGEDNVHEINFTAPVTKNEDGRVTVDLDPRYVNETGDSMSGDLDVNASVQVGDDLVLDDDDGQQFIVVGKDSDTLTIAESGGSEFEQMDVNARKFTKQGHEVWHEGNRAYQVRKNNFISVKLSRR

Physico‐chemical properties

protein length:	565 AA
molecular weight:	62053,23080 Da
isoelectric point:	4,23100
aromaticity:	0,08142
hydropathy:	-0,59664

Domains

Domains [InterPro]

DC_0289
ATT
1–190

DC_0289 IPR013320 DC_0290

QIR31073.1

1 565

Architecture

ATT

STR

RBD

ATT 1-190 | STR 201-385 | RBD 386-565

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0289	ATT	DC_0289	1	190	Novel HMM	DC_0289	N-terminal	Low	Positional only	29 proteins / 29 hits
IPR013320	STR	IPR013320	201	385	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
DC_0290	RBD	DC_0290	385	565	Novel HMM	DC_0290	C-terminal	Low	Positional only	29 proteins / 29 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QIR31073.1

1 565

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	213	213	0,7070
Central domain	214	412	200	0,0984
C-terminal	413	565	152	0,3197

Note: Constraints were applied during segmentation.
Fixed 56 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-213

Central
214-412

C-terminal
413-565

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Halorubrum virus Hardycor2 [NCBI]	2721756	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Halorubrum coriense [NCBI]	64713	cellular organisms > Archaea > Methanobacteriati > Methanobacteriota > Stenosarchaea group > Halobacteria

Coding sequence (CDS)

Genbank protein accession

QIR31073.1 [NCBI]

Genbank nucleotide accession

MN901520 [NCBI]

CDS location

range 24950 -> 26647
strand +

CDS

ATGGCGTACACTTCTAAACTCAAGGAATGGGGAGCCGTCGCTGAGGAGCGTTCGGAGTTCCCCGATGGGTACAGGTACACGAAGGAAAACCCGCCCGTCACGCACTACGACAACTTCCTCGTACACAATCTCATCGAGGATGTTCAGCACCTCGTTGACCTCACGAACGCAATCGACCCCGATAACGACGGGCAGGTTGCTGACGCCGAGACGGTTCAGGGGAACACCCCGGAACAGCTTGGTGGCTTCCAGTACGTTCAGGGAACTAATCCCGACGTTGGAAACAAGGGGACGACGTGGCTGAAGAACACCTCGAATCTTCTGTTCGTCTCTGACGGAGAGCGGTACGATATTGAGCCTGAGACGGGCTACGACGAGACGCACGACTTCAGCGGCTCCGAAGGCTTTTGGCTGACCCACGAGACTCCGGCGAGAACCCGACTCGATGCGGGGAGTCTCAAGCTCATCAACGAGCAGGTCGTCGCTGACTTCAACTCTGGTATCTCTCCAGACCACGGAGCGTGGTCGTGGAGTAGCACTTCGGGCATTAGCCACGACTCGGCAAACGGCAGAGCCGAGATTACTTCGAGTGGAGACGCAACGACGCCTCAGCTCCAGCGGGACGTTCCGGTGGCTCAGGATATTGAGTTCACCTTCACGGTGTCGGAAGACACGGCGAACATCAACGACGAGTCTATCATCCGGCTTGACGACGAGAACGGAAATCGTGAGCTGGAGATTCAGTTTAACGATGGTGCTGGAAACGTCTCTCTGAGTGACGGCACGGAACTTCTCTCGTCGTGGACTGCCGGGCAGACCTACGTGTTCGAGGTTGACCCCGACTTCGGGGCTGGAACCGTTGATGTGGTAATCGACGGTCAGACTATTATCAGCGGTCGCCCGATGGATGCGACCGGCATCTCGAACATCTGGTTTGGCTCGAAGACCACGGATTCCGGTTCTGTCCGTAGTGTATTCGTGGATAATGTCCACACCGGAGCGAGAGAGTACGGCGAGGTCGTCGTGTCTTGCCCGGAACCGGATTCACGCATCGAGGGGTGGGACTTGCTCCGCTTCGACCGAACGATGGCCGGAGAAAGCGTCGTCGTTGACGTGGAAGACGAGACGGGTACTACGCTCGTCTCTGATATTCAGTCGAACGAAGACCTTTCGGTGGCTATTGACGCGGCGACGAACCCACAGATTCGAGTTACGTTCTCTCGGGAAGATACGACGAACAACCCATCGTTCGACTACCTCTACCGTCGCTGGAGCCTCCGGCCCGGAGACAACGGTGTGAACATCCGGGCCTTCGGCTCTGGTGGCGAGGACAACGTTCACGAAATCAACTTCACGGCCCCCGTTACGAAAAACGAAGATGGTCGTGTGACAGTTGACCTCGACCCGAGATACGTCAACGAGACGGGCGACTCGATGAGTGGCGACCTCGATGTGAACGCGAGCGTCCAAGTCGGTGACGACCTCGTTCTTGACGACGATGATGGACAGCAGTTTATCGTGGTCGGAAAGGACTCGGATACCCTCACGATTGCGGAATCTGGAGGTTCTGAGTTTGAGCAGATGGACGTGAACGCGCGGAAGTTCACGAAGCAGGGACACGAAGTTTGGCACGAAGGGAATCGGGCCTATCAGGTTCGGAAAAACAACTTCATTAGTGTAAAACTTTCACGGAGATAA

Genome Context

Tertiary structure

PDB ID

5a9acd176b6099d43c221b5ed845b1c989d02407099ccaff51cb8a6bd5d2c742

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6635

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence