Protein

View in Explore

Genbank accession

WRQ08274.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,61

Protein sequence

MSLLTGAIPALYNGVSQQSPLVRSGDQLEAQLNGWSSLADGLQKRPPLEHIAALMPQAPTNAYTHEINRDAQHQYIVVVAGGRIRVFDLNGQERSVTAPGGWGYIEGLADYAEDISMLTVADYTFVVNRKKVCTMGALGEDLTADPNYFLWINSRHGTDGNYESFYPGAPYQYAPNPTGVLTGKVQAFDKLPTDTAPNGAIYRVWGSADNGFVSYYVRKSGAVWDETLKPGMVNAINSSTMPHALVRQLDGSFVFAPFSWAPRRMGDEDTNPNPAFIGRTINSVIFYQNRLGFLTDDSTVMSASGEFGNFWRSTVLDYIDSDPLEVAATTTEVAILKHALPFNDGVLLFSDQVQFSLSNGEDGLNATSVAIRPVTFYNVASRAAPVAIGSEAYFASEQAGWATIREYSRQADTDATSASDVTAHVRNYVPAGVHRIAGAADLNALFVLTDGAPTKVFVYQFYWVGGDQKAQSSWHEWDFGEGVRILSLSYIRGYLYALTARPDGLLLERVNLQRAARPAITQAQVFLDRQTVCQGAFNAQTQRTTFVLPYAPRKGRFRLVRGNAFGNRPMSAIDPTGYAWANDREVSVPGDEAAGPVVIGEQYTFRFQFSRIYARRSDGNAITTGRLQLRTITVNYRETGYFKTVVSPYGDAGPPEVVEVLPAKVAEFTGKVLGSADLILNRPSFAEGSYSFQVYGHADAASIVIENDSHVGSTFVSAEWEAFYWNRARV

Physico‐chemical properties

protein length:	730 AA
molecular weight:	80028,48110 Da
isoelectric point:	5,44310
aromaticity:	0,11781
hydropathy:	-0,19041

Domains

Domains [InterPro]

IPR058003
TTP
1–137

IPR058003 IPR058003

DC_1770
STR
1–730

DC_1770

WRQ08274.1

1 730

Architecture

STR

STR 1-730

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR058003	TTP	DC_0684	1	137	InterPro cluster	Tail tubular protein gp12	Central	High	Text match	1810 proteins / 1902 hits
DC_1770	STR	DC_1770	1	730	Novel HMM	DC_1770	Central	Low	Positional only	10 proteins / 10 hits
IPR058003	TTP	DC_0684	178	729	InterPro cluster	Tail tubular protein gp12	Central	High	Text match	1810 proteins / 1902 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WRQ08274.1

1 730

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	139	139	0,9913
Central domain	140	338	200	0,1971
C-terminal	339	730	391	0,2914

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-139

Central
140-338

C-terminal
339-730

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Mycobacterium phage jiawei [NCBI]	3079578	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Mycolicibacterium smegmatis [NCBI]	1772	cellular organisms > Bacteria > Bacillati > Actinomycetota > Actinomycetes > Mycobacteriales

Coding sequence (CDS)

Genbank protein accession

WRQ08274.1 [NCBI]

Genbank nucleotide accession

OR464703 [NCBI]

CDS location

range 14673 -> 16865
strand -

CDS

GTGAGCCTGCTGACCGGCGCCATCCCGGCTCTTTACAACGGGGTGTCGCAGCAGTCCCCCCTGGTTCGGTCGGGGGACCAACTGGAGGCCCAGCTCAATGGCTGGTCGTCTCTGGCGGACGGGCTTCAGAAGCGCCCGCCCTTGGAACACATCGCCGCCCTGATGCCCCAGGCGCCGACGAACGCCTACACCCACGAGATCAACCGCGACGCCCAGCACCAGTACATCGTGGTGGTGGCCGGGGGCCGCATCCGGGTCTTCGACCTGAACGGCCAGGAACGCTCGGTCACCGCGCCGGGCGGCTGGGGGTATATCGAGGGGCTCGCGGACTACGCCGAGGACATCTCGATGCTGACCGTGGCGGACTACACGTTCGTCGTGAACCGCAAGAAGGTCTGCACCATGGGCGCGCTCGGGGAAGACCTGACGGCTGACCCGAACTACTTCCTCTGGATCAACTCGCGCCACGGCACGGACGGCAACTACGAGAGCTTCTACCCCGGCGCCCCGTACCAGTACGCCCCGAACCCAACCGGCGTTCTGACCGGGAAGGTCCAGGCCTTCGACAAGCTGCCCACGGACACCGCCCCGAACGGCGCGATCTACCGGGTCTGGGGCTCGGCCGACAACGGCTTCGTCTCCTACTACGTCCGCAAGTCGGGCGCGGTGTGGGACGAGACCCTCAAGCCGGGCATGGTCAACGCCATCAACTCGTCCACCATGCCTCACGCCCTGGTCCGCCAGCTCGACGGCAGCTTCGTCTTCGCGCCCTTCTCGTGGGCGCCGCGCCGCATGGGCGACGAGGACACCAACCCGAACCCGGCCTTCATCGGTCGGACCATCAACTCGGTGATCTTCTACCAGAACCGGCTGGGCTTCCTGACCGACGACTCCACTGTGATGTCGGCGTCGGGGGAGTTCGGTAACTTCTGGCGCTCGACGGTCCTCGACTACATCGACAGCGACCCGCTGGAGGTAGCCGCGACCACGACCGAGGTGGCGATCCTGAAGCATGCCCTGCCGTTCAACGACGGCGTCCTGCTGTTCTCGGATCAGGTCCAGTTCTCGCTGTCCAACGGTGAGGACGGGCTCAACGCCACGTCCGTCGCGATCCGGCCGGTGACCTTCTACAACGTCGCCTCTCGGGCGGCGCCGGTCGCCATCGGCTCGGAGGCCTACTTCGCATCGGAGCAAGCGGGCTGGGCGACCATCCGCGAGTATTCCCGCCAAGCCGACACCGACGCCACCTCGGCGTCCGACGTGACGGCCCACGTCCGCAACTACGTCCCGGCCGGTGTCCACCGGATCGCTGGCGCGGCGGACCTGAACGCCCTGTTCGTCCTCACGGACGGCGCCCCGACCAAGGTCTTCGTCTATCAGTTCTACTGGGTCGGCGGGGATCAGAAGGCGCAGTCGTCCTGGCACGAGTGGGACTTCGGCGAGGGGGTCCGCATCCTGTCCCTGTCGTACATCCGAGGGTACCTCTACGCCCTCACGGCGAGGCCTGACGGTCTCCTGCTGGAGCGCGTCAACCTGCAACGGGCGGCCCGTCCGGCCATCACGCAGGCCCAGGTCTTCCTCGACCGGCAGACGGTGTGCCAGGGCGCCTTCAACGCCCAGACCCAGCGGACCACCTTCGTGCTGCCCTATGCCCCCCGCAAGGGGCGCTTCCGGCTGGTCCGAGGGAACGCCTTCGGCAACCGCCCGATGTCCGCCATCGACCCCACCGGCTACGCCTGGGCCAACGACCGTGAGGTCTCGGTTCCCGGCGACGAGGCGGCGGGGCCGGTCGTCATCGGGGAGCAGTACACCTTCCGCTTCCAGTTCAGCCGCATCTATGCGCGGCGCAGTGACGGCAACGCCATCACGACGGGCCGTCTGCAACTGCGGACGATCACCGTGAACTACCGGGAGACCGGCTACTTCAAGACCGTGGTCTCGCCCTATGGCGACGCCGGGCCTCCTGAGGTGGTCGAGGTGCTGCCCGCCAAGGTCGCTGAGTTCACCGGCAAGGTGCTTGGCTCGGCCGACCTGATCCTGAACCGACCGTCGTTCGCGGAGGGCTCGTACTCCTTCCAAGTGTACGGCCACGCAGACGCGGCCTCCATCGTCATCGAGAACGACAGCCACGTCGGATCGACCTTCGTGTCGGCCGAGTGGGAAGCGTTCTACTGGAACCGAGCCCGCGTATGA

Genome Context

Tertiary structure

PDB ID

9676b5f79090828a6086a5b21a449a6e276a92e6ec3ee0673545d77f9d103957

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8606

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence