Protein

View in Explore

Genbank accession

QHB48424.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,91

Protein sequence

MQTIERGGYTREQILDVLHAKNNTRKVRFRYDLLDKNENYIKTLDCVLEGEVEMSAFSTIKRTAKFKIKENYIPEHIERVTSQVKSYSESTFTSGTHSGTVATGSSPFDGGSWVRITTPNINLLTTDESTFGTATWTSGQPHPAWDAWGATRGTFNYTTTSLGGMAQLITRTGANSLGIDLKRRNISVTAGERLYLSFFFRPYNDPNGNFAVPSYCYIMHNDGQGNLWIGDTNHNGGYTITDLGDGWYRFDGAVNADRTDTVGILIAWYAGTDGGVIIDNIYFGKVAPTWSAQWVSEVIDISDSRNTKAVNSRVGFQVQTPSYATAKLESRVSTDGGTTWGAWTTEINGAQLSSLPYGTDLANAQIQFRFTFTRRNIIDFVGADNLSFTIDGEYDVIVPETTEINYLSDRIQPYMEIQMPDGNWIDFPLGIFLLSTPTKRDENNGVYREIEAYDGLIILNDDKFTSRYYIPAGKKYTDAVIEILMSAGISKFNITDSSKTLSAPIEFAIGTSKLEAINSLLKAINYTQIWVDARGYFTASPYVSPSEKAVDYEYLDDELSVIYNGIEEELDFFGVPNVWVVTQSNPEKTPLVSTKINDNPDSPTSTVNVGRNIVDFREVDDIADQATLDAYTERIAFEASQVFGRLRFKTALMPFHEYMDVLRVKYDPLKIDDKFSEVGWKMTLRAGGEMEHEVRKVVSI

Physico‐chemical properties

protein length:	700 AA
molecular weight:	78410,60320 Da
isoelectric point:	4,84572
aromaticity:	0,11571
hydropathy:	-0,33829

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QHB48424.1

1 700

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	83	83	0,7267
Central domain	84	319	237	0,7162
C-terminal	320	700	380	0,2995

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-83

Central
84-319

C-terminal
320-700

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Geobacillus phage GBK1 [NCBI]	2686286	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Geobacillus kaustophilus [NCBI]	1462	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

QHB48424.1 [NCBI]

Genbank nucleotide accession

MN727882 [NCBI]

CDS location

range 16748 -> 18850
strand +

CDS

ATGCAAACGATTGAGAGAGGAGGTTACACTCGAGAGCAGATTCTTGACGTATTACATGCCAAGAACAACACCAGAAAAGTACGATTTCGTTATGACTTACTCGACAAAAATGAAAACTATATTAAGACGCTTGATTGTGTGCTTGAGGGGGAGGTTGAAATGTCAGCCTTCTCCACTATCAAGCGCACAGCAAAGTTTAAGATAAAAGAAAATTACATTCCAGAGCATATTGAGCGAGTAACTTCTCAAGTAAAATCTTACTCAGAAAGTACCTTCACGAGTGGGACTCACTCTGGGACAGTTGCAACAGGGAGCTCTCCTTTTGACGGAGGCAGTTGGGTACGAATTACAACTCCAAACATTAACCTCTTAACAACAGATGAGTCCACTTTTGGAACAGCAACATGGACGAGTGGGCAACCTCACCCAGCTTGGGACGCATGGGGTGCCACTCGAGGAACTTTTAACTATACAACTACTTCATTAGGTGGCATGGCTCAATTGATTACTCGAACAGGAGCCAACTCGCTTGGTATTGATTTAAAACGAAGAAATATTTCAGTGACCGCAGGAGAAAGATTGTATCTCTCCTTCTTCTTTAGACCATACAACGACCCTAATGGTAACTTTGCTGTCCCGAGTTATTGCTACATTATGCACAACGATGGACAGGGAAACCTTTGGATAGGTGACACAAACCATAACGGAGGTTATACAATTACTGATTTAGGAGACGGTTGGTATCGTTTTGATGGAGCAGTCAACGCAGACAGAACGGACACCGTTGGAATTTTGATTGCTTGGTACGCAGGAACAGATGGAGGAGTCATTATTGACAACATTTACTTTGGAAAGGTAGCCCCTACATGGTCGGCTCAATGGGTAAGTGAAGTCATTGACATTAGTGACTCACGTAATACTAAAGCAGTCAACTCAAGAGTGGGCTTTCAAGTCCAGACACCAAGCTACGCAACAGCAAAACTCGAGTCGAGAGTCTCCACAGATGGAGGAACTACGTGGGGAGCTTGGACGACTGAAATAAATGGAGCTCAGCTCTCTAGCCTTCCTTATGGAACCGACCTCGCTAATGCTCAAATACAGTTTCGCTTTACTTTCACGAGACGCAATATAATTGACTTTGTGGGAGCCGACAATCTCTCCTTTACTATTGACGGAGAGTATGATGTGATTGTCCCAGAAACCACAGAGATTAACTACCTCAGTGACCGCATTCAACCTTATATGGAAATTCAAATGCCAGACGGTAATTGGATTGACTTCCCTCTCGGTATTTTCCTCCTCTCCACTCCTACCAAGAGAGACGAGAATAATGGAGTCTACCGTGAGATTGAAGCATATGACGGTCTCATTATTCTCAATGACGACAAATTCACCTCTCGCTATTACATTCCAGCAGGAAAAAAATACACTGACGCAGTGATTGAAATTCTCATGAGCGCAGGAATAAGCAAATTCAACATAACAGACAGCTCCAAAACGCTCTCAGCTCCTATTGAGTTTGCCATTGGAACAAGCAAACTCGAGGCGATTAACTCCTTGCTTAAAGCCATTAACTATACGCAAATATGGGTTGACGCTCGAGGATATTTTACAGCTTCCCCTTATGTCTCTCCTTCCGAGAAGGCAGTTGACTATGAATACCTCGACGACGAGCTTTCCGTTATTTACAACGGTATCGAGGAGGAGTTGGACTTCTTTGGAGTCCCTAATGTGTGGGTTGTTACTCAGTCAAACCCAGAAAAAACACCTCTCGTAAGTACAAAGATAAATGACAACCCAGACTCTCCTACTTCAACGGTCAATGTCGGTAGGAACATTGTGGATTTCAGAGAAGTTGATGACATAGCAGACCAAGCAACGCTCGACGCTTACACAGAGCGTATAGCTTTCGAGGCTTCTCAAGTGTTTGGTCGATTGCGCTTTAAAACAGCTCTTATGCCATTCCATGAGTATATGGACGTTTTGAGGGTTAAATATGACCCTCTCAAGATAGATGACAAATTCAGCGAGGTAGGCTGGAAAATGACCCTCCGAGCTGGAGGCGAGATGGAGCATGAAGTGAGAAAGGTGGTAAGCATATGA

Genome Context

Tertiary structure

PDB ID

dc31dbb66e673b10fb6e6656fb782fe4b707727ceccc171e235e8ad5bb6588b4

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8438

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence