Protein

View in Explore

Genbank accession

YP_009832824.1 [GenBank]

Protein name

minor head protein

RBP type

Evidence RBPdetect2

Probability 0,84

Protein sequence

MIHVLDFNDKIIDFLSTDDPSLVRAIHKRNVNDNSEMLELLISSERAEKFRERHRVIIRDSNKQWREFIINWVQDTMDGYTEIECIASYLADITTAKPYAPGKFEKKTTSEALKDVLSDTGWEVSEQTEYDGLRTTSWTSYQTRYEVLKQLCTTYKMALDFYIELSSNTVKGRYVVLKKKNSLFKGKEIEYGKDLVGLTRKIDMSEIKTALIAVGPENDKGKRLELVVTDDEAQSQFNLPTRYIWGIYEPQSDDQNMNETRLRSLAKTELNKRKSAVMSYEITSTDLEVTYPHEIISIGDTVRVKHRDFNPPLYVEAEVIAEEYNIISENSTYTFGQPKEFKESELREEFNKRLNIIHQKLNDNISNINTIVKDVVDGELEYFERKIHKNDTPPENPVNDMLWYDTSNPDVAVLRRYWNGRWIEATPNDVEKLGGITREKALFSELNNIFINLSIQHASLLSEATELLNSEYLVDNDLKADLQASLDAVIDVYNQIKNNLESMTPETATIGRLVDTQALFLEYRKKLQDVYTDVEDVKIAISDRFKLLQSQYTDEKYKEALEIIATKFGLTVNEDLQLVGEPNVVKSAIEAARESTKEQLRDYVKTSDYKTDKDGIVERLDTAEAERTTLKGEIKDKVTLNEYRNGLEEQKQYTDDQLSDLSNNPEIKASIEQANQEAQEALKSYIDAQDDLKEKESQAYADGKISEEEQRAIQDAQAKLEEAKQNAELKARNAEKKANAYTDNKVKESTDAQRRTLTRYGSQIIQNGKEIKLRTTKEEFNATNRTLSNILNEIVQNVTDGTTIRYDDNGVAQALNVGPRGIRLNADKIDINGNREINLLIQNMRDKVDKTDIVNSLNLSREGLDINVNRIGIKGGNNNRYVQIQNDSIELGGIVQRTWKGKRSTDDIFTRLKDGHLRFRNNTAGGSLYMSHFGISTYIDGEGEDGGSSGTIQWWDKTYSDSGMNGITINSYGGVVALTSDNNRVVLESYASSNIKSKQAPVYLYPNTDKVPGLNRFAFTLSNADNAYSSDGYIMFGSDENYDYGAGIRFSKERNKGLVQIVNGRYATGGDTTIESGMGKFNLVKRRDGNSYVSIQSYDLLAVGSDNAGDRVASNSIYKRTYSAPANLHITSAGTIGRATSAKKYKISIENQYINEDDQFSHSKEILKLPIRTWFDKYESEIMAKELESGKKLSDDTFKLSRHTGLIAEEVEELGFNEFVIYDDNGEIEGIAYDRLWVHLIPIIKNQQSKIEKLEELINE

Physico‐chemical properties

protein length:	1260 AA
molecular weight:	143389,15140 Da
isoelectric point:	5,05096
aromaticity:	0,08095
hydropathy:	-0,67810

Domains

Domains [InterPro]

DC_0109
STR
1–639

DC_0109 Coil Coil IPR030392

IPR007119
Unmapped
25–336

IPR007119 DC_0536

IPR010572
ENZ
93–332

IPR010572

YP_009832824.1

1 1260

Architecture

STR

STR 1-639 | STR 695-1260

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0109	STR	DC_0109	1	639	Novel HMM	DC_0109	Central	Low	Positional only	88 proteins / 88 hits
IPR007119	Unmapped	-	25	336	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
IPR010572	ENZ	DC_0675	93	332	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
Coil	Unmapped	-	668	698	Coils	Coil	-	-	-	-
DC_0536	STR	DC_0536	695	1260	Novel HMM	DC_0536	Central	Low	Positional only	114 proteins / 114 hits
Coil	Unmapped	-	706	744	Coils	Coil	-	-	-	-
IPR030392	CHP	DC_0088	1141	1258	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Staphylococcus phage IME1361_01 [NCBI]	1965490	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Staphylococcus aureus [NCBI]	1280	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

YP_009832824.1 [NCBI]

Genbank nucleotide accession

NC_048657 [NCBI]

CDS location

range 32833 -> 36615
strand +

CDS

GTGATACATGTTTTAGATTTTAACGACAAGATTATAGATTTCCTTTCTACTGATGACCCTTCCTTAGTTAGAGCGATTCATAAACGTAATGTTAATGACAATTCAGAAATGCTTGAACTGCTCATATCATCAGAAAGAGCTGAAAAGTTCCGTGAACGACATCGTGTTATTATAAGGGATTCAAACAAACAATGGCGTGAATTTATTATTAACTGGGTTCAAGATACGATGGACGGCTACACAGAGATAGAATGTATAGCGTCTTATCTTGCTGATATAACAACAGCTAAACCGTATGCACCAGGCAAATTTGAGAAAAAGACAACTTCAGAAGCATTGAAAGATGTGTTGAGCGATACAGGTTGGGAAGTTTCTGAACAAACCGAATACGATGGCTTACGTACTACGTCATGGACTTCTTATCAAACTAGATATGAAGTTTTAAAGCAATTATGTACAACCTATAAAATGGCATTGGATTTTTATATAGAGCTTAGTTCTAATACCGTCAAAGGTAGATATGTGGTACTCAAAAAGAAAAACAGCTTATTCAAAGGTAAAGAAATTGAGTATGGTAAAGATTTGGTTGGGTTAACTAGGAAGATTGATATGTCAGAAATCAAAACAGCATTAATTGCTGTGGGACCCGAAAATGACAAAGGAAAGCGTTTAGAGTTAGTTGTGACTGATGACGAAGCACAAAGTCAATTCAACTTACCTACCCGTTATATTTGGGGAATATACGAACCTCAATCAGATGATCAAAATATGAATGAAACACGGTTGCGTTCTTTAGCCAAAACAGAGTTAAATAAACGTAAGTCGGCAGTTATGTCATATGAGATTACTTCTACTGATTTGGAAGTTACGTATCCGCACGAGATTATATCAATTGGTGATACAGTCAGAGTAAAACATAGAGATTTTAACCCGCCATTGTATGTAGAGGCAGAAGTTATTGCCGAAGAATATAACATAATTTCAGAAAATAGCACATATACATTCGGTCAACCTAAAGAGTTCAAAGAATCAGAATTACGAGAAGAGTTTAACAAACGATTGAACATAATACATCAAAAGTTAAACGATAATATTAGCAATATCAACACTATAGTTAAAGATGTTGTAGATGGTGAATTAGAATACTTTGAACGCAAAATACACAAAAATGATACACCGCCAGAAAATCCAGTCAATGATATGCTTTGGTATGATACAAGTAACCCTGATGTTGCTGTCTTGCGTAGATATTGGAATGGTCGATGGATTGAAGCAACACCAAATGATGTTGAAAAATTAGGTGGTATAACAAGAGAGAAAGCGCTATTCAGTGAATTAAACAATATTTTTATTAATTTATCTATACAACACGCTAGTCTTTTGTCAGAAGCTACAGAATTACTGAATAGCGAGTACTTAGTAGATAATGATTTGAAAGCGGACTTACAAGCAAGTTTAGACGCTGTGATTGATGTTTATAATCAAATTAAAAATAATTTAGAATCTATGACACCCGAAACTGCAACGATTGGTCGGTTGGTAGATACACAAGCTTTATTTCTTGAGTATAGAAAGAAATTACAAGATGTTTATACAGATGTAGAAGATGTCAAAATCGCTATTTCAGATAGATTTAAATTATTACAGTCACAATACACTGATGAAAAATATAAAGAAGCGTTGGAAATAATAGCAACAAAATTTGGTTTAACGGTGAATGAAGATTTGCAGTTAGTCGGAGAACCTAATGTTGTTAAATCAGCTATTGAAGCAGCTAGAGAATCCACAAAAGAACAATTACGTGACTATGTAAAAACATCGGACTATAAAACAGACAAAGACGGTATTGTTGAACGTTTAGATACTGCTGAAGCTGAGAGAACGACTTTAAAAGGTGAAATCAAAGATAAAGTTACGTTAAACGAATATCGAAACGGATTGGAGGAACAAAAACAATATACTGATGACCAGTTAAGTGATTTGTCCAATAATCCTGAGATTAAAGCAAGTATTGAACAAGCAAATCAAGAAGCGCAAGAAGCTTTAAAATCATACATTGATGCTCAAGATGATCTTAAAGAGAAGGAATCGCAAGCGTATGCTGATGGTAAAATTTCGGAAGAAGAGCAACGCGCTATACAAGATGCTCAAGCTAAACTTGAAGAGGCAAAACAAAACGCAGAACTAAAGGCTAGAAACGCTGAAAAGAAAGCTAATGCTTATACAGACAACAAGGTCAAAGAAAGCACAGATGCACAGAGGAGAACACTGACTCGCTATGGTTCTCAAATTATACAAAATGGTAAGGAAATCAAATTAAGAACTACTAAAGAAGAGTTTAATGCAACCAATCGTACACTTTCAAATATATTAAACGAGATTGTCCAAAACGTTACAGATGGAACAACAATCAGATATGATGATAACGGAGTGGCTCAAGCTTTAAATGTGGGGCCACGTGGTATTAGATTAAATGCTGATAAAATTGATATTAACGGTAATAGAGAAATAAACCTTCTTATCCAAAATATGCGAGATAAAGTAGATAAAACCGATATTGTCAACAGCCTTAATTTATCAAGAGAGGGTCTTGATATCAATGTTAATAGAATTGGAATTAAAGGCGGTAACAATAACAGATATGTTCAAATACAGAATGATTCTATTGAACTAGGTGGTATTGTGCAACGAACTTGGAAAGGCAAACGATCAACCGATGATATATTCACACGTCTTAAAGATGGACATCTAAGGTTTAGAAATAATACCGCAGGCGGTTCACTTTATATGTCACATTTTGGTATTTCAACATATATTGATGGAGAAGGCGAAGACGGAGGTTCATCCGGTACTATTCAATGGTGGGATAAAACTTACAGTGATAGCGGTATGAATGGCATAACAATCAATTCCTATGGTGGTGTCGTTGCACTAACGTCAGATAATAATCGGGTTGTTCTGGAGTCTTACGCTTCATCGAATATCAAAAGCAAACAGGCACCGGTGTATTTATATCCAAACACAGACAAAGTGCCTGGATTAAACCGATTTGCATTCACGCTGTCTAATGCAGATAATGCTTATTCGAGTGACGGTTATATTATGTTTGGTTCTGATGAGAACTATGATTACGGTGCGGGTATCAGGTTTTCTAAAGAAAGAAATAAAGGTCTTGTTCAAATTGTTAATGGACGATATGCTACAGGCGGAGACACTACAATTGAATCAGGTATGGGCAAATTCAACTTAGTTAAACGAAGAGATGGAAATAGTTACGTTAGCATTCAAAGTTATGATTTATTGGCGGTAGGTTCTGATAATGCTGGCGATAGAGTCGCTTCTAATTCTATTTATAAGCGTACTTATTCAGCACCTGCTAACTTACACATTACTTCTGCTGGAACAATTGGGCGTGCTACTTCTGCCAAAAAGTATAAAATTTCAATTGAAAACCAATACATCAATGAAGACGATCAGTTCAGTCATTCAAAAGAGATTTTAAAGCTTCCAATTCGTACATGGTTTGACAAATATGAATCGGAAATAATGGCTAAAGAATTGGAAAGTGGTAAAAAGTTATCTGATGATACTTTTAAACTTAGTCGACATACTGGCTTAATAGCGGAAGAGGTTGAAGAATTAGGATTTAATGAATTTGTTATTTATGATGACAACGGAGAAATCGAAGGTATCGCATACGATAGACTTTGGGTTCATTTAATACCTATTATTAAAAACCAGCAATCAAAAATCGAAAAACTGGAGGAATTAATAAATGAATGA

Genome Context

Tertiary structure

PDB ID

c756c73264cd3b10acf5e4104758c1eed5a744bd9b661a7a0e154d8a36c4198f

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3141

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Analysis of active prophages from bacterial high-throughput sequencing data	Sun,Q., Zhang,X., Xing,S. and Tong,Y.-G.	2018-12-28	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature