Protein

View in Explore

Genbank accession

AIR93428.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect2

Probability 0,93

Protein sequence

MAKLGISTGTTPNDGSGDSLLDGAVKVNSNFDEVYNKIGDGTDLFVGIVSSITVSGPLSISTTFGAPVITGLANTANINATNFQVTGVGTITGTTRLAGINTFSAAGYTVAGLVTASNIISNETIKVAGIVTTSEDGINVSAAVTARSLAIQDVTQTSHFVGLNTVFIDHTGVGATAINITDTATIGFGSISSANITTINANTANINSGILTTATVGTAITIHSKGIDAGQAGIITASRLFGAVTGAVTGTASSATEADLAYGLTGTPSIVVGVATLGGHIFNAPGAFISGILTATSFSVGTNEIVSSARQLKNIATLDATTKLTIENAISDPPNDFDDLNVVGLATVNRLFISGDTRGLNILGVTTGLSAPGITTLGIITGATSLQATDVYSNFLHGDGSNISNVTGGVTVQDEGSALSTVATTLNFVGSGVVASGSGATKTITISGGGGGGSIAGISTTGTSGFNQLNVTGVSTFGANIDLNANIDVSGSSTLHNGLVVNGGIVDINHQIVGLATDNVIPFYYANVSDFPSASTYHGAVAHGHNTGLLYFAHAGAWLELVSKDSSGVVNKIVVGAAVTIDQNNIDTVGIITASEFHGDGSNLTGITGSTVAGISTTGTSGFNQLSISGVSTFTGNIDANGALDVDGQTDLDVVNVAELATFSSRVQVGTGLTLDQNNIDAGSYVGIITAKEFHGDGTNVATSRWAVTNASSNHYVFNGPGNLVNANDPTIYLARGQKYEFDINASGHPFRIQTSSGASGYNSGNEYTTGITNVGAASSLLTFDVPFDANNTLYYVCQNHSSMNGTIIIYPSI

Physico‐chemical properties

protein length:	814 AA
molecular weight:	81821,29990 Da
isoelectric point:	4,48951
aromaticity:	0,06143
hydropathy:	0,24988

Domains

Domains [InterPro]

DC_0533
ATT
1–65

DC_0533 DC_0856

IPR036240
STR
2–44

IPR036240 IPR008972

IPR008987
ATT
6–41

IPR008987 IPR008972

G3DSA:1.20.5.960
Unmapped
13–42

G3DSA:1.20.5.960

AIR93428.1

1 814

Architecture

ATT

STR

ATT 1-65 | STR 569-814

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0533	ATT	DC_0533	1	65	Novel HMM	DC_0533	N-terminal	Low	Positional only	23 proteins / 23 hits
IPR036240	STR	IPR036240	2	44	Merged direct domain	Gp9-like superfamily	Central	Low	Positional only	146 proteins / 146 hits
IPR008987	ATT	DC_0752	6	41	InterPro cluster	Baseplate structural protein Gp9/Gp10, N-terminal domain	Central	Medium	Text match	242 proteins / 243 hits
G3DSA:1.20.5.960	Unmapped	-	13	42	Gene3D	Bacteriophage t4 gene product 9 (gp9)	-	-	-	-
DC_0856	STR	DC_0856	569	814	Novel HMM	DC_0856	Central	Low	Positional only	26 proteins / 26 hits
IPR008972	STR	IPR008972	699	810	Merged direct domain	Cupredoxin	Central	Low	Positional only	3 proteins / 3 hits
IPR008972	STR	IPR008972	729	812	Merged direct domain	Cupredoxin	Central	Low	Positional only	3 proteins / 3 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AIR93428.1

1 814

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	162	162	0,6173
Central domain	163	509	348	0,4500
C-terminal	510	814	304	0,3983

Note: Constraints were applied during segmentation.
Fixed 10 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-162

Central
163-509

C-terminal
510-814

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Prochlorococcus phage P-TIM68 [NCBI]	1542477	Uroviricota > Caudoviricetes > Pantevenvirales > Haifavirus > Haifavirus tim68
Host	Prochlorococcus sp. [NCBI]	1220	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

AIR93428.1 [NCBI]

Genbank nucleotide accession

KM359505 [NCBI]

CDS location

range 75788 -> 78232
strand +

CDS

ATGGCTAAATTAGGAATTAGTACAGGAACCACGCCCAATGATGGATCAGGTGACAGTCTGTTGGATGGTGCTGTTAAGGTTAATTCAAATTTTGATGAAGTCTATAATAAAATAGGAGATGGGACAGATTTATTTGTTGGAATTGTTAGTTCTATTACTGTATCAGGACCTTTAAGTATAAGCACTACTTTTGGTGCACCTGTCATAACTGGATTAGCAAACACTGCAAATATAAATGCAACCAACTTTCAAGTAACTGGTGTAGGAACAATAACAGGAACAACAAGGTTGGCAGGTATCAATACATTCTCTGCTGCTGGATATACTGTGGCAGGTTTAGTAACTGCGAGTAATATAATATCAAATGAGACTATTAAGGTAGCAGGTATAGTTACAACATCTGAAGATGGTATAAATGTATCAGCTGCTGTAACTGCTAGATCACTAGCAATTCAGGATGTAACTCAAACCTCTCATTTTGTTGGTTTAAACACTGTATTCATAGATCATACTGGTGTTGGTGCTACTGCTATCAATATAACTGACACTGCAACCATAGGATTTGGATCTATATCTAGTGCAAACATCACTACTATAAATGCAAACACAGCAAATATAAACAGTGGTATATTAACAACTGCCACAGTTGGAACAGCAATTACTATACATTCAAAAGGAATTGATGCAGGTCAAGCTGGTATCATAACTGCAAGTAGATTATTTGGTGCTGTAACTGGTGCTGTAACTGGAACAGCATCCTCTGCTACTGAAGCAGACTTAGCATATGGGTTAACAGGAACACCTAGCATTGTTGTAGGTGTTGCAACTCTTGGTGGACATATATTCAATGCACCTGGTGCCTTTATATCAGGTATTCTTACTGCTACTTCATTCTCTGTTGGTACTAATGAGATTGTAAGTAGTGCTAGACAATTAAAAAATATAGCAACCTTAGATGCTACAACCAAACTTACAATAGAAAATGCCATATCTGATCCTCCAAATGATTTTGATGATTTAAATGTAGTAGGTCTTGCCACTGTCAATAGATTGTTCATAAGTGGAGATACAAGAGGTTTAAACATTCTTGGTGTCACCACTGGTTTAAGTGCACCAGGTATTACAACTCTTGGTATTATTACAGGTGCCACATCATTACAGGCAACTGATGTTTATTCAAACTTTTTACATGGTGATGGATCTAATATCTCAAATGTCACTGGTGGTGTTACTGTTCAAGATGAAGGAAGTGCATTATCAACTGTTGCAACCACATTAAACTTTGTAGGATCTGGTGTAGTGGCATCTGGATCTGGTGCGACTAAAACAATTACTATCTCTGGTGGTGGAGGTGGTGGTAGTATTGCTGGTATCAGTACTACAGGAACATCTGGATTCAATCAACTCAATGTAACTGGGGTATCAACCTTTGGTGCTAATATTGATCTCAATGCAAATATAGATGTCAGTGGATCATCAACTCTTCATAATGGATTGGTTGTAAATGGTGGTATTGTTGATATTAATCATCAGATAGTTGGTCTTGCAACAGACAATGTAATTCCATTCTACTATGCTAATGTAAGTGATTTCCCATCTGCATCTACATATCATGGTGCAGTTGCTCATGGACATAATACTGGTTTACTATATTTTGCACATGCTGGTGCTTGGTTAGAATTAGTCAGTAAAGATAGTAGTGGAGTGGTCAATAAGATTGTAGTTGGTGCTGCTGTTACTATTGATCAAAATAATATTGATACTGTAGGAATTATAACTGCTTCTGAATTTCATGGTGATGGTTCAAACTTAACTGGTATCACTGGTTCAACTGTTGCAGGTATCAGCACTACAGGAACATCTGGATTTAATCAACTAAGTATTTCTGGAGTTTCCACATTTACAGGTAATATAGATGCTAATGGTGCCTTAGATGTTGATGGACAAACTGATTTAGATGTAGTTAATGTTGCTGAACTTGCTACATTTAGTTCAAGAGTTCAAGTTGGAACTGGTCTTACACTTGATCAAAATAATATTGATGCTGGTTCTTATGTTGGTATTATAACTGCCAAAGAGTTTCATGGTGATGGAACAAATGTGGCAACATCTAGATGGGCAGTGACAAATGCTAGTTCAAATCATTATGTGTTCAATGGACCTGGTAATTTAGTTAATGCTAATGATCCAACTATATACCTTGCAAGAGGTCAGAAGTATGAATTTGACATTAATGCTAGCGGTCATCCATTTAGAATACAAACTAGCTCTGGTGCATCAGGTTATAATTCTGGAAATGAGTATACTACTGGTATTACTAATGTAGGTGCTGCATCTAGTTTGCTTACATTTGATGTTCCATTTGATGCTAACAATACTTTATACTATGTTTGTCAAAACCATTCTAGTATGAATGGAACTATTATCATCTATCCATCAATATAA

Genome Context

Tertiary structure

PDB ID

8822b2a3c647f84c8ee79e24f003d3c16b1889a9a67d81f9a1375f59d636e90e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5341

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence