Protein

View in Explore

Genbank accession

AGF89489.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 0,99

Evidence RBPdetect

Probability 0,91

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADYKLSELNSIDTIRSDDLLHVRVKKRPEMLGDEDRRMTYQDFLASFKLERFVQIAGSTMTGDLGIVKLLYGGKAVFDPTGSSEITMGDVLKTFKLNANGLKLTIADASRSATVYHTLNKPSPNELGMRTNEENDARYARLAVTNTFFGTQNIQGDVNLLRLRNQNANNAQYIEGVDLDGSARWLVGISKNGSDSVQLYNNKYDSALTIASNISANKSLAITGQVQPSDFSNLDARYFTQTAANQRFAQLTGNNTFSGSNTFTNFVIKKNANAITIQNVDTTSALYIQARKADGANKWYIGNDVDENTVNIYNYLAKTKISLGNTISMSKTVQIAGQVQPSDWTNIDSRYIPAATLSTIARTNAQNTFNGAQTIVSDGEGLVIKNSTQNRPLYIRGKDAANVSRWWLGVGDPNSTDVALNNSFSGTQLILGNSSASINKTLTLAGQIQPSDFSNLDARYYVKSETDAKYFWSAVRETVRAEDGGVAWNKPSGIYLEMLKGGGSNRLVSHMFVNTGASTPAAQLMFDYRNGGMWYRTARDAHGFEQDWAKVYTEAQKPTPSEIGAYTKAETDQKIAQAVSDSTDLNKIYPVGIVTWFNSNVNPNTALPGLTWTYLNNGVGRTIRVAAANGSDVATTGGSDSVTLAVGNLPSHTHSFSATTSSFDYGTKTTNTTGAHTH

Physico‐chemical properties

protein length:	678 AA
molecular weight:	73826,08150 Da
isoelectric point:	8,27486
aromaticity:	0,08850
hydropathy:	-0,41416

Domains

Domains [InterPro]

DC_0032
ATT
1–267

DC_0032 G3DSA:6.20.80.10 IPR048388 IPR022246 SSF88874

IPR048388
ATT
159–247

IPR048388 IPR048388 G3DSA:6.20.80.10

G3DSA:6.20.80.10
STR
159–218

G3DSA:6.20.80.10 DC_0026

AGF89489.1

1 678

Architecture

ATT

STR

ATT

STR

ATT 1-267 | ATT 272-354 | STR 355-378 | ATT 379-464 | STR 465-678

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0032	ATT	DC_0032	1	267	Novel HMM	DC_0032	N-terminal	Low	Positional only	139 proteins / 139 hits
IPR048388	ATT	DC_0224	159	247	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	159	218	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	272	331	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR048388	ATT	DC_0224	274	354	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
DC_0026	STR	DC_0026	302	678	Novel HMM	DC_0026	Central	Low	Positional only	54 proteins / 54 hits
IPR048388	ATT	DC_0224	379	464	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	379	440	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR022246	RBD	DC_0194	484	583	InterPro cluster	Bacteriophage T7, Gp17, C-terminal	C-terminal	Low	Positional only	166 proteins / 166 hits
SSF88874	STR	SSF88874	584	670	Merged direct domain	SSF88874	Central	Low	Positional only	109 proteins / 109 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AGF89489.1

1 678

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	64	64	0,9941
Central domain	65	263	200	0,2100
C-terminal	264	678	414	0,7340

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-64

Central
65-263

C-terminal
264-678

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage FSL SP-107 [NCBI]	1173772	No lineage information
Host	Salmonella enterica [NCBI]	28901	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

AGF89489.1 [NCBI]

Genbank nucleotide accession

KC139641 [NCBI]

CDS location

range 209 -> 2242
strand +

CDS

ATGGCAGATTACAAGTTGAGTGAATTAAACTCAATCGATACAATCCGTTCAGATGACCTTCTTCATGTCAGGGTTAAAAAGAGACCTGAAATGCTTGGTGATGAAGACCGTCGAATGACCTATCAAGATTTCTTAGCGTCTTTTAAGCTTGAAAGATTTGTTCAGATTGCTGGTAGTACTATGACTGGTGACTTAGGGATTGTTAAGTTACTTTATGGTGGTAAGGCAGTATTTGACCCAACAGGTTCTTCTGAGATTACTATGGGGGATGTTTTAAAGACTTTTAAACTTAACGCAAATGGTCTTAAACTAACTATTGCAGATGCTTCAAGGTCTGCAACTGTTTATCATACTCTTAATAAGCCAAGTCCTAATGAACTTGGGATGAGAACTAATGAAGAGAATGATGCAAGATATGCAAGGCTTGCTGTTACAAACACATTCTTTGGGACTCAGAACATTCAAGGTGATGTTAACTTACTTCGCCTTAGAAACCAAAATGCAAATAATGCACAATATATTGAAGGTGTAGACCTAGATGGTTCGGCTAGATGGTTGGTTGGTATTAGCAAAAATGGCTCTGATTCAGTGCAGTTGTATAATAACAAGTATGACTCAGCTTTGACTATTGCAAGTAATATCTCTGCGAATAAGTCTTTAGCAATCACTGGTCAGGTTCAACCTTCAGATTTCTCTAACTTAGATGCTAGATACTTTACTCAGACAGCAGCTAATCAGAGATTTGCTCAGTTAACTGGTAATAATACATTTAGTGGCTCTAACACTTTCACTAATTTTGTTATTAAGAAGAATGCTAACGCTATTACTATCCAAAATGTAGATACAACTTCGGCTTTGTATATCCAAGCAAGAAAAGCAGATGGAGCTAATAAGTGGTACATTGGTAATGACGTTGATGAGAACACTGTAAACATCTACAACTATTTAGCAAAAACAAAAATCTCACTAGGTAACACCATCTCTATGAGCAAAACAGTCCAAATTGCTGGTCAAGTACAACCATCTGATTGGACTAACATTGACTCTAGATATATTCCGGCAGCAACATTAAGTACGATTGCAAGAACTAATGCACAAAATACTTTTAATGGTGCGCAAACAATTGTTAGTGATGGTGAAGGTTTAGTTATTAAAAACTCTACTCAGAATAGGCCATTGTATATTCGTGGTAAGGACGCTGCCAATGTATCAAGATGGTGGTTAGGTGTTGGTGACCCAAATTCTACTGATGTAGCCTTAAACAACAGCTTCTCTGGCACTCAGTTAATTTTAGGTAACTCATCTGCAAGTATCAATAAGACATTAACCCTAGCAGGGCAGATTCAACCCTCAGATTTCTCTAACTTAGATGCCAGATACTACGTTAAATCGGAAACCGATGCGAAGTATTTCTGGTCAGCAGTCAGGGAGACAGTAAGAGCGGAGGATGGTGGTGTAGCTTGGAATAAACCTTCAGGAATCTATCTTGAGATGCTCAAGGGTGGTGGGTCAAACCGTTTAGTCTCGCACATGTTCGTTAATACGGGAGCATCAACACCTGCTGCACAATTGATGTTTGATTATAGAAATGGTGGGATGTGGTACAGAACAGCCAGAGACGCACATGGTTTTGAGCAGGACTGGGCTAAGGTTTATACAGAGGCTCAGAAGCCAACCCCTTCAGAAATTGGTGCATACACTAAAGCTGAGACTGACCAAAAGATTGCACAGGCAGTAAGTGACTCTACAGACCTGAATAAAATCTATCCAGTAGGTATTGTGACTTGGTTTAACAGTAACGTTAACCCTAATACCGCACTTCCTGGATTAACTTGGACGTACTTGAACAATGGTGTAGGTAGAACAATCAGGGTTGCAGCAGCTAATGGTTCAGATGTTGCTACAACTGGAGGTTCAGATTCTGTTACGTTAGCAGTTGGAAACTTGCCTTCACACACCCATAGTTTCTCTGCGACAACCTCTAGCTTTGACTACGGTACTAAAACCACTAACACTACTGGTGCTCACACCCAC

Genome Context

Tertiary structure

PDB ID

8bfec4a8e56515cade0cf3fc8139d4f69c721c69cadbeb25aabc25bb2389a3b3

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7307

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence