Protein

View in Explore

Genbank accession

YP_009030942.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,88

Protein sequence

MATAVFKPYRDYSTMAAQFHYRTVQDTAVPGRDYNHVEGDVTIPIGATSIEIPVEIVDKLPNRLPRSFFMEFSSKSQGVMIGTQRAKCTIVSDENLDRISWDTVEERMFHPRYWVTTTQQTESTCIVADDNCCINRLVSRTYGGMAGCIWETVDKYDHFGIGFDDHYEMRNTKLWFRMSITNASNFSTPEKMIMTVDLVDGTIIYVPLAQYAVSISEDKNVAEIHIDFEDCVGMDQNNNMMGVDPRQVRRILIPLMPKDWVSNSTDPRTENVECELRLDLLQPDTGWKMMQLNNIQVKEHDVGICTAYDDMWNVSPLRVLNNIKRLGYTGTINHYVGMSHYYDYTWSGTQWSINRTGALNAAAYKWHDDFMYNAKRHNFDVMQSVSFELFSDACPLEWTQRDWNDNYAKTGYTPCSYLLSPTIEEGMNFLTAVFKNFASAAMRNNLPVIMQVGEPWWWYNTDTRRPCIYDYPTKQAFYDETGEYALDIGTIDDPKTGGVYDKYVAFCRGKLGARIAAISKAIKAHAASAQMTALLFFPTIMETELTQKLNLADQYKKEAGALDFFCTECYDWVMQGGIEKAKESVNIPIVKLGWQPSEIQYLAGFVPSKELAPVYGYDPTRNYQEFLWRCICGNMATIEYRYPEVKQYVWAYPQVMSDSITVTARDSTVLHMGQVALKGYVEDVVPPDFS

Physico‐chemical properties

protein length:	690 AA
molecular weight:	79100,83520 Da
isoelectric point:	5,03573
aromaticity:	0,12319
hydropathy:	-0,33275

Domains

Domains [InterPro]

IPR038081
ATT
9–94

IPR038081 IPR057102 IPR057122 DC_0314

IPR038081
ATT
9–95

IPR038081 IPR057102

IPR038081
ATT
14–100

IPR038081

IPR003644
ATT
17–91

IPR003644

YP_009030942.1

1 690

Architecture

ATT

TAS

RBD

ATT 9-100 | TAS 101-284 | TAS 299-658 | RBD 659-688 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR038081	ATT	IPR038081	9	94	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	9	95	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR038081	ATT	IPR038081	14	100	Merged direct domain	CalX-like domain superfamily	N-terminal	Low	Positional only	110 proteins / 110 hits
IPR003644	ATT	DC_0810	17	91	InterPro cluster	Na-Ca exchanger/integrin-beta4	N-terminal	Low	Positional only	48 proteins / 48 hits
IPR057102	TAS	DC_0337	95	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057102	TAS	DC_0337	108	284	InterPro cluster	Non-contractile tail sheath, N-terminal domain	N-terminal	High	Text match	103 proteins / 103 hits
IPR057122	TAS	DC_0860	299	658	InterPro cluster	Non-contractile tail sheath, TIM barrel	C-terminal	High	Text match	103 proteins / 103 hits
DC_0314	RBD	DC_0314	659	688	Novel HMM	DC_0314	C-terminal	Low	Positional only	95 proteins / 95 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009030942.1

1 690

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	42	42	0,1944
Central domain	43	298	257	0,7818
C-terminal	299	690	391	0,3192

Note: Constraints were applied during segmentation.
Fixed 26 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-42

Central
43-298

C-terminal
299-690

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage FFH2 [NCBI]	1446490	Uroviricota > Caudoviricetes > Vequintavirinae > Vequintavirus PDX > Vequintavirus FFH2
Host	Escherichia coli O157:H7 [NCBI]	83334	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Escherichia

Coding sequence (CDS)

Genbank protein accession

YP_009030942.1 [NCBI]

Genbank nucleotide accession

NC_024134 [NCBI]

CDS location

range 24842 -> 26914
strand -

CDS

ATGGCAACAGCTGTTTTTAAACCTTACCGTGATTACTCTACAATGGCTGCACAGTTTCATTACCGAACAGTTCAGGATACTGCCGTTCCTGGTAGGGATTATAATCATGTTGAGGGAGATGTAACTATCCCAATTGGGGCAACCAGTATTGAGATCCCCGTAGAAATTGTTGACAAATTACCCAACAGGTTGCCAAGAAGCTTCTTTATGGAGTTTTCATCAAAATCTCAAGGGGTGATGATTGGAACACAAAGGGCGAAATGTACAATAGTTTCAGATGAGAATCTTGACAGGATATCTTGGGATACTGTTGAGGAGAGAATGTTTCACCCAAGGTATTGGGTTACAACCACTCAGCAGACTGAAAGTACCTGTATTGTTGCAGACGACAACTGTTGTATTAACCGTTTAGTGTCAAGAACATATGGAGGTATGGCTGGGTGCATTTGGGAAACAGTTGACAAGTATGACCATTTCGGTATTGGGTTTGATGATCACTATGAGATGAGAAACACCAAGCTTTGGTTCAGAATGTCAATAACCAATGCCAGCAACTTCTCCACTCCTGAAAAGATGATTATGACTGTAGACCTTGTTGATGGCACAATCATCTATGTTCCTTTAGCTCAATATGCTGTCAGCATCTCAGAGGATAAGAATGTTGCAGAGATTCATATTGATTTCGAGGACTGCGTCGGGATGGATCAGAACAACAACATGATGGGTGTTGATCCTCGGCAGGTGAGAAGGATTTTAATACCGCTTATGCCTAAAGACTGGGTAAGTAATAGCACAGACCCGAGAACGGAAAATGTAGAGTGTGAGTTGCGCCTAGATCTGCTTCAGCCAGACACGGGCTGGAAAATGATGCAACTTAACAATATTCAGGTTAAAGAGCACGACGTCGGGATCTGCACCGCATATGACGATATGTGGAACGTATCTCCTTTAAGGGTGTTGAACAATATCAAGCGTCTGGGCTATACCGGAACCATAAACCATTATGTTGGTATGAGTCATTATTATGACTACACATGGTCAGGAACCCAATGGTCTATAAACAGAACAGGGGCGCTAAACGCTGCAGCTTATAAATGGCACGATGATTTTATGTACAATGCCAAACGACATAACTTCGACGTTATGCAATCTGTAAGTTTTGAGCTTTTCAGCGATGCCTGCCCGTTGGAATGGACCCAAAGAGACTGGAACGATAACTACGCTAAAACAGGGTATACACCCTGTAGCTACCTCCTGTCTCCAACCATTGAAGAGGGTATGAATTTCCTTACTGCAGTATTTAAGAATTTTGCATCAGCCGCTATGAGAAACAACCTGCCAGTGATTATGCAGGTTGGTGAACCGTGGTGGTGGTACAATACCGATACTCGTAGACCTTGTATTTATGATTACCCTACAAAGCAGGCGTTTTATGATGAGACAGGTGAGTATGCATTAGATATTGGGACTATTGACGATCCTAAAACTGGCGGTGTTTACGACAAGTATGTAGCATTTTGTCGTGGTAAGCTTGGCGCTCGTATTGCGGCTATTTCAAAGGCAATAAAGGCACACGCTGCATCAGCTCAGATGACAGCTTTACTGTTTTTCCCAACTATTATGGAAACCGAGCTTACGCAAAAGCTGAACCTTGCCGACCAATATAAAAAAGAAGCAGGTGCTCTTGATTTCTTCTGCACCGAGTGCTACGATTGGGTGATGCAGGGAGGTATTGAAAAGGCAAAAGAGTCTGTAAACATACCTATCGTTAAGTTAGGTTGGCAACCGTCTGAAATACAATACCTTGCAGGGTTCGTTCCTAGTAAAGAGCTTGCTCCGGTATATGGATACGACCCAACTAGGAATTACCAAGAATTTTTATGGAGATGTATTTGCGGAAACATGGCAACTATAGAGTATAGATACCCTGAGGTAAAACAGTATGTGTGGGCATACCCGCAAGTAATGTCTGACAGCATCACTGTTACCGCTAGAGATTCTACCGTGCTTCATATGGGGCAGGTTGCTCTGAAAGGGTATGTAGAGGATGTTGTCCCGCCAGACTTCTCATAA

Genome Context

Tertiary structure

PDB ID

d588e4d131538f9d23ab0fd5fa5271da441ac7c95fb1feaaa403313bca48b10e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7110

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence