Protein

View in Explore

Genbank accession

YP_010673012.1 [GenBank]

Protein name

cell adhesion domain protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,89

TSP

Evidence RBPdetect2

Probability 0,83

Protein sequence

MALYPIKSLGAVGVIADQAPTDLAPNAFTNAINARFVEQRVFKTGGNAPLSYVDEDKELTPLSFISMPFDYYSAGNSFLVVGTDKKLYKLTDEGLTDISRKVATATKKATATLKIYPVVSSITPKESSVSMTFNKTKVLEVSVTPEDAQNTNLVWSVSNSAYGSIVVDPTDSKRATLTSKAVEGNLVVTVRTADESISTQIAVNIIDGDSGIFLSQDTLTVRKGGTSTLTAITGKPSVTWTSSNPSIVSVTPNSNSLTAVLRASGEGNVTITADNGTKTASCVVSAIPQIDSISLSQENVTMNRGTQYILTATVNPANAPNKAITWTSSNPNIATVSGSSTEATITGLVAGYTQITATTVEGKRTATCEVQVGLASRMARSLSYSITPEAPVEEPVIEKEDVVYFASENTGIDTTGMAEGNNFYDYSNVMDLEGFGRAALLANDPPLSGVTLDIIDASLDVGEEIVLTATASPTGNYSYKWTVDKSGYVSTTNTSSPTLKLTALRKGEVKVTCTVSQMVQKDYDAFEDYPWYHTIISNCAVATTHYETPQVKEFDSEYFVDLPGWGEQTVVDASGNPSVKKYNWKCERIRAFNNRLFALNMRESNASGVTTHYPLRLRWSNFAEENKAPELWDDYAYDRAVSSDLAANIVGQTEALENGYAGYIDLADSNGSLIEVLPLKDYLFVYTEFETYIGSPTNNTYQPLMFKKLFNDSGILAPECVVEVEGGHFVVTQNDVILHNGASKKSIASNRVKNMLINEICLVNPIATKVHLHQDKKEVWILYVGPGEPKESFACTKAAVWNYEFDTWSFRTIPHSYCIGLVDPPVLERGPIWADFQEVTWDDPSIDKLVWRKDATNFRQRVTIVGSFLRGFYQVDVGALDYFYDRSNDTVIERPLEMRLERTGIDFDNVTNEWNQKHINRFRPQVTGTGTYMFEAGGSQFSNEYGHNHSTKEFRVGVDRHVSVRLNHPYLFYNVIDNDVNSNASMNGLTIEFAVGGRR

Physico‐chemical properties

protein length:	999 AA
molecular weight:	109681,43100 Da
isoelectric point:	4,98406
aromaticity:	0,09409
hydropathy:	-0,24334

Domains

Domains [InterPro]

DC_0191
STR
66–999

DC_0191

G3DSA:2.60.40.1080
STR
117–205

G3DSA:2.60.40.1080 G3DSA:2.60.40.1080 G3DSA:2.60.40.1080 G3DSA:2.60.40.1080

IPR003343
STR
118–202

IPR003343 IPR003343 IPR007110 IPR003343

IPR008964
RBD
210–284

IPR008964 IPR003343

IPR003343
STR
214–284

IPR003343 IPR008964

IPR003343
STR
291–370

IPR003343

YP_010673012.1

1 999

Architecture

STR

STR 66-999

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0191	STR	DC_0191	66	999	Novel HMM	DC_0191	Central	Low	Positional only	113 proteins / 113 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	117	205	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR003343	STR	DC_0008	118	202	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	206	286	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR003343	STR	DC_0008	208	283	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
IPR008964	RBD	IPR008964	210	284	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
IPR003343	STR	DC_0008	214	284	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	287	373	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR007110	STR	DC_0008	288	387	InterPro cluster	Immunoglobulin-like domain	C-terminal	Medium	Text match	304 proteins / 473 hits
IPR003343	STR	DC_0008	289	369	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
IPR008964	RBD	IPR008964	289	372	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
IPR003343	STR	DC_0008	291	370	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	445	523	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR003343	STR	DC_0008	446	525	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_010673012.1

1 999

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	544	544	0,8533
Central domain	545	760	217	0,2103
C-terminal	761	999	238	0,6147

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-544

Central
545-760

C-terminal
761-999

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage EK010 [NCBI]	2742112	Uroviricota > Caudoviricetes > Mktvariviridae > Suseptimavirus > Suseptimavirus EK010
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_010673012.1 [NCBI]

Genbank nucleotide accession

NC_070981 [NCBI]

CDS location

range 57600 -> 60599
strand -

CDS

ATGGCTTTATATCCAATAAAATCATTAGGGGCAGTTGGGGTTATCGCTGACCAAGCACCTACTGACTTAGCACCAAATGCTTTCACTAACGCTATTAATGCTCGTTTTGTTGAGCAAAGGGTTTTTAAGACGGGGGGCAATGCCCCTCTTTCTTACGTTGATGAAGATAAGGAGCTTACCCCCCTCTCTTTCATCTCTATGCCTTTTGACTATTATAGCGCTGGCAACAGTTTCCTTGTAGTTGGTACAGATAAGAAGTTGTACAAATTAACTGATGAAGGGCTTACTGACATCAGTCGCAAGGTTGCTACAGCAACTAAGAAAGCAACAGCGACACTTAAGATTTATCCGGTAGTATCTTCTATTACCCCTAAAGAATCCTCTGTTTCTATGACTTTCAATAAAACAAAGGTTTTGGAAGTTAGTGTAACTCCAGAAGATGCACAAAATACTAACCTAGTTTGGTCAGTAAGTAACTCAGCCTATGGCAGTATTGTTGTTGATCCTACAGATTCTAAGAGAGCAACTCTTACTTCTAAAGCTGTTGAGGGTAATTTAGTAGTTACAGTTCGAACGGCAGATGAATCCATTTCTACTCAGATTGCAGTTAACATTATTGATGGAGATTCTGGAATCTTCTTAAGTCAGGATACATTGACAGTGAGAAAAGGAGGAACTTCAACACTTACTGCTATTACAGGAAAACCAAGCGTCACTTGGACAAGCTCTAATCCAAGTATTGTGTCAGTCACTCCTAACTCAAACTCTTTAACCGCAGTGTTGAGGGCTTCAGGAGAAGGTAACGTAACCATTACAGCTGATAATGGGACAAAAACTGCATCTTGTGTAGTTTCTGCAATTCCTCAGATTGATAGCATCTCTTTAAGTCAAGAGAATGTAACAATGAATAGGGGGACTCAGTACATACTAACAGCTACGGTTAATCCAGCCAATGCCCCTAACAAAGCAATCACTTGGACAAGTTCTAACCCCAACATTGCTACTGTTAGTGGTTCTAGTACAGAAGCAACCATTACTGGCCTAGTAGCGGGGTATACTCAAATCACGGCAACAACTGTAGAAGGTAAACGTACCGCTACTTGTGAAGTTCAAGTTGGTTTGGCTTCTAGAATGGCTCGTTCTTTGTCTTACTCTATTACTCCTGAAGCTCCGGTAGAAGAGCCTGTGATTGAGAAAGAAGATGTGGTATATTTTGCATCAGAGAACACTGGAATTGATACAACAGGTATGGCAGAAGGTAACAATTTCTATGACTACTCTAACGTAATGGACCTTGAAGGTTTTGGCAGAGCTGCTCTTCTAGCTAATGACCCTCCTTTAAGTGGCGTGACTTTGGATATTATAGATGCCTCTCTGGATGTTGGTGAAGAGATTGTATTGACAGCAACAGCTTCTCCGACTGGTAACTATTCCTATAAATGGACTGTAGATAAGAGTGGTTATGTGTCTACTACCAACACTAGTAGCCCTACTCTCAAGCTCACAGCTCTCCGTAAGGGTGAAGTGAAAGTTACCTGCACTGTAAGTCAGATGGTTCAAAAAGACTACGATGCTTTTGAAGATTACCCGTGGTATCATACTATCATCTCTAACTGTGCAGTTGCAACCACCCATTATGAAACTCCTCAAGTTAAAGAGTTTGATTCTGAATACTTTGTTGACTTGCCGGGATGGGGCGAACAGACAGTAGTAGATGCATCAGGGAACCCTTCTGTTAAGAAGTATAACTGGAAGTGTGAGCGCATTCGTGCATTTAACAACAGATTGTTTGCTCTGAATATGAGAGAATCTAATGCTTCTGGCGTTACAACACATTACCCGTTGCGTCTTCGTTGGTCTAATTTTGCAGAAGAGAACAAGGCTCCAGAGCTGTGGGATGATTATGCATATGATAGGGCTGTCAGCTCTGATCTTGCTGCTAATATTGTCGGACAGACTGAAGCTCTTGAGAATGGGTATGCAGGGTATATTGATCTTGCAGATTCGAACGGTAGTCTTATAGAAGTGTTACCTCTGAAGGACTATTTGTTTGTTTACACTGAATTTGAGACATACATTGGGTCACCCACTAATAACACATATCAACCTCTGATGTTTAAGAAGTTGTTTAACGATTCAGGAATTCTTGCTCCCGAATGTGTTGTGGAAGTAGAGGGTGGTCATTTTGTAGTTACTCAGAACGATGTTATTCTTCATAATGGGGCATCTAAGAAGTCAATTGCTTCCAATCGTGTTAAGAATATGCTAATCAATGAGATTTGTTTAGTTAATCCCATAGCTACTAAAGTTCACCTACACCAAGATAAGAAAGAAGTTTGGATTCTATACGTAGGACCGGGAGAGCCAAAAGAGAGTTTCGCTTGTACCAAAGCTGCTGTTTGGAACTACGAATTTGATACTTGGTCTTTCCGTACTATTCCACACTCTTATTGTATTGGTTTGGTTGATCCTCCTGTTCTTGAGCGTGGTCCTATTTGGGCAGATTTTCAAGAAGTCACTTGGGATGATCCATCTATTGATAAACTTGTCTGGAGAAAGGATGCAACAAACTTCCGTCAGAGGGTTACAATAGTAGGTTCTTTCTTGAGAGGGTTCTATCAAGTAGATGTTGGTGCTTTAGATTATTTTTATGACAGATCAAACGATACAGTCATAGAAAGGCCTTTAGAAATGAGGCTAGAGAGGACTGGTATTGACTTTGATAATGTCACTAATGAATGGAATCAAAAACACATCAACAGGTTTAGACCACAAGTGACAGGAACAGGCACTTATATGTTCGAAGCAGGTGGAAGTCAATTCTCTAATGAGTATGGACATAATCACTCAACTAAAGAGTTTAGGGTTGGGGTAGACCGTCATGTGTCAGTAAGATTGAACCATCCATACCTATTCTATAATGTTATAGATAATGATGTTAACAGTAATGCATCTATGAATGGACTCACTATAGAGTTTGCTGTTGGCGGTCGAAGGTAA

Genome Context

Tertiary structure

PDB ID

5fd407fec4974ecf5730e1e823996ef8ed416e1950ad2980874e0543e573349e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7705

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Complete Genome Sequence of the phage EK010 isolated from swine sewage	Shahin,K., Bao,H., Soleimani-Delfan,A. and Wang,R.	2022-06-16	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature