Protein

View in Explore

Genbank accession

YAA53584.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MNEMFSQGGKGSTGILTNKQAVARHFGVKQSEVVYFSVGAVLSGYKVIYDKETQRAYSLPADIGSGVTAASLSPSGVLVHSAGSVDLGALAVAREEYVTLPGSFDTGVTVNTKNELVVFTDGKYRWDGVLPKVVPADSTPKTSGGVGLGAWVSVGDVVLRGQISDPEGATKYPELQMARWRDNGDPRGWGAVGDGVADDTLAVQACFDAATGDIDLGGKTYLVRKNPALASTYPTEPDFSDGTRNYSPCLALVNKEGIRISNGTIIVNTHGLDGLALVNCRNVTVSLTVRGPNKFPAIDVPTGYAEKGEARFGYDTALFTGPNNSVDSSAYTSGAYAGVAGQFPNYDDAGNQLDGWRSTWGTFLGGYIGSWANGIKVQRGCRGILILNSHVSGFNFGGIGIGIRNIATTYGSTDYTNDTDVPDGVMVMGCTIKDCYSAGIYVLSGYRLNYESNDIQNIGHPYGDDVLNDSYDPGYGISHARNRRIRNVVVAKNQIKNCRRKCIDFHGGGQVIITENMCLEHGVVGIYAKCGAGWNPNYEPYNLIVSNNYVRSRDIPASATSGLLIGGKYTRSIDVGGGGEATAATYPNPFVKIHNNYCELRAFDGVAISTGAGDSSYQVYQDIDISHNTVVLKCQTVNNTTEAIIVNAGASASQVYRGQTVKLIGNSVKQYNSLDLSYRAVGYKVQGIPKSLIAHANTLDMNVRVQEAKLCDFVLNDQTNFSFRGNQVVSTGQRSTCTLQECMFYENTKIFRAAGSGSLSIPGTLGRGVWQLVIAGTGNAYGTKQTQFASTGSGGTGADIVKNPTTGFIADFAIGVSGLTVPAVTLDSTVQIQLKQLTQLDYVF

Physico‐chemical properties

protein length:	844 AA
molecular weight:	89732,39730 Da
isoelectric point:	6,29227
aromaticity:	0,09005
hydropathy:	-0,14882

Domains

Domains [InterPro]

G3DSA:3.30.2020.50
ATT
1–96

G3DSA:3.30.2020.50 G3DSA:2.10.10.80 IPR011050 IPR006626 IPR006626

DC_1348
ATT
1–290

DC_1348 IPR006626 IPR006626 IPR006626 IPR006626

IPR040775
RBD
91–156

IPR040775 IPR012334

IPR006626
Unmapped
255–279

IPR006626 IPR039448

DC_0622
RBD
550–844

DC_0622

YAA53584.1

1 844

Architecture

ATT

STR

RBD

ATT 1-290 | STR 291-588 | RBD 589-844

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	1	96	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
DC_1348	ATT	DC_1348	1	290	Novel HMM	DC_1348	N-terminal	Low	Positional only	38 proteins / 38 hits
IPR040775	RBD	DC_0821	91	156	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	97	165	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR011050	STR	IPR011050	186	555	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR012334	STR	IPR012334	186	588	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR006626	Unmapped	-	255	279	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	381	402	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	422	444	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR039448	ENZ	DC_0799	425	552	InterPro cluster	Right handed beta helix domain	C-terminal	High	Text match	178 proteins / 183 hits
IPR006626	Unmapped	-	485	507	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	540	567	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_0622	RBD	DC_0622	550	844	Novel HMM	DC_0622	C-terminal	Low	Positional only	16 proteins / 16 hits
IPR006626	Unmapped	-	588	610	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	626	648	InterPro	Parallel beta-helix repeat	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YAA53584.1

1 844

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	198	198	0,9903
Central domain	199	728	531	0,9932
C-terminal	729	844	115	0,9698

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-198

Central
199-728

C-terminal
729-844

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage N4Sz33 [NCBI]	3446682	Viruses > unclassified bacterial viruses >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YAA53584.1 [NCBI]

Genbank nucleotide accession

PV805638 [NCBI]

CDS location

range 60168 -> 62702
strand -

CDS

ATGAACGAAATGTTCTCTCAAGGTGGTAAAGGTTCAACTGGAATCTTAACCAATAAACAAGCAGTAGCCCGTCACTTTGGAGTTAAGCAATCTGAGGTTGTTTACTTCTCAGTGGGTGCTGTACTAAGTGGTTACAAAGTCATCTACGACAAGGAGACACAGCGTGCTTATTCCTTACCTGCTGACATTGGTTCAGGGGTTACTGCTGCAAGTCTTAGTCCATCTGGGGTATTAGTACACTCTGCTGGTAGTGTGGACTTAGGTGCACTTGCTGTTGCTCGTGAAGAGTATGTAACCTTACCTGGTTCATTTGATACTGGTGTAACAGTTAATACCAAGAATGAACTGGTTGTCTTTACCGATGGTAAGTATCGATGGGATGGTGTATTGCCTAAAGTAGTTCCTGCCGACTCAACCCCTAAAACTTCTGGTGGTGTTGGTCTGGGTGCTTGGGTGAGTGTTGGGGATGTGGTGCTACGAGGACAGATTTCAGACCCTGAAGGTGCAACAAAATACCCCGAACTACAAATGGCTCGCTGGCGTGATAATGGCGATCCACGTGGATGGGGGGCGGTTGGCGATGGCGTTGCCGACGATACGTTGGCAGTGCAGGCATGTTTCGACGCCGCCACTGGAGATATTGATTTAGGAGGAAAGACATATTTAGTTCGAAAAAATCCTGCATTGGCTTCTACGTACCCTACTGAGCCTGACTTCAGCGACGGTACACGTAACTACAGTCCGTGTCTGGCACTGGTAAATAAGGAAGGTATTCGTATCTCCAACGGCACTATAATTGTGAATACGCATGGGCTGGACGGACTTGCCCTTGTAAATTGCCGGAACGTGACTGTATCGCTGACTGTGCGTGGCCCTAACAAGTTCCCTGCTATAGATGTGCCTACTGGTTATGCAGAGAAAGGTGAGGCTCGTTTCGGATACGATACAGCACTGTTTACAGGTCCTAATAACTCCGTTGACTCCAGTGCGTACACGTCTGGTGCTTATGCTGGTGTAGCTGGACAGTTCCCTAACTATGATGACGCGGGTAATCAGTTGGATGGGTGGCGCAGTACCTGGGGGACTTTCCTTGGCGGTTACATCGGAAGCTGGGCTAATGGTATCAAGGTGCAACGCGGCTGCCGTGGCATCCTTATTCTGAACTCGCACGTATCCGGTTTTAACTTTGGTGGCATTGGTATCGGCATCCGTAACATTGCGACTACCTACGGCAGCACGGATTATACGAATGACACGGATGTACCTGACGGTGTTATGGTTATGGGCTGTACCATCAAGGATTGCTACAGTGCAGGTATCTACGTACTGTCCGGCTACAGACTAAACTATGAGTCCAACGATATCCAGAATATTGGACACCCTTATGGTGATGATGTTCTGAACGATAGCTACGACCCTGGGTACGGTATTTCGCATGCGCGTAACCGAAGAATCAGGAACGTAGTTGTTGCTAAAAACCAGATTAAGAACTGTCGTCGTAAGTGTATTGACTTCCACGGTGGTGGGCAGGTAATCATCACGGAGAACATGTGCCTTGAGCACGGCGTAGTTGGTATATATGCTAAATGTGGGGCAGGTTGGAATCCAAACTACGAACCATACAACCTCATCGTTAGCAACAACTATGTGCGCTCCAGAGATATTCCTGCTAGTGCTACTTCCGGACTGCTTATAGGTGGAAAGTATACTCGCAGCATCGATGTAGGTGGCGGCGGGGAGGCTACGGCAGCGACGTATCCGAACCCCTTTGTTAAGATTCACAACAACTATTGCGAGCTTAGAGCTTTTGATGGGGTAGCTATATCGACCGGAGCAGGGGATAGCTCATACCAGGTGTACCAGGATATCGATATCAGTCACAATACGGTTGTACTTAAGTGTCAGACTGTCAATAACACAACCGAGGCTATTATAGTTAACGCTGGGGCTAGCGCATCCCAGGTATATCGGGGACAGACGGTTAAGCTGATTGGCAACTCCGTGAAGCAGTACAACTCTCTGGATTTAAGTTATCGTGCTGTTGGATATAAGGTGCAAGGTATTCCTAAGTCCCTGATTGCTCATGCCAACACTCTGGATATGAACGTGCGGGTGCAAGAGGCTAAGCTGTGTGACTTCGTTCTGAATGACCAGACTAACTTTAGCTTCCGGGGTAATCAGGTTGTGAGTACCGGGCAGAGAAGTACCTGCACGTTGCAAGAGTGTATGTTCTATGAGAATACCAAGATATTTCGGGCTGCTGGTTCAGGTAGCTTGAGTATTCCAGGTACGCTCGGCAGGGGTGTATGGCAACTAGTTATTGCGGGTACAGGGAATGCTTATGGTACTAAGCAGACTCAGTTTGCAAGTACAGGTTCTGGGGGTACTGGGGCGGATATAGTAAAGAATCCTACTACCGGGTTCATTGCGGACTTTGCAATCGGTGTTTCTGGCTTAACTGTTCCGGCAGTAACTCTGGATAGTACCGTGCAGATTCAGTTGAAGCAGCTTACGCAACTGGATTATGTGTTCTGA

Genome Context

Tertiary structure

PDB ID

f00120235969154856c954f330fbea92725c8f4d1e77147e10c691df887bc916

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,8228

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence