Protein

View in Explore

Genbank accession

YP_009593710.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence RBPdetect

Probability 0,88

Protein sequence

MRIQHNIDNVFQMIEGHRKCLDNNTGITNTPTQNKLVNPDGLIAAGWAGNKINNDWAMHESQAVLILGYIEAYRASKSDFYLDRAKDAWEAYNSHLLGAYAVESKMQRLSHYPLSTDGVPSHGGFKDVVVSFTNGRGKIPAGSPTWGEYLDKAFQAYNGVLGRNTVDSDVYGGTDANPDWTTSGLSWWVEWYIAWDGNRYWANGSIADSGHTSVEFGTIQLQDKGVTGSHKVTYCVRLPQEQGGSVIPAGSPVIVNPINVVADNQAPELDGEEMWCDACYQLYTLTGEEKYYTAFKQSYNKLLNFSDINAYDKLFRKTTLIKAPFTDGTCLVAGTVPVMSRDSDGYINFRMNARQPCEIIQKGTTYKIGRDAEIVMNFGGEGVLFQPHFILNDGNNNKKQYRIGVPFGGAGVTEIVAKVTDFVEVVGKDGNPYLLPKEENIAVSGGAGVSMQYDTDIYNHSDNFTRCNIARGKVTFNFGREISLNSVTYRSDDEMVRVKFLDKDRWLWYADLYATNGQWITETLTLGDFKLDPTQPHHTEEEIKPFFANPKGLTSVDFSLSDRQIGNGLFDLYCVNTLPQFYIADRDAYLIWFSVWMASKTESTAKVGDCYVRNYKQGAYRHTPGVFPAGKVIDKENYLLEEKPNWPYPGMQYPAVYCMGAENIDRHRLSNTIGFLYDAQVWYNNTFKTEGPVASRYVWQRGNEGLTGWWEMVDNSKLQSRSFVAACRTIYELKKHKEPVDERLFLFCQKWAWFLNRFQSSHSGNLPTDFNTSGGYSYQDRGDRMWVVGEWLAGCCWLGLCGYSETIPQIDIVVEACVKLLQKHHFINGDNVLNGCWAVSDPVGYHSGEILRGLGLYAQYRGLYL

Physico‐chemical properties

protein length:	865 AA
molecular weight:	97576,42480 Da
isoelectric point:	5,63697
aromaticity:	0,12948
hydropathy:	-0,39861

Domains

Domains [InterPro]

DC_0178
ATT
1–55

DC_0178 DC_0061

IPR008928
ATT
34–97

IPR008928

YP_009593710.1

1 865

Architecture

ATT

STR

ATT 1-97 | STR 105-865

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0178	ATT	DC_0178	1	55	Novel HMM	DC_0178	N-terminal	Low	Positional only	107 proteins / 107 hits
IPR008928	ATT	IPR008928	34	97	Merged direct domain	Six-hairpin glycosidase superfamily	N-terminal	Low	Positional only	64 proteins / 64 hits
DC_0061	STR	DC_0061	105	865	Novel HMM	DC_0061	Central	Low	Positional only	116 proteins / 116 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009593710.1

1 865

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,1225
Central domain	11	265	256	0,9503
C-terminal	266	865	599	0,0880

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain|N-terminal too short, forced to 10 residues

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-265

C-terminal
266-865

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage APECc02 [NCBI]	1655314	Uroviricota > Caudoviricetes > Vequintavirinae > Vequintavirus nomine > Vequintavirus APECc02
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009593710.1 [NCBI]

Genbank nucleotide accession

NC_041869 [NCBI]

CDS location

range 99014 -> 101611
strand +

CDS

ATGCGTATTCAACATAACATTGATAACGTATTTCAGATGATTGAGGGGCACAGGAAGTGCCTCGATAACAACACAGGTATTACCAACACCCCTACACAAAATAAGCTAGTAAACCCTGATGGTCTTATAGCTGCAGGGTGGGCAGGTAATAAGATAAATAATGATTGGGCAATGCATGAGTCCCAAGCTGTGTTGATTCTGGGATACATTGAAGCATACAGGGCATCGAAAAGCGATTTCTATCTGGATAGGGCAAAAGATGCTTGGGAAGCTTACAATAGCCATCTTCTGGGTGCATATGCAGTAGAAAGTAAAATGCAAAGATTGTCCCACTACCCTCTATCCACAGATGGGGTTCCATCACATGGTGGGTTTAAAGATGTGGTGGTGTCTTTTACCAACGGTAGAGGAAAAATCCCAGCTGGATCTCCGACATGGGGGGAATACCTTGACAAGGCATTCCAAGCGTATAACGGTGTGTTAGGAAGAAACACTGTAGACTCTGATGTTTACGGTGGCACAGATGCTAACCCAGATTGGACAACATCCGGATTAAGTTGGTGGGTTGAGTGGTACATAGCATGGGATGGTAACCGCTATTGGGCTAACGGTAGCATAGCCGACAGTGGTCATACGTCTGTAGAGTTCGGCACAATCCAATTACAAGATAAGGGTGTTACAGGAAGCCACAAGGTAACCTATTGTGTGAGATTACCTCAAGAGCAAGGTGGATCGGTGATACCTGCAGGATCCCCTGTAATTGTAAATCCCATAAACGTGGTTGCAGATAATCAGGCCCCAGAGTTGGACGGGGAAGAAATGTGGTGTGACGCTTGTTATCAACTCTACACCTTGACAGGTGAGGAAAAGTATTACACCGCGTTTAAACAGTCTTACAACAAATTGCTTAATTTCAGTGATATAAACGCCTACGACAAACTGTTTAGGAAGACCACGTTGATTAAGGCACCGTTTACAGATGGTACTTGTCTTGTTGCAGGAACAGTTCCTGTCATGAGCAGGGACAGTGACGGGTATATCAATTTTAGAATGAACGCACGCCAGCCTTGCGAAATAATTCAAAAAGGGACTACATACAAAATAGGCAGAGATGCTGAAATTGTTATGAATTTCGGAGGAGAAGGGGTTCTGTTCCAGCCACATTTCATCCTTAATGATGGCAACAATAACAAAAAACAGTACAGGATAGGGGTTCCTTTTGGAGGGGCAGGGGTAACAGAAATAGTTGCCAAGGTTACTGATTTCGTAGAGGTAGTTGGTAAAGACGGTAATCCGTATCTCTTACCTAAAGAGGAAAACATTGCCGTAAGCGGTGGTGCTGGTGTTAGTATGCAGTATGATACCGACATCTACAACCACTCTGACAACTTCACCCGTTGTAATATAGCAAGAGGTAAAGTAACTTTCAATTTTGGAAGAGAGATTTCTTTAAACTCAGTAACTTATCGATCAGATGATGAGATGGTAAGGGTCAAATTTCTTGACAAAGATAGGTGGTTATGGTATGCTGATCTATATGCCACTAATGGACAATGGATAACAGAAACTCTTACTCTAGGAGACTTCAAACTAGATCCGACACAACCTCATCACACCGAAGAAGAGATTAAACCTTTCTTTGCTAATCCTAAGGGGCTCACCTCTGTAGATTTCAGCCTAAGCGACAGACAGATAGGTAATGGCTTGTTTGATCTATATTGCGTCAACACACTGCCGCAATTTTATATTGCAGATAGGGATGCTTATCTAATCTGGTTTAGCGTATGGATGGCAAGCAAGACAGAATCAACCGCTAAGGTTGGCGATTGCTATGTCAGAAACTACAAGCAAGGTGCATACAGGCACACACCAGGTGTGTTCCCTGCCGGAAAGGTGATAGATAAGGAAAACTATCTCTTAGAGGAAAAGCCAAATTGGCCCTACCCTGGCATGCAATACCCAGCAGTATACTGCATGGGTGCAGAAAACATAGATCGCCATAGATTGTCAAATACAATAGGCTTTCTGTATGACGCTCAAGTCTGGTATAATAATACATTTAAGACAGAGGGTCCAGTTGCCTCGCGTTATGTATGGCAGAGAGGTAATGAAGGGCTGACTGGTTGGTGGGAGATGGTAGATAACTCTAAGCTCCAGTCAAGATCTTTTGTTGCTGCGTGCCGCACAATCTATGAGCTCAAGAAACATAAAGAACCTGTTGATGAAAGATTATTCCTGTTCTGCCAGAAATGGGCATGGTTCCTCAACAGATTCCAGTCATCTCATTCAGGAAATCTACCTACAGACTTTAACACCTCTGGGGGATATTCTTATCAGGACAGAGGAGACAGGATGTGGGTGGTAGGTGAATGGCTTGCAGGTTGCTGCTGGCTAGGTCTGTGCGGGTATTCAGAGACAATACCTCAAATAGATATTGTTGTAGAGGCCTGTGTGAAGCTACTGCAAAAGCACCACTTCATTAATGGGGATAATGTTTTAAACGGCTGCTGGGCAGTTTCTGATCCGGTTGGCTATCACTCTGGCGAAATCCTTCGCGGTCTGGGCCTTTATGCTCAATACCGTGGATTGTACCTTTAA

Genome Context

Tertiary structure

PDB ID

103a105c74db31355b743da16fbc84978ff8918ca4d8d9cffa9d03f229dd48ba

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3218

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence