Protein

View in Explore

Genbank accession

YP_005098229.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MDYDTSGFPLGSKDPRVLYKNAKNFDYAMNDRESVSWVDRFGVSRKTWFGVEQQVNDYLASQGFEPGVLEYVDGSPLTVDRPTQLIQRGDNIYSVKRPASFPVNLTGNWATDQNLLVAQVDRTLQDTLATSAGAGMIGYRERTVADRLNDTANVKDYGAIADGAYHPLSERFATLAEAQAVYPHATALTDSIDWAAYQAAINSGAPHVHAPGGHYVMNRGTLAERDIRYTGDGYATRVDFSLADGPGSCMLTQGELVQIGDLSVSVVKGARTLTFAAAPDLAPGDVVIVYNPANGSWLADRDPYRAGEMWKVHSVSGSTVTIYGNSSSVYLFSEVDVYRMRGVRVSVDQMHFSPSDTYSIAPFKVVFGDGVKVSNYYASDVTLYTGLEVERCFDVSINAVSSPNRSPAVNDEYGITISNCHNFSVYGGYAAATRHAVALGGMDAVCCVPNRHGLIYGMNIEGIDLASDISAGDMHGNADKITYDNCEFRNGVILQGRDATVRNSTVYGVSSTSGEAIYGSEVYGGTYTIENNRFISYGDGASFGIVHISPSSTQREALLIIARNNTFELPNATGSTKVFFLRGRNSPLPISANIDGVHVHMASVAMQCFLFADDSIKSELLSNYLIIDNVYGPFGTSLLYPTTKNANIPTRQMEQSGEVTVTTNGTSTALPASNVSFRYPYSKKPMAVACASGVNGVAFSSLGGQSPVPIVYAVVAASIRPGLVAATSSFTSGERAVVGWRAGIREI

Physico‐chemical properties

protein length:	747 AA
molecular weight:	80298,70030 Da
isoelectric point:	5,31794
aromaticity:	0,09772
hydropathy:	-0,11767

Domains

Domains [InterPro]

DC_1559
ATT
1–174

DC_1559 IPR011050 DC_1729

IPR012334
STR
114–702

IPR012334

IPR049350
STR
252–340

IPR049350 IPR054136

YP_005098229.1

1 747

Architecture

ATT

STR

RBD

ATT 1-174 | STR 175-702 | RBD 703-747

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1559	ATT	DC_1559	1	174	Novel HMM	DC_1559	N-terminal	Low	Positional only	179 proteins / 179 hits
IPR012334	STR	IPR012334	114	702	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	186	537	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR049350	STR	DC_0763	252	340	InterPro cluster	Tailspike protein-like, Ig-like domain	Central	High	Text match	20 proteins / 29 hits
IPR054136	ENZ	DC_0590	384	636	InterPro cluster	Gp49, pectin lyase-like domain	C-terminal	High	Text match	28 proteins / 28 hits
DC_1729	RBD	DC_1729	677	747	Novel HMM	DC_1729	C-terminal	Low	Positional only	9 proteins / 9 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_005098229.1

1 747

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	191	191	0,9929
Central domain	192	646	456	0,9900
C-terminal	647	747	100	0,9693

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-191

Central
192-646

C-terminal
647-747

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage PMG1 [NCBI]	2992927	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Pseudomonas aeruginosa [NCBI]	287	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Pseudomonadales

Coding sequence (CDS)

Genbank protein accession

YP_005098229.1 [NCBI]

Genbank nucleotide accession

NC_016765 [NCBI]

CDS location

range 18680 -> 20923
strand +

CDS

ATGGACTACGATACCAGCGGTTTCCCGCTCGGCTCGAAAGACCCTCGCGTCTTGTACAAAAACGCCAAGAATTTCGACTATGCGATGAATGATCGCGAAAGCGTTTCGTGGGTTGACCGCTTCGGGGTATCTCGCAAGACTTGGTTCGGTGTCGAGCAGCAGGTAAATGACTACCTAGCATCTCAAGGATTCGAGCCAGGCGTCCTGGAGTACGTCGACGGCTCACCGCTGACCGTAGACCGTCCGACCCAACTGATCCAGCGCGGGGACAACATCTACAGCGTCAAGCGCCCGGCATCGTTCCCCGTCAATCTGACCGGGAACTGGGCGACGGACCAGAACCTCCTGGTTGCCCAGGTTGACCGGACGCTGCAAGACACCCTGGCCACCAGCGCTGGCGCCGGGATGATCGGCTATCGCGAGCGCACCGTAGCCGACCGCTTGAACGACACCGCCAATGTCAAGGACTACGGCGCTATCGCAGATGGGGCGTATCACCCGTTGTCAGAGCGGTTCGCTACGCTCGCCGAGGCGCAGGCGGTTTATCCGCACGCCACTGCGCTGACCGACAGTATCGACTGGGCGGCGTATCAGGCGGCAATCAACTCCGGGGCGCCGCATGTGCATGCGCCAGGCGGCCACTACGTCATGAATCGCGGAACTCTCGCTGAGCGGGATATTCGGTATACCGGCGATGGCTATGCTACCCGCGTAGATTTCAGCCTCGCAGATGGCCCAGGTAGCTGCATGCTGACGCAGGGTGAGCTTGTGCAAATCGGCGATCTGTCCGTGAGCGTGGTTAAAGGCGCTCGCACGCTGACATTTGCCGCTGCGCCAGACCTGGCTCCGGGCGACGTGGTCATCGTGTACAACCCCGCCAACGGATCTTGGCTGGCTGATCGCGATCCGTATCGCGCTGGCGAGATGTGGAAAGTCCATTCGGTAAGCGGTAGCACTGTCACGATCTACGGAAACAGCTCGTCGGTGTACCTGTTCTCCGAGGTAGACGTATACCGCATGCGCGGCGTTCGCGTGTCTGTCGATCAGATGCACTTTTCGCCGTCTGACACATATTCCATTGCGCCGTTCAAGGTGGTTTTCGGCGATGGAGTTAAGGTTTCCAACTACTACGCTAGCGATGTCACGCTTTACACAGGGCTAGAAGTAGAACGATGCTTTGACGTTTCGATCAATGCGGTTTCAAGCCCGAACAGATCGCCGGCAGTCAATGACGAATATGGGATTACTATCTCAAACTGCCATAACTTCTCGGTTTACGGCGGTTATGCGGCAGCAACCAGGCACGCTGTCGCGCTTGGCGGAATGGACGCTGTGTGCTGCGTTCCTAACCGTCACGGCCTGATATACGGGATGAACATTGAGGGGATCGACTTAGCGTCGGATATCAGCGCGGGAGACATGCACGGGAATGCCGACAAAATCACATACGACAACTGCGAGTTTCGGAATGGGGTAATTCTTCAAGGGCGCGACGCAACTGTTCGTAACAGCACTGTCTACGGAGTATCCAGCACTTCCGGCGAAGCGATCTATGGATCGGAAGTATACGGTGGCACCTACACCATCGAGAATAATCGATTTATCAGCTATGGCGATGGCGCATCGTTTGGCATCGTCCATATATCGCCAAGTTCCACTCAGCGCGAAGCATTGCTGATCATCGCGCGAAACAATACATTCGAGTTGCCGAACGCCACGGGGTCGACGAAAGTGTTTTTCCTGCGTGGACGCAATAGCCCGCTTCCGATTAGCGCAAACATTGACGGAGTACACGTCCATATGGCATCTGTCGCGATGCAATGTTTCCTATTCGCGGACGACAGCATCAAGTCTGAACTTCTTTCTAACTACCTTATTATTGACAATGTTTACGGGCCATTCGGAACATCATTGCTTTACCCGACAACCAAGAATGCGAACATTCCTACGCGTCAGATGGAGCAGAGTGGGGAAGTAACAGTTACCACTAACGGAACTTCAACGGCTCTGCCGGCTTCCAACGTCAGTTTCCGATATCCATACTCTAAGAAGCCAATGGCGGTAGCCTGCGCATCAGGCGTCAACGGGGTAGCATTTTCTAGCCTTGGGGGGCAATCCCCGGTGCCAATTGTGTACGCCGTTGTCGCTGCTTCTATCCGGCCTGGACTGGTTGCTGCAACCTCTTCTTTCACCTCCGGAGAGCGGGCGGTCGTTGGGTGGAGGGCGGGAATCAGGGAGATATAA

Genome Context

Tertiary structure

PDB ID

ebdcfd7424b03297643a861ce020034e2d00d27d3f7c8fb63cbafab2e1357864

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8155

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence