Protein

View in Explore

Genbank accession

YP_009225458.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,89

Protein sequence

MAISPKNLYPSRVIDGDGAYPYGKALNVQNGVEGTGTPLEAEWLNDIWGSQQALLADVGIAPNGQPDSVGNSQYLDALKKLIREPLELKIFQSPSSGGLTEIQTRTVNGGKVYEVRKTSDDSLATIYSDAAGTAEIVQNGTSNVSGSDGVVEFFIAEGDYYVEVGGVSAGFVVGSIADGLAETQRVMRKLKNGEDANIVVFSDSTGDATDEWVYKLAEKLAGDFSNLTVFYRLWDSGAGNYAARVTVQSAGSQVLTIWNAAIAGSNANRFCGSEFNAAARPSQVGGSPDLYFVNYGHNGGNQLERQYSMHSQLISLLVEFSSDSPVIIIGQNPVLSDDSMQRKVEVFQKIARVYGCGYIDINSYFLENLNPLADYYKDDVHPNETGSEVWAQLVHDKFRYNKDLASATTQSGNKSQAYSVLDTFNQMLRVSSSTANVTLERYGVNFETSGQSLKMTGNGVASPTPFAYFDVIDSKDIRSFIGKTICINVRLKTDVGAGALTGRIAAYDGIQTITSTNGGESGGRYIDQSMIITVDSAATYLRVYVYIDASTPSDSVYIDRIVTSFDRDIAEGTSLSRIDAAEFISIFGAGGVNGNLVVGNSTSNGRAISVLDLISGDIDDDPNTQYVASVSANGVEVKQRGDTFPRVHINTSGLIQLSKGASGFTTYIDSPLDNNIRIGTANVYPSVDATYDIGIGGYTWRRLQLSDGVFVGGTKVTGSQQVAISDSVGGDESAKINSILAALRAHGLIAT

Physico‐chemical properties

protein length:	751 AA
molecular weight:	80204,93720 Da
isoelectric point:	4,65167
aromaticity:	0,08788
hydropathy:	-0,15499

Domains

Domains [InterPro]

DC_0226
STR
1–356

DC_0226 DC_2072

IPR036514
STR
180–398

IPR036514

SSF52266
STR
201–398

SSF52266

IPR013830
ENZ
239–388

IPR013830

cd00229
ENZ
259–397

cd00229

YP_009225458.1

1 751

Architecture

STR

STR 1-751

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0226	STR	DC_0226	1	356	Novel HMM	DC_0226	Central	Low	Positional only	43 proteins / 43 hits
IPR036514	STR	IPR036514	180	398	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
SSF52266	STR	SSF52266	201	398	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
IPR013830	ENZ	DC_0001	239	388	InterPro cluster	SGNH hydrolase-type esterase domain	C-terminal	High	Text match	480 proteins / 783 hits
cd00229	ENZ	DC_0001	259	397	InterPro cluster	cd00229	C-terminal	High	Text match	480 proteins / 783 hits
DC_2072	STR	DC_2072	395	751	Novel HMM	DC_2072	Central	Low	Positional only	8 proteins / 8 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009225458.1

1 751

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	180	180	0,9934
Central domain	181	379	200	0,6619
C-terminal	380	751	371	0,6750

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-180

Central
181-379

C-terminal
380-751

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudoalteromonas phage H101 [NCBI]	1654919	Uroviricota > Caudoviricetes > Shandongvirus >
Host	Pseudoalteromonas marina [NCBI]	267375	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Alteromonadales

Coding sequence (CDS)

Genbank protein accession

YP_009225458.1 [NCBI]

Genbank nucleotide accession

NC_029094.1 [NCBI]

CDS location

range 17154 -> 19409
strand +

CDS

ATGGCGATTTCACCAAAGAACCTCTACCCATCAAGAGTAATAGATGGCGATGGTGCTTACCCTTATGGGAAGGCTCTAAATGTGCAGAATGGTGTTGAGGGGACAGGAACTCCTCTTGAAGCAGAGTGGTTAAATGATATATGGGGTAGTCAGCAAGCGTTGTTGGCTGATGTAGGTATAGCTCCTAATGGACAGCCAGATAGTGTGGGTAACAGTCAGTATTTAGACGCATTGAAGAAACTTATCAGAGAGCCACTTGAATTGAAGATTTTCCAAAGTCCTTCTTCGGGAGGCCTCACTGAAATACAAACACGCACTGTTAACGGTGGAAAAGTGTACGAAGTGCGTAAAACTTCTGATGATTCATTAGCTACCATTTACAGTGATGCCGCTGGTACGGCTGAGATCGTGCAGAATGGTACGAGTAACGTATCGGGTAGTGATGGTGTTGTTGAGTTTTTTATTGCTGAGGGGGATTATTATGTTGAGGTTGGTGGGGTTAGTGCTGGGTTTGTCGTTGGGTCTATTGCCGACGGCCTCGCTGAAACCCAGCGCGTAATGCGGAAGCTTAAAAATGGTGAGGATGCTAACATTGTCGTGTTCAGCGACTCCACAGGAGATGCCACTGATGAATGGGTGTACAAGCTGGCTGAGAAACTTGCAGGTGATTTTTCAAACCTGACTGTTTTCTATAGATTGTGGGATTCTGGCGCAGGTAACTACGCGGCACGAGTAACAGTGCAGTCCGCTGGTAGTCAGGTGCTAACGATATGGAATGCAGCTATTGCAGGTAGTAACGCTAATAGATTTTGTGGCAGCGAATTTAATGCGGCGGCACGACCATCTCAGGTAGGTGGTTCACCTGACCTGTATTTTGTAAACTATGGGCACAATGGTGGTAATCAGCTAGAAAGACAGTATTCGATGCACTCGCAGTTGATTAGCCTGCTAGTTGAGTTTAGCTCAGACTCCCCAGTGATTATAATCGGACAAAACCCTGTCCTAAGTGACGACTCAATGCAACGTAAGGTAGAGGTTTTCCAAAAGATTGCGAGAGTTTACGGGTGCGGATACATAGATATAAACAGCTATTTCCTAGAGAATTTAAACCCACTTGCAGACTACTACAAAGATGATGTTCACCCGAATGAGACTGGGTCTGAAGTTTGGGCGCAATTAGTCCACGACAAATTTAGATATAACAAAGATTTGGCTTCTGCAACAACTCAAAGCGGGAATAAATCGCAGGCTTATAGCGTTTTAGATACGTTTAATCAGATGTTGCGTGTATCATCAAGCACAGCTAATGTCACACTAGAGCGGTATGGTGTTAATTTTGAGACATCTGGTCAATCTCTAAAGATGACTGGTAACGGAGTGGCATCACCGACGCCTTTCGCGTATTTTGACGTGATTGATTCTAAGGACATTAGATCGTTTATCGGTAAAACAATATGTATCAACGTGAGACTGAAAACAGATGTAGGTGCTGGGGCACTAACGGGGCGTATAGCAGCATACGATGGTATACAGACTATAACAAGCACTAACGGTGGGGAAAGCGGTGGTAGATATATAGATCAATCTATGATTATAACTGTAGATAGTGCTGCTACGTACTTGAGAGTGTATGTTTATATTGACGCATCAACACCGTCAGACTCTGTTTACATAGACCGCATAGTCACAAGTTTTGATAGAGACATAGCGGAGGGCACTAGTCTTAGCAGAATTGATGCTGCTGAGTTTATAAGCATATTTGGTGCTGGCGGTGTAAACGGTAATTTGGTTGTTGGTAACAGCACTAGTAACGGCAGGGCTATTAGTGTTTTAGATTTGATATCGGGAGATATAGATGATGACCCAAACACGCAGTATGTAGCCAGTGTGAGCGCAAACGGGGTTGAGGTTAAACAACGTGGTGACACATTCCCGCGAGTTCACATAAACACCAGTGGGCTTATACAACTGTCAAAAGGCGCGTCAGGATTTACAACGTATATAGACTCCCCCTTGGATAACAATATTCGCATCGGCACTGCTAATGTATACCCGTCAGTGGATGCTACATACGACATAGGCATTGGCGGTTACACATGGCGTAGATTGCAACTCAGTGACGGCGTTTTTGTTGGCGGAACTAAAGTTACAGGTAGTCAGCAAGTTGCCATATCTGATAGCGTTGGAGGTGACGAGTCTGCTAAAATCAACAGCATTCTAGCAGCACTACGAGCACACGGGCTGATAGCCACATAA

Genome Context

Tertiary structure

PDB ID

b5a83baf7ed30cd2735f6c2aeff1688647759be1c1f8b191e136f7fd0ddefb57

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7035

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence