Protein

View in Explore

Genbank accession

YP_009845355.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,88

Evidence RBPdetect2

Probability 0,96

Protein sequence

MALKTKIIVQQILNIDDTTTTASKYPKYTVVLGNSISSITAGELTAAVEAAAGSAAAAKDSEIAAKDSENKAKDSEIQAGIHADASEASATQSAASAAESERQANLSQGSAENSAASALESKNFKDASELAAQNAEQSKILAEQAQRAAEAAQSGAQASENKASAFATQAAASSASAGDFAAAAKQSELNAKTSETNAATSEVEAETQAETATTGANRAKAEADRAAQIVDSKLDKEDISGFIKVYKTKEEADTDVSSRVLGEKILVWNQTDSKYGWYKVAGTAETPVLELVETEQKLVSINNVRADDAGNVQITLPGGNPSLWLGEVTWFPYDKDSGVGYPGVLPADGREVLRVDYPDTWEAIEAGLIPSVTEEQWQAGATLYFSTGNGTTTFRLPDMMQGQAFRAAAKGEENAGNIKEQIPYITMINGKAPADDGTITLGNAADKNVWNGVDGEVLLRGAFGLGGAGLILNEPDAVSFFKAMRAFGSGYYRNDSESNPVIPKYSAGFYSKTADTHTFICSAYGNGVTFVATVNDALLDGENPTVHTNILYGTANKPDLNTDTQGVLGIEKGGTGSNTQKGARLNLDTPVGSRAIGMPNNSDVLAFMKSSAESGYYSSGSIVTGVPEIAGWYMFDLHVHGRNASGEMDHGNVYCTTDVGAIWYTLMWAGVWQPWRRLTTEHGIIPITSGGTGTNNANDARINLGLGPANAPTFSGLTLPGTNGVNSGIAVFSNRNSDGTQLSYSRMYHEIQNGIGKTTIQTTREGGATNYFQIDEYGNVGNVNSIITSAYLGIGTASALGGKSIVLGDSDTGLQWVSDGIIKAIANSAQIFAWTPSSIDTYMTISSHVDNSARGLYVNGIRTTGASALVAGVVEAGSHVGWRDRASGMLVELNTRGAAANIWKATRWGDQHAGASDIVIYDDGSPYYRTLVGGGEFGFNGLGQATCTSWISTSDIRLKAQLKEIVSAKDKVKSLQGYTYFKRNSLVEDEHSFYCEEAGLIAQDVQTVLPEAVYKIANSDLLGVNYSGVTALLANAVKEMLADAEAQEARISNLEEELAELKALVATLVNK

Physico‐chemical properties

protein length:	1071 AA
molecular weight:	112860,45260 Da
isoelectric point:	4,75739
aromaticity:	0,07376
hydropathy:	-0,25285

Domains

Domains [InterPro]

DC_0608
ATT
2–565

DC_0608 DC_1093 DC_1942

Coil
Unmapped
142–162

Coil DC_1942 IPR030392

IPR030392
CHP
954–1014

IPR030392 Coil

YP_009845355.1

1 1071

Architecture

ATT

STR

ATT

ATT 2-565 | STR 607-745 | ATT 746-1071

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0608	ATT	DC_0608	2	565	Novel HMM	DC_0608	N-terminal	Low	Positional only	308 proteins / 308 hits
Coil	Unmapped	-	142	162	Coils	Coil	-	-	-	-
DC_1093	STR	DC_1093	607	752	Novel HMM	DC_1093	Central	Low	Positional only	18 proteins / 18 hits
DC_1942	ATT	DC_1942	746	859	Novel HMM	DC_1942	N-terminal	Low	Positional only	254 proteins / 254 hits
DC_1942	ATT	DC_1942	844	1071	Novel HMM	DC_1942	N-terminal	Low	Positional only	254 proteins / 254 hits
IPR030392	CHP	DC_0088	954	1058	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	954	1014	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1037	1071	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009845355.1

1 1071

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	447	447	0,9469
Central domain	448	646	200	0,1813
C-terminal	647	1071	424	0,7824

Note: Constraints were applied during segmentation.
Fixed 300 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-447

Central
448-646

C-terminal
647-1071

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage Sepoy [NCBI]	2565517	Uroviricota > Caudoviricetes > Demerecviridae > Epseptimavirus > Epseptimavirus Sds2
Host	Salmonella enterica subsp. enterica serovar Heidelberg [NCBI]	611	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Salmonella > Salmonella enterica

Coding sequence (CDS)

Genbank protein accession

YP_009845355.1 [NCBI]

Genbank nucleotide accession

NC_048760.1 [NCBI]

CDS location

range 86545 -> 89760
strand -

CDS

ATGGCACTTAAAACTAAAATTATTGTACAGCAGATTCTGAACATAGATGACACTACAACTACTGCTAGTAAGTATCCTAAGTATACAGTAGTTTTAGGTAATTCTATTAGTTCTATTACTGCTGGTGAACTAACAGCGGCTGTTGAGGCCGCTGCAGGATCTGCTGCTGCTGCTAAAGACTCTGAAATAGCAGCTAAAGATTCTGAGAATAAAGCTAAAGATTCAGAAATTCAAGCAGGTATTCATGCTGATGCTTCTGAGGCTTCAGCAACCCAATCTGCTGCTTCTGCTGCTGAATCTGAAAGACAAGCTAACTTATCTCAAGGTAGTGCGGAAAATTCTGCTGCGTCTGCTTTAGAATCTAAGAATTTTAAAGATGCTTCAGAACTTGCTGCTCAAAATGCAGAGCAGAGTAAGATTTTAGCAGAGCAAGCCCAAAGAGCGGCAGAAGCTGCCCAGTCTGGTGCTCAAGCTTCTGAAAATAAAGCATCAGCATTTGCTACACAAGCTGCTGCATCTTCAGCTTCCGCAGGAGATTTTGCTGCAGCCGCTAAACAATCTGAATTAAATGCTAAAACTTCTGAAACCAATGCCGCAACATCAGAAGTGGAAGCGGAAACCCAAGCTGAAACTGCTACTACTGGGGCAAATCGTGCTAAGGCTGAAGCCGATCGCGCAGCTCAGATTGTAGATAGTAAGTTGGATAAAGAAGATATATCTGGCTTTATCAAAGTCTACAAGACCAAAGAAGAAGCGGATACTGACGTTAGTAGTCGCGTACTAGGTGAAAAGATCCTAGTGTGGAACCAAACCGACTCAAAATATGGGTGGTACAAAGTAGCTGGAACTGCTGAGACTCCAGTATTAGAGTTAGTAGAGACAGAGCAAAAGCTAGTTTCTATTAACAACGTTCGTGCAGATGACGCAGGTAACGTACAGATTACTCTTCCTGGTGGTAACCCCTCTTTATGGCTGGGTGAAGTTACTTGGTTCCCTTATGATAAAGATTCAGGTGTTGGCTACCCTGGTGTTCTTCCTGCTGATGGTCGTGAAGTTCTTCGTGTAGATTATCCAGATACTTGGGAAGCTATCGAGGCTGGCTTAATCCCTTCTGTTACTGAAGAACAATGGCAGGCTGGTGCAACTCTCTATTTCTCCACTGGTAATGGTACTACTACTTTCCGTCTACCTGATATGATGCAGGGGCAGGCATTCCGTGCTGCTGCAAAAGGCGAGGAAAACGCTGGCAATATTAAAGAGCAAATTCCGTACATTACTATGATTAACGGTAAAGCTCCTGCTGACGATGGTACAATTACTTTAGGTAATGCTGCAGATAAAAACGTATGGAATGGTGTTGATGGTGAGGTATTACTAAGAGGTGCTTTTGGTCTTGGTGGTGCTGGTTTAATCCTTAATGAACCTGATGCTGTTTCCTTCTTCAAAGCAATGCGTGCTTTTGGTTCCGGGTACTATAGAAATGACTCTGAGAGTAATCCAGTGATTCCTAAGTATTCCGCAGGATTCTACTCCAAAACTGCTGACACCCATACCTTTATCTGTTCTGCTTATGGTAATGGTGTTACTTTTGTAGCTACTGTAAATGATGCATTATTAGATGGGGAAAATCCTACAGTACATACTAATATTCTTTATGGCACAGCTAATAAACCTGATCTGAATACTGATACTCAAGGAGTTTTAGGAATAGAGAAGGGTGGTACTGGCTCCAATACTCAAAAAGGTGCTAGATTAAATCTGGATACTCCTGTAGGCAGCAGAGCTATTGGAATGCCTAATAACTCTGATGTACTAGCTTTCATGAAATCTTCCGCAGAAAGCGGGTATTACTCCTCGGGTAGTATAGTTACTGGAGTTCCAGAAATTGCTGGATGGTACATGTTCGATCTCCATGTACATGGTAGGAATGCCTCTGGAGAGATGGATCACGGTAATGTATATTGTACAACAGATGTAGGTGCTATTTGGTATACTCTAATGTGGGCTGGTGTATGGCAACCGTGGAGACGTTTAACTACAGAACATGGTATTATTCCTATTACTTCAGGGGGTACTGGTACAAATAATGCAAATGACGCAAGAATAAACTTAGGTCTTGGTCCTGCAAATGCACCTACTTTTAGTGGTTTAACTCTTCCGGGTACTAATGGTGTTAACTCAGGTATAGCTGTTTTTAGTAATAGAAACTCGGATGGAACTCAGCTTTCCTACTCTAGGATGTATCACGAAATTCAGAATGGTATTGGTAAAACTACTATCCAAACTACGAGAGAGGGTGGTGCGACTAACTATTTTCAGATTGATGAGTATGGTAACGTTGGGAACGTTAATTCAATTATTACAAGTGCATATCTTGGGATTGGTACTGCTAGTGCTCTTGGTGGTAAATCCATTGTACTTGGGGATTCTGATACAGGACTACAATGGGTTAGTGATGGTATAATTAAAGCTATTGCTAATAGTGCCCAAATATTTGCTTGGACTCCTTCCTCAATAGATACATATATGACTATTAGCTCACATGTGGATAATAGTGCGAGAGGCTTGTATGTAAATGGGATTAGGACTACCGGTGCCTCCGCTCTTGTAGCTGGGGTTGTAGAAGCTGGATCTCATGTTGGTTGGAGAGATAGAGCTTCAGGTATGCTTGTTGAATTGAATACTAGAGGAGCTGCTGCCAATATCTGGAAAGCAACTAGATGGGGTGACCAACATGCTGGTGCATCTGACATCGTTATTTATGATGATGGATCTCCTTATTATAGAACTCTTGTAGGCGGTGGTGAATTTGGGTTCAATGGCCTTGGACAAGCTACCTGTACTTCTTGGATCAGTACATCTGATATTAGGCTTAAGGCACAGCTAAAAGAGATAGTATCTGCTAAAGATAAGGTAAAATCCCTACAGGGGTACACTTATTTTAAACGTAATAGTTTGGTTGAAGATGAGCATTCCTTTTATTGTGAAGAGGCAGGATTAATCGCACAGGATGTTCAAACTGTACTACCTGAAGCTGTATATAAAATAGCTAACTCAGATCTTCTCGGTGTTAATTACTCTGGTGTTACCGCATTATTGGCTAACGCAGTAAAAGAGATGTTGGCGGATGCGGAGGCTCAGGAAGCTCGTATCAGTAATCTAGAAGAAGAACTGGCAGAGTTAAAAGCTCTAGTAGCCACTCTGGTAAATAAGTAA

Genome Context

Tertiary structure

PDB ID

923b9b6cca76ad1c190cd45fad6a3c519cbb87f94098ac8d4877b8d32bdae964

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6011

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence