Protein

View in Explore

Genbank accession

XRM23102.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,78

Evidence RBPdetect2

Probability 0,92

Protein sequence

MVYAPGSGFRITARPNGEWGTWRDDTGTWVPLAIAAGGTGANSADQARKNLELTEWNLLSSIDGKYPNGFNFDTLAVNSKFTVPPTGGNIVGTRPYQQINGLEDAWFFLETLVHPDPSYRMQRATIFTGAWSGSVSVRIMQGGVWGVWQQAHGALGQLVNAISNRGAIRVQGAASGESGSLISGTISGGAFTDWRSRPTGVLVEHTGLDSASSVFKSVLWGVDWLAGMDVVGWSAGGAQLNIYCRGAEFHFDSGGNAVAGQWISSSDIRMKANLKEIENARDKVKSLVGYTYYKRNNLVEDRDTLYSIEAGVIAQDVQTVLPEAVYKIDPQKEDSMLGVSHAGVNALLVNAFNELNEVVEKQQQEIDELKKLVKQLLDK

Physico‐chemical properties

protein length:	379 AA
molecular weight:	41089,57430 Da
isoelectric point:	5,37051
aromaticity:	0,09235
hydropathy:	-0,21873

Domains

Domains [InterPro]

DC_1202
STR
5–379

DC_1202

IPR030392
CHP
266–366

IPR030392

IPR030392
CHP
266–326

IPR030392 Coil

XRM23102.1

1 379

Architecture

STR

STR 5-379

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1202	STR	DC_1202	5	379	Novel HMM	DC_1202	Central	Low	Positional only	153 proteins / 153 hits
IPR030392	CHP	DC_0088	266	366	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	266	326	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	345	379	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SaI_NFG_5581 [NCBI]	3378340	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica subsp. enterica serovar Infantis [NCBI]	595	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Salmonella > Salmonella enterica

Coding sequence (CDS)

Genbank protein accession

XRM23102.1 [NCBI]

Genbank nucleotide accession

PQ488695.1 [NCBI]

CDS location

range 73807 -> 74946
strand -

CDS

ATGGTATACGCTCCCGGAAGTGGATTTAGAATCACTGCTAGACCTAATGGGGAATGGGGTACATGGAGAGATGATACCGGTACTTGGGTTCCTTTGGCTATTGCAGCCGGAGGTACAGGAGCTAATTCTGCTGACCAAGCTAGAAAAAATCTAGAATTAACAGAGTGGAACCTCTTATCCTCTATAGATGGTAAATACCCAAATGGGTTTAATTTTGACACTCTTGCTGTAAATAGTAAGTTTACTGTTCCACCTACTGGAGGAAATATTGTTGGTACTCGACCATACCAACAAATAAACGGGCTAGAAGACGCGTGGTTTTTCTTAGAAACTCTAGTACACCCAGATCCTAGCTATAGAATGCAAAGGGCCACCATATTTACAGGAGCTTGGAGCGGTTCAGTAAGCGTACGTATTATGCAGGGAGGTGTCTGGGGTGTATGGCAGCAAGCTCATGGGGCTTTGGGGCAATTAGTTAATGCAATTTCTAATCGAGGTGCCATTAGAGTACAGGGGGCTGCAAGTGGGGAATCTGGGTCACTAATAAGTGGTACTATTAGTGGGGGTGCATTTACTGATTGGAGATCAAGACCTACAGGAGTACTAGTAGAACATACTGGATTGGATTCTGCATCTTCTGTATTTAAAAGCGTACTGTGGGGTGTAGACTGGTTAGCCGGCATGGATGTAGTAGGCTGGAGTGCCGGTGGTGCACAGTTAAATATATATTGCAGGGGGGCGGAGTTTCATTTTGATAGCGGTGGTAATGCTGTTGCTGGTCAATGGATAAGCAGTTCTGATATTCGCATGAAAGCCAATCTTAAGGAAATTGAGAATGCTCGCGATAAGGTTAAGTCTCTAGTAGGTTATACGTACTATAAGAGAAATAATCTAGTAGAAGACAGAGATACCCTGTACAGTATTGAGGCTGGAGTTATAGCACAAGATGTGCAGACTGTTCTTCCAGAAGCGGTATACAAGATTGACCCACAGAAAGAAGATAGTATGCTTGGTGTCTCCCATGCAGGTGTCAATGCTCTTCTAGTTAATGCTTTTAATGAACTTAACGAAGTTGTTGAAAAGCAGCAACAAGAGATTGATGAGCTTAAGAAACTGGTAAAACAGTTACTTGATAAATAA

Genome Context

Tertiary structure

PDB ID

c4533a83f98bb3ee0c012e42431ba3df920a8d4843a84078db201cbfb8c219ee

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7324

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence