Protein

View in Explore

Genbank accession

QEA10163.1 [GenBank]

Protein name

tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Evidence UniProt/TrEMBL

Probability 1,00

Protein sequence

MTRNVEELFGGVITAPHQIPFTYKSNVGGETFLSLPFYPVTGVVTINGGMQVPLDNFEIDGNTLNLGRALSKGDVVYCLFDKILSPEDTAKGIRIYKFQAVGGETEFTPDFTSYGVQSLYIGGEYKTPEIEYSYDSTTGKVSLQTALTAGVWVVAEMSVKQPNISPAFDRSIQEIARSANVKDSEVIVSTDTISLLDGKKVIYDIAAQTSYGLPTIPDGSVISSVSGGKLNYNPGDVQVDLLPLPDSSQAVKLFYLQPSGAENIKVSSGDTVQDILNNINKHRVVSSISELLNVSPTETTFVFVASFHPSTNYGGGFFRWDPSGNKAAHNGGTIIDPGKTFPTWDSAGKTSWFTASGTGTGVWRRQDVMGHYRAEDFGALPWNVGDAHDSTKEFQQVANVAYRGGCWRWTGRHRITSYIDIPNKQTFGSYAQMTSVYSELFQPSNFQGVHVISDPSLARSVQNAVFFDAATGEAFRCGEGASPTDCLVYGRGFTTTGMDLATSLPSAASYCDTQAFRHGKAINVRNVTVALMKYALDSNPWDASKGDYYSTTDHMTILYCYCISRVPTGQDITFNTKHINMRAYVNQIGDYGLAVRNVVFIGGSIEGYNTSTFLRSSTQLSFKGTYFETGDTSFNGTVFSLVGWCTLNFEECLVYLNNTTNFVSSGGSGQSAGVLGLTIKSQGNVWRKTDAGTTTVFAVDPVTNKQALVGSEILNAASGATIAYWAGAVPPGTYTAPISVAF

Physico‐chemical properties

protein length:	742 AA
molecular weight:	80144,58860 Da
isoelectric point:	5,33021
aromaticity:	0,11321
hydropathy:	-0,13194

Domains

Domains [InterPro]

DC_0116
ATT
1–93

DC_0116 G3DSA:3.30.2020.50 IPR059934 DC_0516

G3DSA:3.30.2020.50
ATT
160–244

G3DSA:3.30.2020.50

QEA10163.1

1 742

Architecture

ATT

RBD

STR

ATT 1-93 | ATT 156-244 | RBD 280-366 | STR 367-742

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0116	ATT	DC_0116	1	93	Novel HMM	DC_0116	N-terminal	Low	Positional only	93 proteins / 93 hits
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	156	244	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	160	244	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
IPR059934	RBD	DC_0541	280	366	InterPro cluster	Phage tail protein-like, small four-stranded beta-sheet domain	C-terminal	Low	Positional only	683 proteins / 690 hits
DC_0516	STR	DC_0516	367	742	Novel HMM	DC_0516	Central	Low	Positional only	16 proteins / 16 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QEA10163.1

1 742

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	387	387	0,9880
Central domain	388	716	330	0,9847
C-terminal	717	742	25	0,4402

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-387

Central
388-716

C-terminal
717-742

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage Matapan [NCBI]	2596713	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica [NCBI]	28901	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QEA10163.1 [NCBI]

Genbank nucleotide accession

MN066127.1 [NCBI]

CDS location

range 35404 -> 37632
strand +

CDS

ATGACCAGAAATGTAGAAGAATTATTCGGCGGCGTAATCACAGCTCCCCACCAGATTCCTTTCACGTATAAATCAAATGTCGGTGGAGAAACTTTCCTTTCCTTGCCGTTCTATCCTGTCACTGGCGTAGTCACAATTAACGGCGGCATGCAAGTTCCGTTAGACAACTTCGAGATAGACGGGAATACGTTGAATCTCGGGCGCGCATTGTCCAAAGGCGATGTTGTGTATTGCTTATTCGATAAAATTCTTTCACCAGAAGACACTGCCAAAGGCATCCGCATATACAAATTTCAAGCCGTGGGTGGAGAAACTGAATTCACGCCTGACTTTACTTCTTATGGTGTACAGTCTCTTTATATCGGTGGCGAATACAAAACACCCGAAATTGAATATTCCTATGACAGCACGACAGGGAAAGTATCTTTGCAAACTGCACTGACTGCAGGCGTTTGGGTAGTCGCTGAAATGTCTGTTAAACAACCGAATATCAGTCCGGCGTTTGACCGAAGTATTCAAGAAATCGCCCGTTCTGCTAATGTAAAAGACTCTGAAGTCATCGTTAGTACGGACACCATATCTTTATTGGATGGGAAGAAAGTTATTTATGACATAGCGGCGCAAACCAGTTATGGCTTACCAACCATTCCTGATGGTTCTGTCATTTCTTCTGTATCTGGTGGGAAATTGAATTACAACCCAGGTGATGTGCAGGTTGATCTCTTACCATTACCAGATTCTTCTCAGGCGGTTAAATTATTCTACTTGCAACCAAGTGGCGCAGAAAATATCAAAGTTTCCAGTGGCGACACAGTACAAGATATTCTGAATAATATCAATAAACACCGTGTTGTGAGCAGCATTTCAGAACTTTTGAATGTGTCTCCAACTGAAACGACCTTCGTGTTTGTGGCTTCTTTCCACCCATCAACCAATTATGGTGGTGGTTTCTTCCGTTGGGATCCTTCTGGGAACAAGGCTGCTCACAACGGCGGCACGATCATCGATCCTGGTAAAACGTTCCCGACTTGGGACAGCGCAGGGAAGACTTCTTGGTTTACCGCAAGCGGGACAGGTACTGGAGTTTGGCGTCGTCAAGACGTGATGGGTCATTACCGCGCTGAAGACTTTGGTGCGCTTCCTTGGAACGTCGGGGACGCGCATGACAGTACCAAAGAATTCCAACAAGTGGCCAACGTGGCATATCGGGGCGGTTGCTGGAGATGGACAGGTCGCCATCGCATTACGAGTTATATTGATATTCCCAATAAACAGACTTTTGGTTCATACGCCCAAATGACTTCTGTTTATTCTGAACTATTCCAGCCCAGCAATTTCCAGGGGGTGCACGTTATTTCTGATCCTTCTTTAGCGCGTTCTGTACAAAATGCTGTCTTCTTTGATGCTGCGACTGGAGAAGCATTCCGTTGTGGTGAAGGTGCATCACCAACAGATTGTTTGGTGTACGGAAGAGGGTTTACAACTACTGGGATGGATTTGGCGACATCATTACCTTCGGCGGCGTCGTATTGTGACACCCAAGCATTCCGTCATGGAAAGGCCATTAACGTGCGAAATGTTACTGTGGCGCTTATGAAGTACGCGTTGGATTCTAATCCATGGGATGCCAGCAAAGGTGATTATTATTCCACAACGGATCATATGACGATTTTGTATTGTTATTGCATTAGTCGTGTACCAACTGGCCAGGATATAACATTTAACACCAAGCATATCAATATGCGTGCATATGTAAACCAGATTGGCGATTATGGATTGGCAGTCCGAAATGTGGTGTTTATCGGTGGATCCATAGAAGGATATAACACTTCAACATTCTTACGATCCAGTACTCAACTTTCTTTCAAAGGCACATATTTTGAAACGGGTGACACGTCATTCAATGGTACAGTATTCAGCCTTGTTGGTTGGTGTACTCTTAACTTTGAAGAATGTCTTGTTTATTTGAACAACACCACAAACTTCGTGTCTTCTGGTGGTTCTGGGCAATCTGCTGGCGTCTTGGGTCTAACGATTAAATCTCAAGGTAACGTGTGGCGTAAAACTGACGCGGGGACAACCACAGTGTTTGCAGTTGACCCAGTCACTAATAAACAAGCCTTAGTTGGATCCGAAATATTGAATGCTGCGAGTGGGGCAACTATCGCATATTGGGCTGGTGCCGTCCCACCTGGCACATACACGGCTCCAATCAGTGTTGCATTTTAA

Genome Context

Tertiary structure

PDB ID

521fac8e15f56345ae178c0d12d4fccc986e1fa0ee0c80e913c410855cf8d5b7

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7233

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence