Protein

View in Explore

Genbank accession

QPI15383.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MGYFQMTRNVEELFGGVVTAPHQIPFTYKSSVGGETFFSLPFYPVTGVITINGGMQVPLDNFEIDGNTLNLGRALSKGDVVYCLFDKILSPEDTAKGIRIYKFQAVGGETEFTPDFTSYGVQSLYIGGEYKTPDIEYSYNSTTGKVSLQTALTAGVWVVAEMSVKQPNISPAFDRSIQEIARSANVKDSEVIVSTDTISLLDGKKVVYDIAAQTSYGLPTIPDGSVISSVSGGKLTYNPGDVQVDLLPLPDSAQAVKLFYLQPSGAENIKVSSGDTVQDILNNINKHRVVSSISELLNVSPTETTFVFVASFHPSTNYGGGFFRWDPSGNKAAHNGGTIIDPGKTFPTWDSAGKTSWFTASGTGTGVWRRQDVMGHYRAEDFGALPWNVGDAHDSTKEFQQVANVAYRGGCWRWTGRHRITSYIDIPNKQTFGSYAQMTSVYSELFQPSNFQGVHVISDPSLARSVQNAVFYDAATGEAFRCGEGASPTDCLVYGRGFTTTGMDVATSLPPASSYCDTQAFRHSKAINVRNVTVALMKYALDSNPWDASKGDYYSTTDHMVILYCYCISRVPTGQDITFNTKHINIRAYVNQIGDYGKAVRNVVFIGGSIEGYNTSTFLRDSTQLSFKGTYFETGDAGFNGNVFSLIGWCTLNFEECLVYLNNTTNFVSSGGSGQSAGVLGLTIKSQGNVWRKTDAGTTTVFAVDLVTNKQAIIGSEVLNAASGATIAYWAGAVPPGTYTAPISIAF

Physico‐chemical properties

protein length:	747 AA
molecular weight:	80798,35880 Da
isoelectric point:	5,39774
aromaticity:	0,11647
hydropathy:	-0,12744

Domains

Domains [InterPro]

DC_0041
STR
4–265

DC_0041 IPR059934 DC_0516

G3DSA:3.30.2020.50
ATT
161–249

G3DSA:3.30.2020.50

QPI15383.1

1 747

Architecture

STR

ATT

STR

RBD

STR

STR 4-160 | ATT 161-249 | STR 250-265 | RBD 285-371 | STR 372-747

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0041	STR	DC_0041	4	265	Novel HMM	DC_0041	Central	Low	Positional only	179 proteins / 179 hits
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	161	249	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits
IPR059934	RBD	DC_0541	285	371	InterPro cluster	Phage tail protein-like, small four-stranded beta-sheet domain	C-terminal	Low	Positional only	683 proteins / 690 hits
DC_0516	STR	DC_0516	372	747	Novel HMM	DC_0516	Central	Low	Positional only	16 proteins / 16 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QPI15383.1

1 747

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	392	392	0,9924
Central domain	393	736	345	0,9726
C-terminal	737	747	10	0,2177

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-392

Central
393-736

C-terminal
737-747

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage GEC_vB_N6 [NCBI]	2777379	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica [NCBI]	28901	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QPI15383.1 [NCBI]

Genbank nucleotide accession

MW006480.1 [NCBI]

CDS location

range 122755 -> 124998
strand -

CDS

ATGGGGTATTTTCAAATGACCAGAAATGTAGAAGAATTATTCGGCGGCGTAGTCACAGCTCCCCACCAGATTCCTTTCACTTATAAATCAAGTGTCGGTGGAGAAACTTTCTTTTCTCTACCTTTCTATCCTGTCACTGGTGTTATCACAATTAACGGCGGCATGCAAGTTCCGTTAGACAACTTCGAGATAGACGGGAATACGTTGAATCTCGGGCGCGCATTGTCCAAAGGCGATGTTGTGTATTGCTTATTCGATAAAATTCTTTCACCAGAAGACACTGCCAAAGGCATCCGCATATACAAATTTCAAGCCGTGGGTGGAGAAACTGAATTCACGCCTGACTTTACTTCTTATGGTGTACAGTCTCTTTATATCGGTGGCGAATACAAAACTCCTGATATAGAATATTCCTATAACAGCACGACAGGGAAAGTGTCTTTGCAAACTGCATTGACTGCAGGCGTTTGGGTAGTCGCTGAAATGTCTGTTAAACAACCGAATATCAGTCCGGCGTTTGATCGCAGTATTCAAGAAATTGCCCGTTCTGCTAATGTGAAAGACTCTGAAGTCATCGTTAGTACGGACACCATATCTTTATTGGATGGGAAGAAAGTTGTTTATGACATAGCGGCGCAAACCAGTTATGGCTTACCAACCATTCCTGATGGTTCTGTCATTTCTTCTGTATCTGGAGGGAAATTGACTTATAATCCAGGTGATGTGCAGGTTGATCTGTTACCATTACCCGATTCTGCCCAGGCAGTTAAATTATTCTACTTGCAACCAAGTGGCGCAGAAAATATCAAAGTTTCCAGTGGCGACACAGTACAAGATATTCTGAATAATATCAATAAACACCGTGTTGTGAGCAGCATTTCAGAACTTTTGAATGTGTCTCCAACTGAAACGACCTTCGTATTTGTGGCATCTTTCCACCCATCAACCAATTATGGTGGTGGTTTCTTCCGTTGGGATCCTTCTGGGAACAAGGCTGCTCACAATGGCGGCACGATCATCGATCCTGGTAAAACGTTCCCGACTTGGGACAGCGCAGGGAAGACTTCTTGGTTTACCGCAAGCGGGACAGGTACTGGAGTTTGGCGTCGTCAAGACGTGATGGGCCATTACCGCGCTGAAGACTTTGGTGCTCTCCCTTGGAACGTCGGGGACGCGCATGACAGTACCAAAGAATTCCAACAAGTGGCCAACGTGGCATATCGGGGTGGATGTTGGAGGTGGACAGGACGGCATCGCATCACAAGTTATATTGATATCCCGAATAAACAGACCTTTGGTTCATATGCTCAAATGACATCTGTGTATTCAGAATTATTCCAGCCGAGTAATTTCCAAGGAGTACACGTTATTTCTGATCCTTCTTTGGCGCGTTCAGTGCAAAATGCGGTCTTCTATGACGCTGCGACTGGGGAAGCATTCCGTTGTGGTGAAGGTGCTTCACCAACGGATTGTTTGGTGTATGGAAGAGGATTCACAACGACGGGGATGGATGTGGCTACCTCTCTACCCCCAGCTTCATCATATTGTGACACTCAGGCTTTCCGTCATAGTAAAGCCATCAACGTGCGGAATGTCACAGTTGCTCTTATGAAATATGCACTGGATTCTAATCCTTGGGACGCCAGCAAAGGTGATTATTATTCAACCACCGATCATATGGTGATTTTGTATTGCTATTGTATCAGCCGAGTTCCAACAGGACAAGACATTACGTTCAACACCAAGCATATCAACATACGCGCCTACGTTAATCAGATTGGGGATTACGGGAAGGCTGTACGAAATGTAGTGTTTATCGGCGGTTCAATAGAAGGATACAACACTTCGACGTTTTTGCGTGACAGTACTCAACTTTCTTTCAAAGGAACATATTTTGAAACAGGTGATGCTGGGTTTAACGGAAATGTGTTCAGTCTTATTGGTTGGTGTACCCTGAATTTTGAAGAATGTCTTGTTTATTTGAATAACACTACAAACTTCGTGTCTTCTGGTGGTTCTGGGCAATCTGCTGGCGTCTTGGGTCTAACGATTAAATCTCAAGGTAATGTGTGGCGCAAAACTGACGCAGGTACAACAACAGTATTCGCTGTCGATTTGGTGACCAATAAACAGGCCATTATTGGTTCTGAAGTATTGAATGCCGCCAGTGGAGCAACAATCGCGTATTGGGCAGGTGCTGTCCCTCCAGGTACTTACACCGCTCCGATCAGCATTGCATTTTAA

Genome Context

Tertiary structure

PDB ID

c84afeb4ca22c8026616e482f0906792ad333107900a73b7819cf2d6a0dca473

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7281

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence