Protein

View in Explore

Genbank accession

USL89603.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,96

Protein sequence

MSSGCGDVLSLNDLQVAKKHQIFEAEVITGKQGGVAGGADIDYATNQVTGQTQKTLPAVLRDAGFSPASFNFTTGGTLGINDANKAVLWPKEDGGDGNYYAWRGSLPKVIPAASTPLTTGGISDSAWVAFGDITFRAEADKKFKYSVKLSDFTTLQQLADAAVDSVLIDRDYTFTNGETVNFGGKVLTIDCKAKFIGDGALIFTNMASGSIIEKPFMESATTPWVIYPWTEDGKWITDAQAVAATLKQSKTEGYQPGVNDWVKFPGLEALIPQNVKDQHVASTLDIRECVGIEVRSAGGLMAAYLFRNCHHCKVIDSDTIIGGKDGIITFENLSGEWGIGNYAIGGRVHYGSGSGVQFLRNNGGASHNGGVIGVTSWRAGESGFKTWQGSVGAGTARNYNLQFRDSVALSPVWDGFDLGSDPGMAPEDDRPGDLPVSQYPMHQLPNNHMVDNILVMNSLGVGLGMDGRDGYVSNVTVQDCAGAGMLAHTFNRTFSNITVIDCNYMNFDSDQIIIIGDCIVNGIRAAGIKPQPSKGMVISAPNSTLSGVVGNVPIDRILAGNIIDSALGQTRINGFNGDSVEMGLRVHKLTKTLDSGAIRSTLNGGPGSGSAWTEITAISGSLPDAVSLKINRGDYHAVEIPVAVTVLPDAAVRDNGSISLYLDGDSLKALVKRADGSYTRLTLA

Physico‐chemical properties

protein length:	684 AA
molecular weight:	72343,47480 Da
isoelectric point:	5,12576
aromaticity:	0,07749
hydropathy:	-0,09167

Domains

Domains [InterPro]

G3DSA:2.10.10.80
ATT
69–128

G3DSA:2.10.10.80 IPR012332

G3DSA:2.10.10.80
ATT
69–135

G3DSA:2.10.10.80 IPR011050

IPR040775
RBD
71–132

IPR040775 IPR015331

USL89603.1

1 684

Architecture

ATT

STR

ATT 69-135 | STR 136-684

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	69	128	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	69	135	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR040775	RBD	DC_0821	71	132	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
IPR012332	STR	IPR012332	129	684	Merged direct domain	Autotransporter, pectate lyase C-like domain superfamily	Central	Low	Positional only	199 proteins / 199 hits
IPR011050	STR	IPR011050	135	684	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR015331	RBD	DC_0844	138	684	InterPro cluster	P22 tailspike C-terminal domain	Central	High	Text match	401 proteins / 403 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

USL89603.1

1 684

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	155	155	0,9941
Central domain	156	597	443	0,9847
C-terminal	598	684	86	0,8788

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-155

Central
156-597

C-terminal
598-684

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage nctD30 [NCBI]	2950461	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella sp. [NCBI]	599	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

USL89603.1 [NCBI]

Genbank nucleotide accession

ON409568.1 [NCBI]

CDS location

range 26996 -> 29050
strand +

CDS

ATGTCTAGTGGTTGCGGTGATGTATTGTCACTTAACGATTTACAGGTAGCTAAAAAACACCAGATTTTCGAAGCCGAGGTGATCACCGGCAAACAGGGTGGTGTAGCGGGTGGCGCAGATATCGACTACGCTACTAACCAGGTAACCGGGCAGACGCAGAAGACGCTGCCCGCGGTCTTGCGTGACGCCGGTTTCTCTCCGGCGTCTTTTAACTTCACAACCGGCGGAACCCTGGGAATTAACGACGCCAATAAAGCGGTTCTTTGGCCGAAAGAAGATGGCGGGGACGGTAACTATTACGCATGGCGTGGCTCCCTGCCGAAAGTTATCCCCGCGGCGTCTACCCCTCTAACAACCGGTGGCATTTCTGATTCTGCTTGGGTAGCTTTTGGGGACATCACCTTCCGTGCGGAAGCGGATAAGAAATTTAAATACTCCGTTAAACTGTCTGACTTCACTACTCTACAGCAACTAGCCGATGCCGCTGTTGACAGCGTTCTTATCGACCGCGATTACACCTTTACCAATGGTGAAACTGTTAACTTCGGAGGGAAAGTCTTAACCATTGACTGTAAAGCTAAGTTTATTGGTGATGGGGCTTTGATTTTCACTAATATGGCTAGTGGTTCTATAATAGAAAAGCCTTTCATGGAGAGCGCTACGACCCCGTGGGTTATTTACCCCTGGACAGAAGATGGGAAGTGGATTACAGATGCACAAGCTGTCGCTGCTACACTTAAACAATCTAAGACTGAGGGGTATCAACCGGGAGTTAATGATTGGGTCAAGTTCCCTGGTCTTGAGGCATTGATACCACAGAATGTAAAAGACCAGCATGTAGCGTCCACGCTGGATATCCGTGAGTGTGTAGGTATTGAGGTCAGAAGTGCTGGTGGACTTATGGCTGCTTACTTGTTCCGCAACTGTCATCATTGTAAGGTGATTGATTCTGACACCATCATTGGTGGTAAAGATGGCATCATCACCTTTGAAAACTTAAGTGGTGAGTGGGGCATCGGCAACTATGCCATAGGTGGCCGTGTGCATTATGGCTCAGGTAGTGGTGTGCAGTTCCTTCGAAACAACGGAGGTGCGTCGCACAATGGTGGGGTTATTGGTGTGACGTCATGGCGTGCGGGTGAGTCTGGGTTTAAAACATGGCAAGGCTCTGTAGGTGCCGGTACAGCTCGCAACTATAACCTTCAGTTCCGTGACTCAGTTGCATTATCTCCAGTGTGGGACGGCTTTGACTTAGGCTCAGACCCGGGAATGGCGCCGGAAGACGATAGACCGGGAGATTTACCGGTATCTCAATATCCTATGCATCAGCTACCTAATAACCACATGGTTGATAACATCCTTGTTATGAACTCATTAGGTGTAGGTTTAGGCATGGATGGTCGTGATGGTTATGTGTCGAATGTTACCGTGCAGGATTGTGCAGGCGCTGGTATGCTTGCTCACACATTCAACCGTACCTTCTCTAACATTACGGTGATTGACTGCAACTATATGAACTTTGATTCAGACCAGATAATCATCATTGGTGACTGTATTGTAAATGGCATCCGAGCCGCAGGCATTAAGCCTCAGCCATCCAAAGGTATGGTCATCAGCGCACCTAACTCGACCCTAAGTGGTGTTGTAGGTAACGTGCCAATAGACCGTATTCTTGCTGGTAACATTATTGACTCTGCGTTAGGACAGACAAGGATTAATGGGTTTAATGGTGACTCGGTGGAAATGGGTTTAAGAGTCCACAAGCTTACCAAAACCTTGGATAGTGGTGCTATTCGCTCTACGCTGAATGGGGGCCCCGGTTCTGGTTCCGCTTGGACTGAAATTACGGCTATATCTGGGTCATTACCGGATGCAGTATCGCTAAAAATTAACCGCGGCGACTATCACGCGGTAGAAATACCAGTAGCAGTAACAGTTTTACCTGATGCCGCTGTTCGAGATAACGGGTCTATATCCCTGTATCTGGATGGGGATAGCCTTAAGGCATTGGTTAAGCGGGCGGACGGAAGTTATACAAGATTAACTTTGGCATAA

Genome Context

Tertiary structure

PDB ID

d8e93bd85e00876614b8103ecbd872e002e93d58f152497a638fe2cd97e59e10

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6935

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence