Protein

View in Explore

Genbank accession

UQT03604.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MVDLTKDAKLIAIDLINEANGTNFTDKTIALSGPVVNNFVLNGLNTEVTASPNAGDSNDIPVTTYYSRLHLNHLLERPYAALENQAPSRLAGLLPSINAKYRLGLTAADIVDGPYRPDDVATGIRHVQIEANPNSYGYIGKTDIYLGDSALVADWFERPHYQFSRDFGAVTFMGNSYNFPDTDIRFAGPIQTITLNSRIKAVSIDTDRQYRAFESYPVNGTLVAHFNNGVMKEIVGNRGETSYDENGILLDIMPDLPSFMDNIHEDVRILKSYGNGNITYSTDYDVGKRKATSGLTYYVDNVAGNDQNDGQSEGKAFKSFNRALMATPAARIIMVKGTDVYYDANNGWTSSVNNRSLDVIGFGPKKPIFTATVNDLTWKQQSESMWYTDRIRLAAFVDMNNVTLAAGPVRMTAAKTLDDCRINQSTYYFDNVSGRTYVHLFDDRQPDDKVLGIMASNSGRTENGSTVYMENLQFQYTYRGFQTEITQAKVVGYLYAKNCDFGWSWTDAGLNSWGTNVVTQGCTAQWCQRGGFRYNSDRVTPTMGIKPWVVEIGAVVKQCGFDGTGQGVGSGISGNVTIMRIGGSYSDCEGNFVQDTGDNTYSLNLSLTTFKSRWNNPDAAAYTNGLNSVRAAVAHYWSCTMDSSALSIYPKGKGQAFLHNTLVGARPCYQRETPYRFIYTKKG

Physico‐chemical properties

protein length:	683 AA
molecular weight:	75504,37210 Da
isoelectric point:	5,80476
aromaticity:	0,11127
hydropathy:	-0,37789

Domains

Domains [InterPro]

IPR057701
STR
1–146

IPR057701 DC_1219

DC_0675
STR
1–156

DC_0675

UQT03604.1

1 683

Architecture

STR

STR 1-156 | STR 320-669 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR057701	STR	DC_0658	1	146	InterPro cluster	Protein of unknown function DUF7941	Central	Low	Positional only	54 proteins / 54 hits
DC_0675	STR	DC_0675	1	156	Novel HMM	DC_0675	Central	Low	Positional only	25 proteins / 25 hits
DC_1219	STR	DC_1219	320	669	Novel HMM	DC_1219	Central	Low	Positional only	59 proteins / 59 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

UQT03604.1

1 683

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	108	108	0,9040
Central domain	109	672	565	0,9647
C-terminal	673	683	10	0,3727

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-108

Central
109-672

C-terminal
673-683

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Serratia phage vB_SmaM-Kodama [NCBI]	2943835	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Serratia marcescens [NCBI]	615	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

UQT03604.1 [NCBI]

Genbank nucleotide accession

ON287376.1 [NCBI]

CDS location

range 148317 -> 150368
strand +

CDS

ATGGTTGACTTAACCAAAGACGCTAAACTCATTGCGATTGACCTCATCAATGAAGCTAACGGAACTAACTTTACCGATAAAACTATCGCGTTGTCAGGGCCGGTTGTAAACAACTTCGTGTTGAACGGTCTGAATACGGAAGTTACTGCTTCGCCTAACGCAGGTGATAGCAATGACATTCCGGTAACTACTTATTATTCCCGTCTCCATCTGAACCATTTGCTGGAACGTCCTTACGCCGCCTTAGAGAACCAAGCACCTTCTCGCCTGGCTGGTTTACTTCCTTCTATCAACGCTAAGTATCGCCTCGGTCTGACCGCTGCAGATATCGTTGATGGCCCGTATCGTCCTGACGATGTAGCGACTGGTATTCGTCACGTTCAGATCGAAGCTAACCCGAACAGTTACGGTTACATCGGTAAGACTGACATCTATCTGGGTGATAGCGCTCTGGTAGCCGATTGGTTTGAACGTCCTCATTATCAGTTCTCTCGTGACTTCGGCGCAGTTACCTTCATGGGTAACAGCTATAACTTCCCTGATACCGATATCCGATTCGCTGGCCCTATTCAGACTATTACTCTCAATAGCCGGATCAAAGCTGTGAGCATCGATACTGACCGCCAATACCGTGCTTTCGAAAGCTACCCGGTAAACGGTACGTTGGTTGCGCACTTCAATAACGGCGTGATGAAAGAGATCGTTGGTAACCGTGGCGAAACGAGCTACGATGAAAACGGTATTCTTCTGGATATCATGCCGGATCTCCCTTCCTTCATGGACAACATCCACGAAGATGTACGCATCCTCAAATCGTACGGTAACGGGAACATTACCTACAGCACCGACTACGACGTAGGTAAGCGCAAGGCAACTTCTGGCTTGACTTACTACGTTGATAACGTAGCGGGTAACGATCAGAACGATGGTCAGTCGGAAGGTAAAGCATTCAAGTCGTTTAACCGCGCATTGATGGCAACTCCTGCTGCCCGTATCATCATGGTCAAAGGGACGGATGTTTATTACGATGCCAACAACGGCTGGACGAGTTCAGTTAATAACCGTTCTCTGGACGTCATCGGCTTCGGCCCTAAAAAGCCTATCTTCACGGCGACCGTAAACGACCTCACCTGGAAACAGCAAAGTGAGTCCATGTGGTATACCGACCGTATCCGTTTGGCTGCCTTCGTTGACATGAACAACGTAACGCTGGCCGCTGGCCCAGTCCGTATGACCGCTGCTAAGACGCTGGACGACTGCCGTATCAACCAGTCTACCTATTACTTCGACAACGTGTCTGGTCGTACTTACGTTCACTTGTTTGACGATCGTCAACCAGATGACAAAGTTCTGGGTATCATGGCAAGTAACTCTGGTCGTACCGAGAACGGGTCTACTGTTTACATGGAAAACCTTCAGTTCCAGTACACTTACCGTGGCTTCCAGACTGAAATCACTCAGGCTAAAGTAGTTGGGTATCTGTACGCTAAGAACTGCGACTTCGGCTGGAGCTGGACTGATGCTGGTCTTAACAGCTGGGGTACTAACGTTGTTACTCAGGGCTGTACCGCTCAGTGGTGTCAGCGTGGCGGTTTCCGTTATAACTCAGACCGCGTAACTCCAACCATGGGTATCAAACCTTGGGTTGTTGAAATCGGCGCAGTTGTTAAGCAGTGCGGTTTTGACGGTACTGGTCAGGGCGTAGGTTCCGGTATCTCCGGTAACGTAACTATCATGCGTATTGGCGGTAGCTATTCTGATTGCGAAGGTAACTTCGTTCAGGACACCGGTGACAATACCTACTCGCTCAACCTGAGTTTGACTACGTTTAAATCTCGGTGGAATAACCCAGATGCGGCCGCGTACACTAACGGCCTGAACTCAGTGCGTGCAGCAGTTGCACATTACTGGAGCTGCACTATGGACAGCAGCGCTTTGTCTATCTATCCGAAAGGCAAAGGTCAAGCGTTCTTGCACAACACGTTAGTAGGTGCACGTCCCTGCTACCAGCGCGAAACGCCGTATCGTTTTATTTACACTAAGAAAGGGTAA

Genome Context

Tertiary structure

PDB ID

861b6c182fa02f7aa546d828211d6d3419c0a286e61f12163c2c4a62422f31a1

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6866

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence