Protein

View in Explore

Genbank accession

WDR21909.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,91

Protein sequence

MEKMMASFGNGYTKTQVISENNSIKYKISFAAGSVFSTPSSAYFTFQDNPIGNQQDGAGINIRVFNPALNTVSAKKTFLLTPNDNDPGNRAFIEYLSTFTQDNTNLLIFTTSGDIKTSNLVENKFKSIYSTMWPNKWMTSRYSCTYCGLFSIKNNKIIAENVTYSDGVLRDEDIRPALEFVYDKADDIGATGFSYRAVEDFEEYTSSAATIKRYPVDSASGVEISSIGISPGDILFWSFEFLHGDNIPPEVPGTNNNKIRIEIRWLNSSGGWIKSVNVDSNHANAGKWIQHEQTVEVPADAARIVILASKTTPTDTVGTGGVRSMILTETSRATEALTSPSAISVNGIRLNTIVSGDNPTLLILPANEVDSTGKPLPGEDVSGIIYSSDWREFEKNI

Physico‐chemical properties

protein length:	397 AA
molecular weight:	43545,09570 Da
isoelectric point:	4,92597
aromaticity:	0,09824
hydropathy:	-0,28212

Domains

Domains [InterPro]

DC_0912
STR
1–397

DC_0912

PS52031
LEC
22–197

PS52031

WDR21909.1

1 397

Architecture

STR

STR 1-397

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0912	STR	DC_0912	1	397	Novel HMM	DC_0912	Central	Low	Positional only	506 proteins / 506 hits
PS52031	LEC	DC_0243	22	197	InterPro cluster	GG-type lectin domain profile.	Central	High	Text match	588 proteins / 589 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WDR21909.1

1 397

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	141	141	0,3847
Central domain	142	386	246	0,5699
C-terminal	387	397	10	0,2255

Note: Constraints were applied during segmentation.
Fixed 64 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-141

Central
142-386

C-terminal
387-397

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage vB_SenM_UTK0003 [NCBI]	3028906	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

WDR21909.1 [NCBI]

Genbank nucleotide accession

OQ359887 [NCBI]

CDS location

range 147612 -> 148805
strand +

CDS

ATGGAAAAAATGATGGCGAGTTTTGGTAACGGATATACCAAAACTCAAGTTATTTCTGAAAATAATTCCATCAAATACAAAATTTCATTTGCTGCGGGGTCGGTTTTTTCGACCCCTTCTTCTGCTTATTTTACCTTTCAGGATAATCCAATAGGTAACCAGCAAGATGGTGCTGGTATAAATATCAGAGTTTTTAATCCAGCATTGAATACTGTATCTGCTAAGAAAACATTTTTATTGACACCCAATGATAATGACCCAGGCAATAGAGCATTCATTGAATATTTGTCAACATTTACTCAAGATAATACTAACTTGTTAATATTCACCACATCAGGTGATATTAAAACGAGCAATTTAGTAGAGAATAAATTTAAGTCCATTTATTCAACTATGTGGCCAAATAAATGGATGACATCTCGGTATTCATGTACTTATTGCGGTTTATTTTCAATAAAAAATAATAAAATTATTGCCGAAAACGTAACATATTCTGATGGAGTTCTTCGGGACGAAGACATCAGACCTGCTTTAGAATTCGTTTATGATAAAGCTGATGATATTGGAGCTACCGGGTTTTCTTATAGAGCTGTTGAAGATTTTGAAGAATACACTAGTTCCGCAGCAACAATAAAAAGATATCCAGTTGATTCTGCTTCGGGCGTAGAAATTAGCTCAATTGGAATATCTCCTGGCGATATTCTGTTCTGGTCATTTGAATTTTTGCATGGAGATAATATTCCGCCGGAAGTTCCAGGGACAAATAATAATAAAATAAGAATAGAAATAAGATGGTTAAATTCATCTGGAGGGTGGATTAAATCAGTTAATGTTGACTCTAACCACGCAAATGCTGGAAAATGGATACAGCACGAACAAACTGTTGAAGTCCCTGCTGACGCTGCCCGGATAGTTATTCTTGCTTCTAAAACTACTCCAACTGATACGGTCGGTACTGGAGGTGTTCGTAGTATGATTTTAACTGAAACTTCGCGAGCTACTGAGGCATTAACTTCTCCATCTGCGATATCAGTTAATGGTATTCGTTTGAATACTATAGTTTCAGGAGATAACCCGACGCTGCTTATTTTACCTGCTAACGAAGTTGATTCAACTGGCAAACCATTACCAGGTGAAGATGTTTCAGGAATAATTTACAGTTCTGATTGGAGAGAGTTTGAGAAAAATATTTAA

Genome Context

Tertiary structure

PDB ID

0e523b87fab880009bfc175b550453737fefd5bb3e6192f95b5fea5240bf9263

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6326

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Characterization of a Diverse Collection of Salmonella Phages Isolated from Tennessee Wastewater	Hudson,L.K., Wang,J., Bryan,D.W. and Denes,T.G.	—	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature