Protein

View in Explore

Genbank accession

WNM52999.1 [GenBank]

Protein name

pre-neck appendage protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MILRLFLDFPVELGQEFRYKTVENFKRIVNAHGRLVDDLEYHRKEEKHAHDAKQIDYTTNYSRSVSDALDKQNNRINNLVVGANGDAMAEVKDSRVALDGTISELLSQRLDYDFGKLNKKIDDNFKYLNDKIERIVNVNDYGADPTGQKDSTLAFQKAFGEGHRHVHMTEGTYIISGVKMPNYTILSGEGKGITYLRIADDAPAETIGITNLNMDGTAEYIGVDNFTIDGNRTRQGNTLSPAGGSRSSNIRFAGVKHGFAYSVESFSSLLHGIDVTYSSDDYFYQGDGIRVKEALESKYIHIQECETYDFGDDGITTHHSRYLILQNNYSHDPVKDSGNHNGIEVDDGSQHVFVMGNKTEKCFGGLEIKAHESTSAASDVVVSDHLDIKSIRSYNIRHIGHHRAGDVQSKTAYNIMLNNCTSLYPQYNGSYENTTPRAMVICAYRNVVVNNFTAIGDGNFMANMPVIAVQFRAENVMLNNINVSGFKNSLADVKVFGGANRPKKVSLSNINIVNSSNNRGIAGGGKIYDLRIINANLQGNGTGNGVELYNNTAEIVGVSAENYKRPAMIAGKEYFYMPTSLKGGFSGGAQVVQLLLKEVLLLPLLVVPLLIVTVLLL

Physico‐chemical properties

protein length:	617 AA
molecular weight:	68165,74200 Da
isoelectric point:	6,13824
aromaticity:	0,08590
hydropathy:	-0,33679

Domains

Domains [InterPro]

DC_0125
ATT
1–215

DC_0125 DC_0616

IPR012334
STR
118–579

IPR012334

IPR011050
STR
133–517

IPR011050

IPR024535
ENZ
135–366

IPR024535

WNM52999.1

1 617

Architecture

ATT

STR

ATT 1-215 | STR 216-602 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0125	ATT	DC_0125	1	215	Novel HMM	DC_0125	N-terminal	Low	Positional only	68 proteins / 68 hits
IPR012334	STR	IPR012334	118	579	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	133	517	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR024535	ENZ	DC_0410	135	366	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
DC_0616	STR	DC_0616	366	602	Novel HMM	DC_0616	Central	Low	Positional only	58 proteins / 58 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WNM52999.1

1 617

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	150	150	0,9907
Central domain	151	593	444	0,9815
C-terminal	594	617	23	0,0285

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-150

Central
151-593

C-terminal
594-617

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Staphylococcus phage S-CoN_Ph10 [NCBI]	3076566	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Staphylococcus sp. [NCBI]	29387	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

WNM52999.1 [NCBI]

Genbank nucleotide accession

OR354833 [NCBI]

CDS location

range 55248 -> 57101
strand -

CDS

ATGATTTTGAGATTATTTTTAGATTTCCCTGTTGAATTAGGGCAAGAATTTAGATATAAAACAGTAGAAAATTTTAAAAGAATTGTTAATGCTCATGGGCGCTTAGTTGATGATTTAGAATACCATAGAAAAGAAGAGAAACACGCACATGATGCTAAACAAATTGATTACACAACAAATTATTCAAGAAGTGTTAGTGATGCATTAGATAAACAGAACAATAGAATCAATAATCTAGTAGTCGGTGCAAATGGAGATGCTATGGCAGAGGTTAAAGATAGCCGAGTTGCATTAGACGGAACAATAAGTGAATTACTTTCACAAAGACTAGATTATGATTTTGGTAAATTGAATAAAAAAATTGATGATAATTTTAAGTATCTTAACGACAAAATTGAACGTATTGTTAATGTTAACGATTATGGTGCTGACCCTACAGGTCAAAAAGATTCAACATTAGCATTCCAAAAAGCATTTGGAGAAGGTCATAGACATGTTCATATGACAGAAGGTACTTATATTATATCTGGTGTTAAAATGCCTAACTATACGATTTTAAGTGGGGAAGGTAAAGGAATAACATATTTAAGGATTGCAGATGATGCGCCAGCTGAAACAATTGGTATAACTAACTTAAATATGGATGGAACAGCTGAATATATTGGTGTTGATAATTTCACAATTGACGGAAATAGAACAAGACAAGGGAATACGTTATCTCCAGCTGGTGGTTCACGTTCAAGTAACATTAGATTTGCTGGTGTTAAGCATGGCTTTGCATATTCTGTAGAATCATTTAGTAGTTTATTACATGGTATTGATGTAACGTACTCTAGTGATGATTATTTTTATCAAGGAGACGGAATCAGAGTAAAAGAAGCATTAGAAAGTAAATATATTCATATACAAGAATGTGAAACTTATGATTTCGGAGACGATGGTATTACTACTCATCATAGTAGATACTTAATTCTACAAAACAACTATTCACACGACCCAGTAAAAGATAGTGGGAACCATAACGGTATTGAAGTAGACGATGGTTCACAACATGTGTTTGTTATGGGGAATAAAACAGAAAAATGTTTTGGCGGTTTAGAGATTAAAGCGCATGAATCTACAAGCGCAGCAAGTGATGTTGTTGTAAGTGACCATCTTGATATTAAAAGTATTCGTTCTTATAATATTCGTCATATAGGACATCATAGAGCCGGAGATGTACAATCTAAAACAGCTTATAATATTATGTTGAATAACTGTACTTCATTATATCCTCAATACAATGGTTCATATGAGAACACAACACCAAGAGCAATGGTTATTTGTGCTTACAGAAATGTAGTTGTTAATAACTTTACAGCTATTGGCGATGGCAACTTTATGGCAAATATGCCAGTTATTGCTGTTCAATTCAGAGCAGAAAACGTTATGCTTAACAATATTAATGTAAGTGGTTTCAAAAATTCATTAGCTGATGTTAAAGTATTTGGTGGAGCAAATAGACCTAAAAAAGTATCATTATCTAATATCAATATTGTTAATTCATCTAACAATAGAGGTATTGCAGGTGGTGGAAAAATTTATGATTTAAGAATTATAAATGCTAACTTGCAAGGTAATGGTACAGGAAATGGTGTTGAATTATATAATAACACAGCTGAAATTGTTGGAGTAAGTGCTGAGAATTATAAGAGACCAGCGATGATTGCTGGTAAAGAATACTTTTATATGCCAACGAGTCTTAAAGGAGGGTTCAGTGGGGGAGCACAGGTGGTGCAGCTATTGCTGAAAGAAGTGCTGTTATTGCCTCTACTGGTGGTTCCTTTGCTCATAGTAACCGTTCTTTTGTTATAG

Genome Context

Tertiary structure

PDB ID

cb0b398132652d2efddb6f08561c385b9217e91f581a83fb805d7ff1ac39fce4

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7767

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence