Protein

View in Explore

Genbank accession

WNM53904.1 [GenBank]

Protein name

pre-neck appendage protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MILRLFLDFPVELGQEFRYKTVENFKRIVNAHGRLVDDLEYHRKEEKHAHDAKQIDYTTSYSRSVSDALDKQNNRINNLVVGANGDAMAEVKDSRVALDGTISELLSQRLDYDFGKLNKKIDDNFKYLNDKIERIVNVNDYGADPTGQKDSTLAFQKAFGEGHRHVHMTEGTYIISGVKMPNYTILSGEGKGITYLRIADDAPAETIGITNLNMDGTAEYIGVDNFTIDGNRTRQGNTLSPAGGSRSSNIRFAGVKHGFAYSVESFSSLLHGIDVTYASDDYFYQGDGIRVKEALESKYIHIQECETYDFGDDGITTHHSRYLILQNNYSHDPVKDSGNHNGIEVDDGSQHVFVMGNKTEKCFGGLEIKAHEPTSAASDVVVSDHLDIKSIRSYNIRHIGHHRAGDVQSKTAYNIMLNNCTSLYPQYNGSYENTTPRAMVICAYRNVVVNNFTAIGDGNFMANMPVIAVQFRAENVMLNNINVSGFKNSLADVKVFGGANRPKKVSLSNINIVNSSNNRGIAGGGKIYDLRIINANLQGNGTGNGVELYNNTAEIVGVSAENYKRPAMIAGKEYFYMPTSLKGGFSGGAQVVQLLLKEVLLLPLLVVPLLIVTVLLL

Physico‐chemical properties

protein length:	617 AA
molecular weight:	68132,75520 Da
isoelectric point:	6,13824
aromaticity:	0,08590
hydropathy:	-0,32950

Domains

Domains [InterPro]

DC_0125
ATT
1–215

DC_0125 DC_0616

IPR012334
STR
118–579

IPR012334

IPR011050
STR
133–486

IPR011050

IPR024535
ENZ
135–366

IPR024535

WNM53904.1

1 617

Architecture

ATT

STR

ATT 1-215 | STR 216-602 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0125	ATT	DC_0125	1	215	Novel HMM	DC_0125	N-terminal	Low	Positional only	68 proteins / 68 hits
IPR012334	STR	IPR012334	118	579	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	133	486	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR024535	ENZ	DC_0410	135	366	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
DC_0616	STR	DC_0616	366	602	Novel HMM	DC_0616	Central	Low	Positional only	58 proteins / 58 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WNM53904.1

1 617

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	150	150	0,9905
Central domain	151	593	444	0,9816
C-terminal	594	617	23	0,0288

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-150

Central
151-593

C-terminal
594-617

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Staphylococcus phage S-CoN_Ph15 [NCBI]	3076571	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Staphylococcus sp. [NCBI]	29387	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

WNM53904.1 [NCBI]

Genbank nucleotide accession

OR354838 [NCBI]

CDS location

range 31429 -> 33282
strand +

CDS

ATGATTTTGAGATTGTTTTTAGATTTCCCTGTTGAATTAGGGCAAGAGTTTAGATATAAAACAGTAGAAAATTTCAAAAGAATCGTTAATGCTCATGGGCGTTTAGTTGATGATTTAGAATACCATAGAAAAGAAGAAAAGCACGCACATGATGCTAAACAAATTGATTACACAACAAGTTATTCAAGAAGTGTTAGTGACGCATTAGATAAACAGAACAATAGAATCAATAATCTAGTAGTCGGTGCAAATGGAGATGCTATGGCAGAGGTTAAAGATAGCCGAGTTGCATTAGACGGAACAATAAGTGAATTACTTTCACAAAGACTAGATTATGATTTTGGTAAATTGAATAAAAAAATTGATGATAATTTTAAGTATCTTAACGACAAAATTGAACGTATTGTTAATGTTAACGATTATGGTGCTGACCCTACAGGTCAAAAAGATTCAACATTAGCATTCCAAAAAGCATTTGGAGAAGGTCATAGACATGTTCATATGACAGAAGGTACTTATATTATATCTGGTGTTAAAATGCCTAACTATACGATTTTAAGTGGGGAAGGTAAAGGAATAACATATTTAAGGATTGCAGATGATGCGCCAGCTGAAACAATTGGTATAACTAACTTAAATATGGATGGAACAGCTGAATATATTGGTGTTGATAATTTCACAATTGACGGAAATAGAACAAGACAAGGGAATACGTTATCTCCAGCTGGTGGTTCACGTTCAAGCAACATTAGATTTGCTGGTGTTAAGCATGGTTTTGCATATTCTGTAGAATCATTTAGCAGTTTATTACATGGTATTGATGTAACGTACGCTAGTGATGATTATTTCTATCAAGGAGACGGAATCAGAGTAAAAGAAGCATTAGAAAGTAAATATATTCATATACAAGAATGTGAAACTTATGATTTCGGAGACGATGGTATTACTACTCATCATAGTAGATACTTAATTCTGCAAAATAACTATTCACACGACCCAGTAAAAGATAGTGGGAACCATAACGGGATTGAAGTGGACGATGGTTCACAACATGTGTTTGTAATGGGGAATAAAACAGAAAAATGTTTTGGTGGTTTAGAGATTAAAGCGCATGAACCTACAAGCGCAGCAAGTGATGTTGTTGTAAGTGACCATCTTGATATTAAAAGTATTCGTTCTTATAATATTCGTCATATAGGACATCATAGAGCCGGAGATGTACAATCTAAAACAGCCTATAATATTATGTTGAATAACTGTACTTCATTATATCCTCAATATAATGGTTCATATGAGAATACAACACCAAGAGCAATGGTTATTTGTGCTTACAGAAATGTGGTTGTTAATAACTTTACAGCTATTGGCGATGGCAATTTTATGGCAAATATGCCAGTTATCGCTGTCCAATTCAGAGCAGAAAACGTTATGCTTAACAATATTAATGTAAGTGGTTTTAAAAATTCATTAGCTGACGTTAAAGTATTTGGTGGAGCAAATAGACCTAAAAAAGTATCATTATCTAATATCAATATTGTTAATTCATCTAACAATAGAGGTATTGCAGGCGGTGGAAAAATTTATGATTTAAGAATTATAAATGCTAACTTGCAAGGTAATGGCACAGGAAATGGCGTTGAATTATATAATAACACAGCTGAAATTGTTGGAGTAAGTGCAGAGAATTATAAAAGACCAGCAATGATTGCGGGTAAAGAATATTTCTATATGCCCACAAGTCTTAAAGGAGGATTCAGTGGGGGAGCACAGGTGGTGCAGCTATTGCTGAAAGAAGTGCTGTTATTGCCTCTACTGGTGGTTCCTTTGCTCATAGTAACCGTTCTTTTGTTATAG

Genome Context

Tertiary structure

PDB ID

90c3fec6ac3a5648759470980882496096aee1ed6341584bafc1060bdc925081

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7773

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence