Protein

View in Explore

Genbank accession

WCF56983.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,90

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MAIQDKFNKSNVIYKITRDIDLDGGTLTIPAGCTLDFQGGTFNNGTIILSSGIYFKGTNTKFNGVFLKYNSNISNVKIEGIEFVGSKNTNAQSADELTAAIRYTGEVSIDVLLIRDCIIHGYNSGIMLKASNAIIEDNTFYDNGALETIVGVHDGEVDISFYAATSNIKNNIIIKNNKCLSNYVHRNIDAGELKAETNIIIDGNICISQSSLNVEDPVTLRKSTCIMVGYRGVQDFNTPVIICNNICKHSSWSGIYIRGTNPSDVDYKTKYIANIHNNYLENITQVEDNTYFGAIAVVLKEGSIIEGNTIVKCTQGINLGFIHKDSHTSVIGNTILDCNWAIWNDSYSYNLNIQSNTIKKAVMGIIVNEVAASATDVASKQATILDNVIELSSEGNIGIRIYTYYGKNLKVDGNTIYCVKGTGIGIQIAQLSTSTELYPYVVSNNNLNNLNVGIQIEPTTFLRNEGRYVDFNRFFNCTTGIVFNTNLSGSLFVVEGNSFQSCDNIFNNQKGISALFEGKHKTNDTFIIYDNYEGVDYNNSTYGYLVDPPVCFRKKKFLEGDEVVSFKGYFSKAICQTSAPDASSDSYSKWKVEGGAMTTQVSNFCAVTGQIVYDSTLKKGKLWNGTAWVNLDGTPLA

Physico‐chemical properties

protein length:	637 AA
molecular weight:	70007,96070 Da
isoelectric point:	5,35755
aromaticity:	0,10047
hydropathy:	-0,12716

Domains

Domains [InterPro]

IPR012334
STR
2–438

IPR012334 DC_1055

IPR011050
STR
30–278

IPR011050 IPR011050

IPR006626
Unmapped
32–57

IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

DC_1643
STR
38–522

DC_1643

WCF56983.1

1 637

Architecture

STR

STR 2-522 | STR 555-636 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR012334	STR	IPR012334	2	438	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	30	278	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	32	57	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_1643	STR	DC_1643	38	522	Novel HMM	DC_1643	Central	Low	Positional only	8 proteins / 8 hits
IPR006626	Unmapped	-	73	105	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	130	156	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	237	259	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR011050	STR	IPR011050	291	458	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR006626	Unmapped	-	300	321	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	325	346	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	348	369	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	379	403	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	406	430	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	437	458	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_1055	STR	DC_1055	555	636	Novel HMM	DC_1055	Central	Low	Positional only	8 proteins / 8 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WCF56983.1

1 637

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	30	30	0,6291
Central domain	31	540	511	0,9789
C-terminal	541	637	96	0,9578

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-30

Central
31-540

C-terminal
541-637

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacteroides phage PhiCrAssBcn9 [NCBI]	3023115	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacteroides intestinalis [NCBI]	329854	cellular organisms > Bacteria > Pseudomonadati > FCB group > Bacteroidota/Chlorobiota group > Bacteroidota

Coding sequence (CDS)

Genbank protein accession

WCF56983.1 [NCBI]

Genbank nucleotide accession

OQ221544.1 [NCBI]

CDS location

range 23214 -> 25127
strand +

CDS

ATGGCAATACAAGATAAATTTAATAAGTCTAATGTTATCTATAAGATAACAAGGGATATAGACCTTGATGGGGGTACTCTTACTATACCAGCAGGATGCACTCTTGACTTTCAGGGAGGCACATTTAATAATGGTACTATTATATTGTCAAGTGGAATCTATTTTAAGGGAACTAATACAAAGTTTAATGGAGTATTTCTTAAATATAATAGTAATATTAGTAATGTTAAAATTGAGGGTATTGAGTTTGTAGGTAGTAAAAATACAAATGCCCAAAGTGCAGATGAATTAACTGCTGCAATAAGATATACAGGTGAAGTGTCTATTGATGTGTTATTAATAAGAGATTGTATTATACATGGGTATAACTCAGGTATTATGTTAAAAGCATCTAATGCTATTATAGAGGATAATACATTCTATGATAATGGAGCATTAGAAACTATAGTAGGAGTACATGATGGAGAAGTTGATATATCTTTTTATGCTGCTACCTCTAATATAAAAAATAACATTATTATTAAAAATAATAAATGTTTATCTAACTATGTACATAGAAATATTGATGCTGGAGAACTTAAAGCAGAGACTAATATTATAATTGATGGTAATATATGTATCTCACAGTCCTCATTAAATGTAGAAGACCCTGTTACTCTTAGAAAGAGTACTTGTATTATGGTAGGCTATAGAGGTGTACAGGACTTTAATACACCTGTTATTATATGTAATAATATATGTAAACATTCAAGTTGGTCAGGTATTTACATTAGAGGAACTAATCCATCTGATGTTGATTATAAGACAAAATACATTGCAAACATACATAATAATTACTTGGAGAATATTACACAAGTTGAGGACAATACATATTTTGGGGCTATAGCTGTAGTATTAAAAGAAGGTTCTATTATAGAGGGTAATACTATTGTAAAATGTACACAGGGAATAAACTTGGGTTTTATACATAAAGATTCACATACATCTGTAATAGGAAATACAATACTTGATTGTAATTGGGCTATATGGAATGATAGTTATTCATATAATCTGAATATTCAAAGTAACACAATTAAGAAAGCTGTAATGGGTATTATTGTCAATGAAGTTGCAGCTTCTGCAACTGATGTTGCATCTAAGCAAGCTACTATCCTTGATAATGTTATTGAGTTATCATCAGAAGGAAATATCGGAATTAGGATATATACCTATTATGGTAAAAATTTAAAAGTAGATGGTAATACTATTTACTGTGTTAAAGGTACTGGTATTGGTATTCAGATTGCACAACTTTCCACTTCTACAGAACTATACCCTTATGTAGTTTCAAATAATAACCTGAATAATCTTAATGTAGGTATCCAAATAGAACCTACTACTTTCCTTAGAAATGAGGGTAGATATGTTGATTTTAATAGGTTCTTTAACTGTACAACAGGTATTGTCTTCAATACTAATCTTTCTGGTTCACTTTTTGTGGTAGAGGGAAACTCTTTTCAAAGTTGTGATAACATATTTAATAATCAGAAAGGTATAAGTGCATTATTTGAAGGAAAACATAAAACAAATGATACCTTTATTATATATGATAACTATGAAGGAGTAGATTATAATAATTCGACTTATGGATATTTAGTTGACCCTCCAGTTTGTTTTAGAAAAAAGAAGTTTTTAGAAGGAGATGAAGTTGTTTCATTTAAAGGTTATTTTAGTAAAGCAATATGTCAGACTTCTGCACCTGATGCCTCCTCAGATTCTTATTCTAAGTGGAAAGTTGAAGGAGGAGCAATGACTACTCAAGTTTCTAATTTCTGTGCTGTTACAGGTCAAATTGTATATGATAGTACATTGAAGAAAGGAAAATTGTGGAATGGTACAGCATGGGTTAATCTTGATGGAACACCTTTAGCTTAA

Genome Context

Tertiary structure

PDB ID

3d408f7ea878f53c1e129daf1ccee2e1492ea86010f0bd1dd453d8b35c018a0b

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7740

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence