Protein

View in Explore

Genbank accession

WCF57914.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,95

Protein sequence

MALNIVINKSVATPPVSYPAGAIVATAIASGGTAPYTYSLATGSDKFAINSTTGVVTTIAEMNIDSIASFSVAATDSTSTPVTGISTVVYPDIQAKVQNKFNRTNVIYKITKNIDLRKGVLTIPEGCTLDLSEGNGIIFNGSIYISDNVTFKANKNIVLENLLIIFASSVSNVTLESLNLKGTVEPITTNKDLGTRAISVKNSSVIVSNISIRDCVISSYNAGIVLNGNNIIIEDNLLYNNGYSGMSSDASVDITASNASTTLENNNFIISRNRCLSRYVHRNIDIGELSSENNIIISENICVSSSGITTEDTTARKSHCIMVGYTGEKIINKVAFIVNNICKNSIWSGIYVRGGGSTEAEENNRYIALIRGNYIENVNPVPGVSYFGAIAPKLKDGSIISDNTIINCNVAMDLGFTFNKSLVKVCNNSIIDCNTGIKNDTFAYQIEIDNNTIKGSNIGIGIGETTSGVTELDDNRAILIQNNNIILDKNGSRGIQLYTNNTNNINVVNNTIKALSGVTETRGIFIRTSLNSGYNVLRNNFINLDTGFKDDLFNLKRNTNQNLNYNTFVNNTTGISITANSSSQLYIIEGNIFNSCVNNYGSQSWLKMIYEGKKLNNGTFHIICDNSLYDYSNSTYGYITKAEPCFLIKTFKAGDKISSHNNFTQALCLNDSSGTVDNDTKWRMDNVRLSTTARGICAVVGQMLWDNTLKKVLWYDGTNWIDSTGATA

Physico‐chemical properties

protein length:	728 AA
molecular weight:	78944,89010 Da
isoelectric point:	5,98062
aromaticity:	0,07555
hydropathy:	-0,08324

Domains

Domains [InterPro]

G3DSA:2.60.40.60
Unmapped
9–93

G3DSA:2.60.40.60 IPR012334 IPR006626 IPR006626 IPR006626 IPR006626 DC_1195

IPR015919
STR
18–88

IPR015919 IPR011050

cd11304
STR
19–89

cd11304 DC_1643

cd11304
STR
19–80

cd11304 IPR006626 IPR006626 IPR006626 IPR006626

WCF57914.1

1 728

Architecture

STR

RBD

STR 18-89 | STR 104-616 | RBD 650-728

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:2.60.40.60	Unmapped	-	9	93	Gene3D	Cadherins	-	-	-	-
IPR015919	STR	IPR015919	18	88	Merged direct domain	Cadherin-like superfamily	Central	Low	Positional only	3 proteins / 3 hits
cd11304	STR	DC_0086	19	89	InterPro cluster	cd11304	Central	Low	Positional only	6 proteins / 7 hits
cd11304	STR	DC_0086	19	80	InterPro cluster	cd11304	Central	Low	Positional only	6 proteins / 7 hits
IPR012334	STR	IPR012334	104	413	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	115	470	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_1643	STR	DC_1643	134	616	Novel HMM	DC_1643	Central	Low	Positional only	8 proteins / 8 hits
IPR006626	Unmapped	-	207	227	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	228	250	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	332	354	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	395	416	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	443	464	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	475	499	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	502	528	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	558	579	InterPro	Parallel beta-helix repeat	-	-	-	-
DC_1195	RBD	DC_1195	650	728	Novel HMM	DC_1195	C-terminal	Low	Positional only	12 proteins / 12 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WCF57914.1

1 728

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	94	94	0,6515
Central domain	95	626	533	0,9703
C-terminal	627	728	101	0,9709

Note: Constraints were applied during segmentation.
Fixed 7 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-94

Central
95-626

C-terminal
627-728

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacteroides phage PhiCrAssBcn7 [NCBI]	3023113	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacteroides intestinalis [NCBI]	329854	cellular organisms > Bacteria > Pseudomonadati > FCB group > Bacteroidota/Chlorobiota group > Bacteroidota

Coding sequence (CDS)

Genbank protein accession

WCF57914.1 [NCBI]

Genbank nucleotide accession

OQ221542.1 [NCBI]

CDS location

range 41350 -> 43536
strand +

CDS

ATGGCATTAAATATAGTAATAAATAAGTCTGTAGCAACTCCTCCTGTTAGTTATCCAGCAGGAGCTATAGTTGCAACAGCAATAGCATCAGGGGGGACTGCCCCTTATACTTACAGTTTGGCTACTGGCTCTGATAAGTTTGCTATTAATAGTACTACAGGAGTAGTAACTACTATAGCAGAAATGAATATAGATAGTATAGCATCATTCAGTGTGGCTGCTACAGACAGTACTTCTACTCCAGTTACAGGAATTTCCACTGTGGTATATCCTGATATACAAGCAAAAGTTCAGAATAAATTCAATAGAACTAATGTTATCTATAAAATAACTAAAAATATTGACTTAAGGAAAGGTGTCCTTACTATTCCAGAAGGATGTACTTTAGATTTAAGTGAGGGTAATGGTATTATTTTCAATGGAAGTATTTACATATCAGATAATGTAACATTTAAAGCAAACAAAAATATTGTATTAGAGAACCTTTTGATAATATTTGCATCAAGTGTATCAAATGTAACACTTGAAAGTCTTAATCTGAAAGGAACTGTAGAACCTATTACAACAAACAAAGACTTAGGAACAAGAGCTATATCAGTTAAAAATTCTTCTGTAATAGTAAGTAACATAAGTATTAGAGATTGTGTTATTAGTTCCTATAATGCAGGAATAGTTTTAAATGGAAATAATATTATAATAGAAGATAATCTTTTATACAATAATGGTTACAGTGGTATGAGTTCAGATGCCTCTGTAGATATTACTGCAAGTAATGCTTCTACAACTCTTGAAAATAATAACTTTATAATTTCAAGAAATAGATGTTTATCAAGATATGTACATAGAAATATTGATATTGGTGAATTAAGTTCTGAAAATAACATTATCATATCTGAAAATATATGTGTGAGTAGTTCTGGTATAACAACCGAAGATACAACTGCAAGGAAATCACATTGTATAATGGTTGGATATACAGGAGAAAAGATAATAAATAAAGTAGCATTTATTGTAAATAACATTTGTAAAAATTCTATTTGGAGTGGTATATATGTTAGAGGTGGTGGAAGTACAGAAGCAGAAGAGAATAATAGGTATATTGCTTTAATCAGAGGAAATTATATTGAAAATGTTAATCCAGTTCCAGGAGTATCCTATTTTGGAGCTATTGCACCTAAATTAAAAGATGGTTCTATAATATCTGATAATACAATTATTAATTGTAATGTTGCAATGGATTTAGGATTTACCTTTAATAAGTCCTTAGTAAAAGTATGTAATAATTCCATTATAGATTGTAATACAGGTATTAAGAATGATACCTTTGCTTATCAAATAGAAATTGATAATAACACAATTAAAGGTTCTAATATTGGCATTGGTATAGGAGAAACTACAAGTGGAGTTACAGAGTTGGATGATAATAGAGCAATCTTAATACAGAATAATAATATAATTCTTGATAAGAATGGAAGTAGAGGTATTCAGTTATACACAAATAATACCAATAATATTAATGTAGTAAACAATACTATAAAAGCACTTTCAGGAGTCACTGAAACAAGGGGTATCTTTATTAGAACTTCATTAAATTCTGGATATAATGTATTAAGGAACAACTTCATCAATCTTGATACTGGATTTAAAGATGATTTATTTAATTTAAAGAGAAACACGAATCAAAATCTAAATTATAATACATTTGTAAATAATACTACTGGTATATCAATTACTGCCAATTCAAGTTCTCAATTGTATATAATTGAGGGGAATATATTTAATTCGTGTGTTAATAATTATGGTTCTCAGAGCTGGCTTAAAATGATATATGAAGGGAAAAAATTAAATAATGGAACATTTCATATAATATGTGATAATTCATTATATGATTACAGTAATAGTACTTATGGTTATATAACAAAAGCAGAACCTTGCTTTCTTATTAAAACCTTTAAAGCAGGAGATAAAATTTCTTCTCACAATAATTTCACACAGGCACTATGCTTAAATGATAGCTCTGGAACTGTGGATAATGATACTAAGTGGAGAATGGATAATGTAAGATTATCTACTACTGCAAGAGGTATCTGTGCTGTAGTTGGACAAATGTTATGGGATAATACCTTGAAAAAGGTACTGTGGTATGATGGAACTAACTGGATAGATTCAACTGGAGCAACTGCATAA

Genome Context

Tertiary structure

PDB ID

8f486a8e9b412049078b6895c5e9a3b5ad73b5af90d631a287c237eda760692d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7614

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence