Protein

View in Explore

Genbank accession

CAM0042068.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MSDLDNAIKSINESSVKAENTASFLDDMSTFDDQSSVTNPNNGQVVASIPKQVKDRTDELFSAAESDINQAVSDAAQSATDAQDAADSIGRYQGLWPDTGGSAIKGDTYQTQVSGIPTGQYFTALQNTTVDPVGDDVNWREVVSVGSFSQYTDIVYRADGGNTALENMIASASVGENCICENGSRFKRMKNSSGSVSDFMPTSDINILDYMTTGSDFTQAMNKVADDVRGNLNWSVVIVASADIQIDGDVNLRGCDFDFSNVKITPSPSTGRIIMGNRSSSSRAPNQCLGDVIRDGETINLNDITNPSVLIKGAKGGRYQFGEISTLQIYSDTNSASSGDDTSNAYSRFIINHVYSMNLTTAPTTDGSLIQWINENKFEIVRITNLLIDGTYNHNHNVFSGSFEGVAKLKLESGQSNVFKNLRLESVAGSGVECSAQTWNNSFEKSYATFWGEGLQDGVATPYSDSGRGNMLHKPSDYKLRCVDILSITRGTAKTFERGNAPVTTVKSFYAGVGDSDSYYINGAFRNFYFSDMIPVQKGEFFLVNADGGSVFRHRWYFYDADGAPVDVNLTVNVDTSGNTAAVSGNSVGQGTNQQNSYIIILDDEIKYIRVSSSSGSGVSPFYMDWYTITAKSSFQNNRKWSHNSLISSQPAATDSSPAFGFASIGQVVESKSDSSYYKCVFSLMTTTVSGSGTSLVVDDGSGVSAGDIIGVKLSGSTHWTTVSSASGSNITLALQMPSNPIIGGTVTFNDWITVNN

Physico‐chemical properties

protein length:	757 AA
molecular weight:	81343,31710 Da
isoelectric point:	4,57602
aromaticity:	0,09247
hydropathy:	-0,30713

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAM0042068.1

1 757

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	217	217	0,9912
Central domain	218	492	276	0,9686
C-terminal	493	757	264	0,9294

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-217

Central
218-492

C-terminal
493-757

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage F17 g1 [NCBI]	3105350	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAM0042068.1 [NCBI]

Genbank nucleotide accession

OZ196287.1 [NCBI]

CDS location

range 31247 -> 33520
strand +

CDS

ATGAGCGATTTAGACAACGCTATAAAATCAATTAACGAGTCGTCAGTAAAGGCAGAAAATACGGCTAGTTTTTTGGATGACATGTCGACGTTTGACGACCAATCAAGCGTAACCAACCCAAATAACGGGCAAGTTGTTGCATCCATTCCTAAGCAAGTAAAAGATCGCACAGATGAGTTGTTTTCTGCTGCTGAGTCCGATATTAATCAAGCGGTGTCTGACGCCGCACAGAGCGCAACGGATGCTCAGGATGCCGCAGATAGCATTGGGCGCTATCAAGGTTTATGGCCTGATACAGGCGGTAGTGCTATAAAGGGTGATACGTATCAAACTCAAGTAAGCGGCATACCTACAGGACAATATTTCACAGCACTGCAAAACACTACGGTCGATCCTGTTGGTGATGATGTTAATTGGCGCGAAGTCGTTAGCGTTGGTAGTTTTTCTCAATACACTGACATAGTTTACAGGGCAGATGGGGGGAATACTGCGCTTGAGAATATGATTGCAAGCGCTTCCGTTGGTGAAAATTGCATATGTGAAAATGGTAGTCGATTTAAAAGAATGAAAAACTCGTCAGGAAGTGTTAGTGATTTCATGCCTACATCAGACATTAATATTTTAGATTACATGACCACGGGCTCAGATTTCACTCAAGCTATGAATAAAGTTGCAGACGATGTTAGGGGTAACCTTAATTGGTCAGTAGTAATTGTAGCATCGGCTGATATTCAGATAGATGGAGATGTAAACCTTAGAGGGTGTGATTTTGATTTTTCAAATGTAAAAATAACTCCGTCACCATCTACTGGTCGCATCATAATGGGTAATAGGTCATCATCATCAAGAGCGCCTAATCAGTGTCTGGGTGATGTTATTAGAGATGGTGAGACTATAAATTTAAATGACATTACAAACCCTTCAGTGTTAATTAAGGGAGCCAAGGGTGGTAGGTATCAATTCGGTGAGATATCAACTCTTCAAATTTACTCAGATACTAATTCTGCAAGCTCTGGTGATGATACATCAAACGCTTATTCAAGATTTATTATAAATCACGTTTATTCAATGAACCTAACAACAGCACCCACAACTGATGGCTCTTTGATTCAATGGATAAATGAGAATAAGTTTGAGATAGTAAGAATTACCAACTTATTGATCGATGGAACTTACAATCACAATCACAATGTATTTAGCGGATCTTTTGAGGGAGTGGCAAAATTAAAGCTAGAATCAGGACAGTCTAATGTATTCAAAAACCTAAGATTAGAGTCTGTAGCTGGCTCGGGCGTGGAATGCAGCGCTCAGACTTGGAACAACTCATTCGAAAAGTCATACGCAACATTTTGGGGTGAAGGGCTTCAGGATGGAGTTGCAACTCCTTACTCTGATAGTGGTCGCGGCAACATGCTTCATAAACCATCGGATTACAAACTTAGATGTGTTGACATATTATCAATCACAAGAGGGACAGCAAAGACATTTGAAAGGGGCAACGCTCCAGTGACAACTGTAAAAAGTTTCTACGCAGGGGTTGGAGATTCTGATTCATACTACATAAACGGAGCTTTCAGGAACTTTTATTTTAGCGATATGATACCAGTGCAAAAGGGTGAATTCTTCCTTGTTAATGCTGATGGTGGAAGTGTATTCAGACATAGGTGGTACTTTTATGACGCTGACGGAGCTCCTGTTGATGTTAATTTAACGGTTAATGTAGATACATCTGGAAACACAGCTGCTGTATCGGGAAATAGCGTAGGGCAAGGCACAAACCAGCAAAACTCATACATCATAATACTTGATGATGAAATAAAATACATTAGGGTGTCATCTTCTTCAGGCTCCGGTGTTAGCCCTTTTTATATGGACTGGTACACGATTACCGCGAAATCCAGTTTTCAAAATAACAGGAAGTGGAGTCACAACAGCCTAATATCATCGCAGCCAGCCGCAACTGATTCAAGTCCTGCATTCGGATTCGCGTCGATTGGTCAGGTTGTCGAAAGTAAATCAGATTCAAGTTATTACAAGTGCGTATTTTCACTAATGACAACGACAGTTTCAGGGTCTGGAACATCGCTTGTTGTTGATGATGGCTCTGGTGTTAGCGCTGGCGATATAATTGGTGTTAAGCTATCAGGGTCTACCCACTGGACTACAGTTTCTAGTGCTTCTGGGTCCAATATTACACTTGCACTCCAAATGCCTTCAAATCCAATTATTGGTGGAACTGTAACTTTTAACGACTGGATAACGGTAAATAATTGA

Genome Context

Tertiary structure

PDB ID

56db4b2b1f8584d111d2867100d10670885c469dd61b6f3b5a0cb54a7ecc498b

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6513

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence