Protein

View in Explore

Genbank accession

QOI69027.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,80

TSP

Evidence RBPdetect2

Probability 0,65

Protein sequence

MADFKLGRIKFKWRGDWAVDTSYLIDDVIKYGGNTYVCIQNHTSPSNENLFYTSPGTYTSYWSLQAESLFSKGAYAADTWYKLNDLVKYGARQYRCTTAHTSASTVGGVAILNGSNFELYIEAIDYKGDWTGSTYYKVKDVFKFGGNQYIVDTAHTSGATSDDFDQSVVSLFTNGQEFLDTYAPSTVYRKGDIVTYGGYTYIYVNDEEAAGQTPTDNAYWDVITTGYNNVGEFVYGSAYKTGDVFKYGGYSYVSKTNNTNEYPANTDGTTNTTHFQLLVKGFDYQSGGYDAATTYNIGDVVRHVSSSYVMLKDRQINVTPGTDGTVWQLIAQGDTGAVLTTRGDLIYQDASQSARLPIGTSGSVLTTDGTDPIWSNAEGANVKYVANSGSDSNPGTQFLPFKTLYKALSVATAGDIVDFDTITGGTGGVPATYDLEQTNTTGSGSGATIRVVLDGSSTPTVTITNGGSGHAAGDTVTFGNIASDGSTVQGGGMTDITINVVSASIGDVVYVKNGVYRETLPLRVPPGVTVQGESLRGTEIRPASSTGHQVKTVTITTNPTGASNGTYNHVHGTSTTSTNGIASSFVANVTVSGGTVSSVTIYNGGTGFVASDTITIQSSDIGSGGDLVLTVASLENNDASNMFLVNNQTNIVQMSMRGLTGTPGAGGTSRAAVISLDPSGTISSVSPYIQNCTSFNTNATGVQIDGNLHSSGNKSILCNDFTQINSDGKGVHAIAGGRGEMVSVFTYYNAISYHAESGGFIRGLNCSSAYGEQGAVADGTLAAESPVEVQARGEMLKYATAGFIGAATESDIADTVSTSGTPTAATILGDTSGATADIFRVNISLDYIHIENRTGNFQQGETVTITKDDSSTFQATLDSSFGDSSAAQTGQVGPLIAVKSSDGTLGSANVIGVGANLVAAGDTAKFYRVSAVSETNTSNQTALVRLTESVTTGRAIAEDEEIDVTVNFSNVRLTGHDFLDIGTGGFADTGYPGSPGQPADQADEVTETNGGRVYFSSTDQKGDFRVGDLFRIEQATGVATLNADAFDLSGLSELQLGSIGAELGATINEFSTDETLSNDANSAVPTERAVRGYLTRDKAGTGAWVPPTGTTAQRPTGGELFTGALRYNSSLVTWEGYNGTQWTGLGGGNPWQTTSSSITVAANDRYFVDTSSSALTITLPSSPLTGDQVRLLDLSGTFDTNNLTVARNGNNIMGAAADLTVSTENASIGLVYTGATQGWKLLELA

Physico‐chemical properties

protein length:	1245 AA
molecular weight:	130248,64370 Da
isoelectric point:	4,47484
aromaticity:	0,08916
hydropathy:	-0,21237

Domains

Domains [InterPro]

DC_1060
STR
2–72

DC_1060 G3DSA:2.10.10.20 G3DSA:2.10.10.20 IPR003610 G3DSA:2.10.10.90 IPR012334 DC_0763

IPR003610
CBM
14–65

IPR003610 DC_0876 DC_1983 DC_1011 IPR011050 IPR036240

IPR003610
CBM
17–47

IPR003610 G3DSA:2.10.10.20 IPR003610 IPR027411

G3DSA:2.10.10.20
ATT
17–65

G3DSA:2.10.10.20

IPR036573
STR
17–47

IPR036573

QOI69027.1

1 1245

Architecture

STR

ATT

STR

STR 2-16 | ATT 17-123 | ATT 129-232 | STR 233-1237 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1060	STR	DC_1060	2	72	Novel HMM	DC_1060	Central	Low	Positional only	28 proteins / 28 hits
IPR003610	CBM	DC_0028	14	65	InterPro cluster	Carbohydrate binding module family 5/12	C-terminal	High	Text match	29 proteins / 44 hits
IPR003610	CBM	DC_0028	17	47	InterPro cluster	Carbohydrate binding module family 5/12	C-terminal	High	Text match	29 proteins / 44 hits
G3DSA:2.10.10.20	ATT	G3DSA:2.10.10.20	17	65	Merged direct domain	G3DSA:2.10.10.20	N-terminal	Low	Positional only	19 proteins / 19 hits
IPR036573	STR	IPR036573	17	47	Merged direct domain	Carbohydrate-binding module superfamily 5/12	Central	Low	Positional only	2 proteins / 2 hits
DC_0876	STR	DC_0876	66	123	Novel HMM	DC_0876	Central	Low	Positional only	94 proteins / 94 hits
G3DSA:2.10.10.20	ATT	G3DSA:2.10.10.20	74	116	Merged direct domain	G3DSA:2.10.10.20	N-terminal	Low	Positional only	19 proteins / 19 hits
G3DSA:2.10.10.20	ATT	G3DSA:2.10.10.20	129	174	Merged direct domain	G3DSA:2.10.10.20	N-terminal	Low	Positional only	19 proteins / 19 hits
DC_1983	ATT	DC_1983	160	232	Novel HMM	DC_1983	N-terminal	Low	Positional only	12 proteins / 12 hits
IPR003610	CBM	DC_0028	179	223	InterPro cluster	Carbohydrate binding module family 5/12	C-terminal	High	Text match	29 proteins / 44 hits
G3DSA:2.10.10.20	ATT	G3DSA:2.10.10.20	180	223	Merged direct domain	G3DSA:2.10.10.20	N-terminal	Low	Positional only	19 proteins / 19 hits
G3DSA:2.10.10.90	STR	G3DSA:2.10.10.90	231	330	Merged direct domain	G3DSA:2.10.10.90	Central	Low	Positional only	29 proteins / 29 hits
DC_1011	STR	DC_1011	265	397	Novel HMM	DC_1011	Central	Low	Positional only	27 proteins / 27 hits
IPR003610	CBM	DC_0028	286	330	InterPro cluster	Carbohydrate binding module family 5/12	C-terminal	High	Text match	29 proteins / 44 hits
IPR012334	STR	IPR012334	371	505	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	495	726	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_0763	STR	DC_0763	628	1210	Novel HMM	DC_0763	Central	Low	Positional only	71 proteins / 71 hits
IPR036240	STR	IPR036240	1108	1237	Merged direct domain	Gp9-like superfamily	Central	Low	Positional only	146 proteins / 146 hits
IPR027411	Unmapped	-	1151	1241	InterPro	Baseplate structural protein Gp9/Gp10 middle domain superfamily	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QOI69027.1

1 1245

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	410	410	0,8817
Central domain	411	1085	676	0,8214
C-terminal	1086	1245	159	0,2826

Note: Constraints were applied during segmentation.
Fixed 32 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-410

Central
411-1085

C-terminal
1086-1245

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pelagibacter phage Mosig EXVC030M [NCBI]	2759214	No lineage information
Host	Candidatus Pelagibacter ubique HTCC1062 [NCBI]	335992	Bacteria > Proteobacteria > Alphaproteobacteria > Pelagibacterales > Pelagibacteraceae > Candidatus Pelagibacter

Coding sequence (CDS)

Genbank protein accession

QOI69027.1 [NCBI]

Genbank nucleotide accession

MT647606.1 [NCBI]

CDS location

range 46788 -> 50525
strand -

CDS

ATGGCAGATTTTAAACTAGGTCGAATTAAATTTAAATGGAGAGGCGATTGGGCTGTTGATACATCATATTTAATTGATGATGTTATTAAATACGGCGGTAATACTTATGTGTGTATTCAAAATCACACATCTCCTTCAAATGAAAACTTATTCTACACAAGTCCAGGAACATACACAAGTTACTGGTCACTTCAAGCAGAATCTTTATTCAGTAAAGGCGCATATGCGGCCGATACTTGGTATAAACTTAACGACCTAGTTAAATATGGTGCAAGACAATATAGATGTACAACTGCTCATACATCAGCTTCTACAGTTGGTGGTGTTGCAATTCTTAATGGTTCAAACTTTGAATTATACATTGAAGCGATTGACTACAAGGGTGATTGGACTGGTTCTACTTATTATAAAGTAAAAGATGTATTTAAATTTGGTGGTAATCAATATATTGTTGATACGGCTCATACATCTGGTGCAACTAGTGATGATTTTGACCAATCGGTTGTTTCATTATTTACAAACGGACAAGAATTTTTAGACACTTATGCTCCTTCTACAGTTTATAGAAAAGGTGATATTGTAACATATGGTGGTTATACTTACATCTATGTTAATGATGAAGAAGCAGCTGGACAAACTCCTACAGATAACGCATATTGGGATGTAATCACAACAGGTTATAATAATGTTGGTGAGTTTGTATATGGTAGTGCATATAAAACTGGAGATGTATTTAAATATGGTGGTTACTCTTATGTTTCAAAAACAAATAATACTAATGAGTATCCTGCAAACACAGACGGTACAACAAATACTACCCATTTTCAATTATTAGTTAAAGGTTTTGACTATCAATCAGGTGGTTATGACGCAGCTACAACATACAATATTGGTGATGTAGTAAGACATGTTTCATCTTCTTATGTAATGTTGAAAGACAGACAAATCAATGTTACTCCAGGCACAGACGGTACAGTTTGGCAATTAATTGCACAAGGTGATACTGGCGCAGTATTAACTACAAGAGGAGATTTAATTTACCAGGATGCTTCTCAATCAGCAAGATTACCTATCGGTACTTCAGGTTCAGTTTTAACTACAGACGGTACAGACCCTATTTGGTCAAACGCTGAAGGTGCAAATGTTAAATATGTTGCAAACTCTGGTTCAGACAGTAATCCTGGAACACAATTTTTACCTTTTAAAACACTTTACAAAGCTTTATCTGTAGCGACTGCTGGTGATATTGTTGACTTTGATACTATAACAGGTGGTACAGGCGGAGTTCCTGCTACTTATGATTTAGAACAAACAAATACTACAGGTTCAGGTTCAGGTGCAACTATTAGAGTCGTATTAGATGGTTCTTCAACACCAACTGTTACAATAACAAATGGTGGTTCTGGCCACGCAGCTGGTGATACAGTAACATTTGGTAATATAGCTTCTGACGGAAGCACCGTGCAAGGCGGTGGCATGACCGACATTACAATTAATGTTGTGTCTGCTTCGATTGGTGATGTTGTCTATGTTAAGAATGGTGTTTATAGAGAAACTTTACCTTTAAGAGTTCCACCAGGAGTTACAGTACAAGGTGAAAGTTTAAGAGGCACAGAAATTAGACCTGCAAGTAGTACAGGTCATCAAGTTAAAACAGTTACAATTACAACAAATCCTACTGGTGCTAGTAACGGCACTTACAATCATGTACACGGTACTTCAACAACATCAACAAATGGTATTGCAAGTTCATTTGTAGCAAATGTTACAGTATCGGGCGGTACAGTTTCAAGTGTTACAATTTATAACGGCGGTACAGGATTTGTAGCATCCGATACAATTACAATTCAATCGTCTGATATAGGAAGTGGCGGTGATTTAGTTTTAACAGTTGCTTCATTAGAAAACAATGACGCTTCTAACATGTTCTTAGTTAACAATCAAACTAACATTGTTCAAATGTCTATGAGAGGTTTAACAGGAACACCAGGCGCAGGTGGCACTAGTAGAGCTGCCGTTATTTCTTTAGACCCTAGTGGTACAATTAGTTCAGTTTCTCCATACATTCAAAATTGTACATCATTTAATACAAACGCAACCGGTGTTCAAATTGATGGTAACTTACACAGTTCAGGTAACAAGTCAATCTTATGTAATGACTTTACACAAATTAACTCAGACGGTAAAGGTGTTCACGCAATTGCAGGTGGTCGTGGTGAGATGGTTTCCGTCTTTACTTACTACAATGCAATTTCATATCACGCAGAATCAGGTGGATTTATTAGAGGTCTAAACTGTTCATCTGCTTATGGTGAACAAGGTGCTGTTGCAGACGGTACATTAGCCGCAGAAAGTCCTGTAGAAGTACAGGCTCGAGGTGAGATGTTAAAATATGCAACTGCTGGATTTATTGGTGCTGCTACCGAAAGTGATATCGCAGACACAGTATCAACTTCAGGAACACCAACAGCTGCTACAATTTTAGGTGACACTTCAGGTGCAACTGCTGATATTTTTAGAGTTAACATTTCATTAGATTACATTCACATTGAAAATAGAACAGGTAACTTCCAACAAGGCGAAACTGTTACAATTACAAAAGATGACAGTTCAACTTTCCAAGCAACACTTGATAGTTCTTTTGGCGATAGTTCAGCTGCTCAAACAGGACAAGTTGGTCCACTTATTGCAGTTAAGTCCTCAGACGGAACATTAGGTAGTGCAAATGTAATTGGTGTTGGTGCTAATTTAGTAGCTGCTGGCGATACTGCCAAATTTTATAGAGTTTCAGCGGTTTCAGAAACCAATACAAGTAATCAAACAGCATTAGTCAGATTAACAGAAAGTGTTACAACAGGCAGAGCAATTGCTGAAGATGAAGAAATAGATGTAACAGTTAACTTTTCAAATGTCCGTTTAACTGGACATGACTTCCTAGATATTGGTACTGGTGGTTTTGCAGACACAGGTTATCCAGGTTCTCCAGGTCAACCAGCTGACCAAGCAGACGAAGTTACAGAAACAAATGGTGGCCGTGTTTACTTCTCATCTACTGACCAAAAAGGTGACTTTAGAGTTGGTGATTTATTCAGAATTGAACAGGCGACTGGTGTTGCAACTCTTAACGCAGACGCTTTTGACCTTTCAGGTCTATCAGAATTACAATTAGGTTCTATCGGTGCAGAATTAGGTGCTACAATTAATGAATTTAGTACAGACGAAACTTTATCAAATGACGCTAACTCGGCAGTTCCAACGGAAAGAGCTGTAAGAGGTTATCTAACAAGAGATAAAGCAGGCACAGGTGCTTGGGTTCCACCAACTGGTACAACAGCACAAAGACCTACAGGTGGTGAATTATTTACAGGTGCTTTAAGATATAACTCCTCTCTAGTAACATGGGAAGGTTACAACGGAACACAATGGACAGGTTTAGGTGGCGGTAATCCTTGGCAAACAACATCATCAAGTATTACAGTAGCTGCGAATGACAGATACTTTGTAGATACATCAAGTAGTGCATTAACAATTACATTGCCTTCTTCTCCATTAACTGGTGACCAAGTAAGATTATTAGACTTGTCAGGAACATTTGATACAAACAATTTAACGGTTGCAAGAAATGGTAATAATATTATGGGAGCGGCTGCAGATTTAACAGTTTCTACTGAAAATGCTTCAATTGGATTAGTTTACACAGGTGCAACACAAGGCTGGAAACTACTAGAATTAGCATAA

Genome Context

Tertiary structure

PDB ID

1c8c0bb9a4edba2021044663d224a23beca8419c359e75e12dc2fef8cca91f86

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2703

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence