Protein

View in Explore

UniProt accession

M1U3K4 [UniProt]

Protein name

Tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,87

Evidence RBPdetect2

Probability 0,87

Protein sequence

MTLTQINKAGLDEIALDHVFTIGASGSSAYTFQGEGLNGTVNNPTLYLTRGKTYRFENGSGGHPIRIQSTSGASGTAYNTGVTNNAGSGTVIVEVQHDAPDVLYYQCTSHAAMNGILYITGALADGGVTTAKIADDAVTTVKIAANAVGSSELADNAVDTAAIADDAVTSAKIADGTIVAANIANDTITAVQLANNSANINVIVDGAVSTAKIADDAVTTAKIANDAVDTGQIATNSVTTLKLVDESVTLAKLEHGTSSNDGKFLRANNGADPTFETVTSTTINNNADNRVITGSGTANTLNGESNVIIDSNGHLGVGGAPDFEFQVTDSSGAAVIRAKDGANNKTVDIIANSTGGLIRTLGSYPLVLNTNQTERMRIDSSGRVGIQGTPNSSNFGAKLQVRESGQAATTLTALFGANENASGTTGGISDNTAKACRIGIPHYDTDQKAAAMFVGYTGSGVNELYIGGGTGMMNAATSVRIYADSSSTINNGGNQIARFDSDGLKFGTDTAAANALDDYEEGTFTAYLQSYYDGTSGQVASSDATYTKIGRKVFVQIRWLNSNTNGLNSSGALIKIGGMPFAPDNNKKCITTDFATFNVDFQNTNARHVFETDSNGWYGQLNYSQGSWGRWAVSRWRTSAIYFIFLELTLPNNRPSYVYKLSLNLF

Physico‐chemical properties

protein length:	666 AA
molecular weight:	69465,53250 Da
isoelectric point:	4,87345
aromaticity:	0,07357
hydropathy:	-0,18453

Domains

Domains [InterPro]

DC_0856
STR
2–339

DC_0856 DC_2088

IPR008972
STR
32–121

IPR008972

M1U3K4

1 666

Architecture

STR

RBD

STR 2-339 | RBD 380-630 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0856	STR	DC_0856	2	339	Novel HMM	DC_0856	Central	Low	Positional only	26 proteins / 26 hits
IPR008972	STR	IPR008972	32	121	Merged direct domain	Cupredoxin	Central	Low	Positional only	3 proteins / 3 hits
DC_2088	RBD	DC_2088	380	630	Novel HMM	DC_2088	C-terminal	Low	Positional only	15 proteins / 15 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

M1U3K4

1 666

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,1952
Central domain	11	250	241	0,0811
C-terminal	251	666	415	0,8653

Note: Constraints were applied during segmentation.
Fixed 7 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-250

C-terminal
251-666

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Prochlorococcus phage P-GSP1 [NCBI]	382262	Uroviricota > Caudoviricetes > Autographivirales > Lingvirus PGSP1 >
Host	Prochlorococcus marinus subsp. pastoris str. CCMP1986 [NCBI]	59919	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus > Prochlorococcus marinus

Coding sequence (CDS)

Genbank protein accession

AGG54638.1 [NCBI]

Genbank nucleotide accession

HQ332140 [NCBI]

CDS location

range 22060 -> 24060
strand -

CDS

ATGACATTAACACAAATAAATAAGGCTGGTCTAGATGAGATAGCTCTGGATCATGTCTTTACAATAGGTGCTAGCGGTTCTAGTGCCTACACATTTCAAGGAGAAGGGTTGAATGGCACTGTCAACAACCCTACCCTTTACCTTACAAGAGGTAAAACGTATAGATTTGAAAATGGCTCAGGCGGTCATCCTATACGTATACAAAGCACATCTGGAGCAAGTGGTACTGCATACAACACTGGCGTAACTAACAACGCTGGTAGCGGTACAGTCATTGTTGAAGTACAACATGATGCACCTGATGTCTTATACTATCAGTGTACCAGTCATGCAGCCATGAACGGTATACTATACATTACTGGTGCACTTGCAGACGGTGGTGTAACTACAGCTAAAATTGCAGACGATGCTGTAACTACAGTTAAAATAGCAGCTAACGCTGTGGGGTCTAGCGAATTAGCGGACAACGCAGTTGATACAGCAGCAATAGCAGATGATGCAGTTACTTCAGCCAAAATTGCTGACGGAACTATTGTTGCAGCTAACATAGCCAATGATACTATTACAGCCGTTCAATTAGCTAATAACTCTGCAAACATAAACGTAATTGTAGATGGTGCAGTTTCTACAGCTAAGATTGCTGATGATGCAGTTACTACAGCCAAAATAGCTAATGACGCAGTAGATACAGGACAAATAGCTACCAACTCAGTTACAACTTTAAAACTTGTAGATGAATCAGTAACACTAGCTAAACTAGAACATGGCACATCATCTAACGATGGTAAGTTTTTACGTGCAAACAACGGAGCAGACCCTACGTTTGAAACTGTTACCAGTACAACAATAAACAACAACGCAGATAACAGAGTTATTACTGGCTCTGGTACTGCTAATACTTTAAATGGTGAGTCAAACGTAATTATAGATTCTAACGGACATTTAGGAGTAGGTGGCGCACCAGACTTTGAATTTCAAGTAACAGATTCTTCTGGTGCTGCTGTTATTAGAGCAAAAGACGGTGCTAATAATAAAACAGTTGACATAATTGCAAATAGCACAGGAGGTTTAATAAGAACTCTTGGTTCATATCCTTTAGTCCTTAATACAAATCAGACAGAACGTATGCGTATAGATTCGTCTGGAAGAGTTGGAATACAAGGAACTCCAAACAGTTCTAACTTTGGTGCAAAATTACAAGTACGAGAATCAGGTCAAGCTGCAACAACCTTAACAGCTTTATTTGGTGCTAACGAAAATGCTTCTGGTACAACAGGAGGAATTTCTGATAATACAGCCAAAGCCTGTCGCATAGGAATACCACATTATGATACCGACCAAAAAGCTGCTGCTATGTTTGTTGGTTATACAGGTAGTGGAGTAAATGAATTATATATTGGTGGTGGTACTGGTATGATGAATGCAGCAACATCAGTTCGTATATATGCTGATAGTTCTAGTACCATTAATAATGGTGGAAACCAAATAGCACGTTTTGATTCCGATGGATTAAAGTTTGGAACTGACACCGCAGCAGCCAACGCACTTGACGACTATGAAGAAGGAACTTTTACAGCTTATTTGCAAAGTTATTATGACGGCACATCTGGTCAAGTTGCTTCTAGTGACGCAACCTATACAAAAATAGGAAGAAAAGTTTTTGTACAAATAAGATGGCTTAATTCAAACACAAATGGATTAAATTCTAGTGGAGCTTTAATAAAAATTGGAGGTATGCCTTTTGCTCCTGATAATAATAAAAAATGTATAACAACTGATTTTGCTACTTTTAACGTAGATTTTCAGAATACTAACGCAAGACACGTATTTGAAACTGATTCAAATGGTTGGTATGGACAGTTAAATTATAGTCAGGGTAGTTGGGGTCGATGGGCTGTTAGTCGTTGGAGAACTTCTGCAATATATTTTATTTTTCTGGAACTTACATTGCCTAATAATAGACCGAGCTACGTCTATAAACTAAGCCTAAACCTGTTTTAA

Genome Context

Tertiary structure

PDB ID

f71d1012e981201fe2bb9fc4dbe20d6dd28dbe150741d598ab5f30309314a5b7

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6624

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence