Protein

View in Explore

Genbank accession

YP_009188182.1 [GenBank]

Protein name

structural protein

RBP type

Evidence RBPdetect2

Probability 0,94

Protein sequence

MANRIQLRRDGAQQWANINPILAQGELGIEIDTSRLKIGDGVTPWNSLRYERPLETESNTANTLVKRDADGNFEAGAITASLVGNSATATRLANARQISLGGDMSGSGTFDGSANLTITAELNYQPGLPHYDPNDLDAQAQYTRLTVDSRGRIVDGDNPTTLAAYGIADAQAADTDLQSIADMTSFGLMSRQAEGTITTRTITGGAGRIIVNNGNAQSSNPFIDLADTTVVIGYYNPTGNLDTPLISVNLPDDQTVNTTEFTVDRYGRLTQALTIPIATAKEGSEDPVFDNATSYSRNDKVKNSSNRLYQAILDINSGGGEPTHTDTSDTGSWRYLGTAVSPQKGLASFNQEDFDVTAWNPASQYEGGFVSIAENAVDNNQLQNNRVSFADGNTKEDFELDSELTATTGYRGFNYLNYVKVNNTSGSLLFSANNTGDSGSGEVDINVRSYFSDPDITLDGAVNQKLDKTGDGDLTFQHTQNTANDRTLLINATNAGSGNALINITAENDITINATNVANRVNVEDFHFQDNVISTTNSTLIIDPNDDDGATGLVRVRGDLQVDGTTTTVNSTTLTVQDPIITLGGEDTLTTDDNLDRGVEFRYYDSQERFGFFGWDEDYADSNIWSGTGGYRFLYNATNSSETFTGTDAAIIGGNLRLTTNTNSSSTTTGTLVVTGGAGISANVYIGGTLDVAQDVDINSGEMTVTASNGNIYTQGDLQVDSNVTLGTDANDTVTVNSDSTFEDDVRIVGPNTVFSITDGTAEKFVIDSDNGNIHSDGTLDIDSGVTFNSTLDVDAAVTFNSTLDVDDDSLFHNDITLDTTGKYFKITNGTDDKFTVLSTNGNTDIRGTLTVGSAVTFENNLQVDGNITLGNASTDILTINSDTTITDNLTVNQAVDFDSTLNVDQAVDFNSTLTVDGTTTIYDSVIIQSDNEVFNINNASGQIQFAVDSDNGNTIIGRVGQGTGTLTVHGDATFNDNTQFTDNVTIGNANTDTLTVNSNTTLTDDVRINGSLIVDTNATIEGNLTVNGTTSTVNSTVVTLDDPIITLGGDTAPSTNDAKDRGVEFRYYDSQARLGFFGWDNSAGRYALYHAATNSSEAFAGTRSGLDAGSLKLFDTTNATNSATGTLIVGGGVGIGLDLYVGDDLVVTDDGSFGGDVSITGTLDVTNDFAINTTKFTVASSSGNTVVQGTLQVDGNTTIGNASGDAHVVTGGVTFNQAIISTDITADNIKIGVDGSSEISTTSGNLILDSDGGTVNITDNADVDGNLNVDGNTQIDGTLTVDGNATIGNQSGDNHTVTGTVTFNQAITSTDITADAIKIGVDADNEISTTTGNLILDSDGGKVHITDNAEVDGNLQVDGNSTLGDGSTDTLTVNATSTFNAPITSTDITADNIQIGVSGSSEIDTALGNLTIDSATGETIVDDNLTVNGTADINQLTTITDGLVVKADNKQVRIQTAGGLDKVTIDTDNGNTDIQGTLNVEGATTIDDTFNVTQATDLDSTLNVDGAATFQDNVTINADNKSFIIQNNSGVDKFTVDTDNGNTVTQGNLTVTGTTTLVDNITAQARLDLTKNENPTSLTGNAPLMIPNGGMTVAEDAFIGQTLKLGPNAAETITLVGATGNATIGGTLGVTGITTLTTLNLGSITSTGAANIGGSLIINTDKFTVSSTTGNTDIAGTLNVDGRVIIDDTLNVTQGVDFDSTMNVDGNSTFSGTITQNSTSLFKDDVVLRGSTKTLKLQNGSGTTKVELQSTSGNVTAAGLTTTNSLEVVTNTSIGGTLGVTGQITGDVTGDLTGTADKANLADITDTTTSNLTYFPTFVSTNNGYTELRTDSTNLTYNPSTNRLTVENFRSTTDFEVQGNLNITGNITFGQSQVGSIANHDTDALTEGSTNLYFTNERVDDRVNDLITGGTGITATYDDAGNILTLSATQADINTDNITEGSTNLFTTAARSRTHFTYGTGIELSGSGQLSVTQSDINTDNVTEGSTNLFITAARTRGHLSASGDLSYNSSTGDFSVTTFKTADARGSVSASGDLSYNSSTGVFSYTQSDTDGVSEGSTNLYFTDARADSRVNLQTGANLDLSSKDTGDLAEGSNLYYTDARADTRINLQTGANLDLSSKDTGDLAEGSNLYYTDARADARVTAGITGKLDASAVSTFGGTLIDDADAAAARTTLGLATVASTGAYGDLSGTPSLGAVATSNDYDDLSNKPTLFSGAYADLTGKPTLFSGDYDDLTNKPTLGTAAATAATAYATAAQGSKADANDTDIDDIYTQLVAIGNDNSITTVAQLKTALLALARS

Physico‐chemical properties

protein length:	2301 AA
molecular weight:	239746,31860 Da
isoelectric point:	4,05003
aromaticity:	0,05693
hydropathy:	-0,28870

Domains

Domains [InterPro]

DC_1619
ATT
1–456

DC_1619 G3DSA:2.160.10.10 DC_1607 DC_0029 DC_0029

SSF69349
STR
4–236

SSF69349 DC_1607 DC_1607

IPR041352
ATT
5–43

IPR041352

YP_009188182.1

1 2301

Architecture

ATT

STR

RBD

ATT 1-456 | STR 457-1259 | STR 1682-1904 | RBD 2036-2115 | RBD 2142-2300 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1619	ATT	DC_1619	1	456	Novel HMM	DC_1619	N-terminal	Low	Positional only	123 proteins / 123 hits
SSF69349	STR	SSF69349	4	236	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR041352	ATT	DC_0533	5	43	InterPro cluster	Major tropism determinant, N-terminal domain	Central	Medium	Text match	295 proteins / 296 hits
DC_1607	STR	DC_1607	325	858	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
G3DSA:2.160.10.10	STR	G3DSA:2.160.10.10	841	1051	Merged direct domain	G3DSA:2.160.10.10	Central	Low	Positional only	8 proteins / 8 hits
DC_1607	STR	DC_1607	932	1259	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_1607	STR	DC_1607	1682	1904	Novel HMM	DC_1607	Central	Low	Positional only	159 proteins / 159 hits
DC_0029	RBD	DC_0029	2036	2115	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits
DC_0029	RBD	DC_0029	2142	2300	Novel HMM	DC_0029	C-terminal	Low	Positional only	131 proteins / 131 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Cyanophage P-TIM40 [NCBI]	1589733	Uroviricota > Caudoviricetes > Pantevenvirales > Libanvirus > Libanvirus ptim40
Host	Prochlorococcus marinus str. NATL2A [NCBI]	59920	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae > Prochlorococcus >

Coding sequence (CDS)

Genbank protein accession

YP_009188182.1 [NCBI]

Genbank nucleotide accession

NC_028663 [NCBI]

CDS location

range 101629 -> 108534
strand +

CDS

ATGGCAAATAGAATACAACTAAGACGTGATGGTGCTCAGCAGTGGGCAAACATTAACCCGATCCTCGCCCAAGGTGAATTGGGTATTGAAATCGATACGTCTAGACTTAAAATCGGTGACGGTGTTACTCCGTGGAATAGTCTTCGCTATGAGCGACCACTAGAGACGGAAAGTAATACTGCGAACACTCTTGTAAAGAGAGATGCCGACGGTAATTTTGAGGCAGGTGCCATTACTGCTTCACTGGTGGGTAACTCCGCTACAGCAACTAGACTAGCAAACGCTAGACAGATCTCCCTTGGTGGTGACATGTCTGGTAGTGGTACGTTTGATGGATCCGCAAACTTAACCATTACTGCTGAGTTGAATTATCAACCAGGTCTACCACACTATGATCCTAATGATCTAGATGCTCAAGCACAATATACTAGACTAACTGTTGACTCTCGTGGTCGTATCGTGGATGGTGACAACCCCACGACTCTTGCTGCGTACGGTATTGCTGACGCTCAAGCTGCAGACACAGATCTACAGTCTATTGCAGACATGACCTCTTTCGGTCTGATGTCACGTCAGGCAGAAGGCACTATTACCACTAGGACTATTACAGGTGGTGCAGGTCGTATCATTGTCAATAATGGTAATGCACAGAGCAGTAACCCATTCATTGACCTTGCTGATACTACAGTTGTTATCGGTTACTACAACCCTACTGGTAACTTAGATACACCTCTAATTTCAGTTAATCTGCCAGATGACCAAACAGTTAATACAACTGAATTTACAGTTGACAGATATGGTCGTTTGACACAAGCACTTACCATTCCTATCGCTACTGCAAAGGAAGGAAGTGAAGATCCAGTATTTGATAACGCAACATCTTACTCAAGAAATGATAAGGTCAAGAACTCAAGTAATCGCTTGTATCAGGCTATCCTTGATATCAACTCTGGAGGCGGTGAGCCTACACACACCGACACCTCCGACACAGGGTCTTGGAGATATCTGGGAACTGCTGTAAGTCCACAAAAAGGTCTTGCATCATTTAACCAAGAAGATTTCGACGTCACAGCGTGGAATCCTGCCTCGCAATATGAGGGAGGATTTGTTAGCATTGCAGAGAATGCAGTTGACAATAATCAACTACAAAACAATCGCGTCTCGTTTGCTGACGGAAACACAAAAGAAGATTTTGAGTTAGATAGCGAGTTAACTGCAACTACTGGTTATCGAGGTTTTAATTACTTAAATTATGTTAAAGTTAACAATACTTCGGGGTCTCTTTTATTCAGTGCTAATAATACTGGTGACTCTGGTAGTGGAGAGGTTGATATTAATGTAAGGTCATACTTTAGTGACCCTGACATTACACTTGACGGTGCCGTAAATCAGAAATTAGACAAGACTGGTGACGGTGATCTTACTTTCCAACACACACAAAACACTGCAAACGATCGCACTCTGTTAATCAATGCGACTAATGCAGGTAGTGGTAATGCACTTATTAACATTACTGCTGAAAATGATATTACTATCAATGCCACCAACGTTGCCAACAGAGTCAACGTAGAGGACTTCCATTTCCAAGATAACGTCATTTCGACAACCAACTCAACGTTGATTATCGATCCTAATGACGATGATGGTGCAACTGGTCTAGTTAGAGTCCGTGGTGATCTTCAAGTTGACGGCACCACAACTACTGTAAATTCAACTACATTAACTGTCCAAGATCCTATCATCACACTTGGTGGTGAGGATACTCTTACAACAGATGACAATCTGGATCGTGGTGTAGAATTCAGATATTATGATTCGCAAGAAAGATTCGGTTTCTTCGGGTGGGACGAGGACTATGCAGACTCTAACATATGGTCTGGCACTGGCGGGTATCGCTTCCTCTACAATGCCACCAACTCGTCTGAAACATTTACTGGGACTGACGCTGCTATCATTGGTGGTAACCTCAGACTCACAACAAACACAAACTCATCCTCAACCACTACAGGTACGCTAGTCGTAACTGGTGGTGCAGGTATTTCTGCTAATGTATACATTGGTGGCACACTTGATGTTGCCCAAGATGTAGACATCAATAGTGGAGAGATGACCGTTACTGCATCTAACGGTAACATCTATACACAAGGTGACTTGCAGGTAGACAGCAATGTTACTCTTGGCACAGATGCAAACGATACTGTTACTGTAAACTCTGACTCGACATTTGAAGATGACGTCAGAATTGTCGGTCCTAATACAGTATTTTCTATCACAGACGGCACTGCCGAAAAGTTTGTCATCGATAGTGACAACGGAAATATCCACAGTGATGGCACCCTTGATATTGATAGTGGTGTTACATTCAACAGCACACTTGATGTAGATGCTGCTGTCACCTTTAACAGCACTCTGGATGTAGACGACGATTCACTATTCCATAATGACATCACTCTTGATACTACTGGTAAGTATTTCAAGATTACTAATGGCACAGATGATAAGTTTACCGTCCTATCTACAAACGGTAATACTGACATCAGAGGCACACTGACTGTTGGATCTGCTGTAACATTTGAGAATAATCTACAAGTAGATGGAAACATTACACTCGGTAATGCCTCTACTGATATTCTTACTATCAACAGTGACACAACAATCACAGATAATCTTACAGTTAATCAAGCGGTAGATTTTGATTCTACTCTTAATGTAGATCAGGCAGTTGATTTCAACTCAACTCTTACAGTTGATGGCACAACTACGATCTATGATTCTGTAATCATTCAGTCTGATAACGAAGTATTTAATATCAACAATGCATCTGGTCAAATCCAATTTGCAGTTGATAGCGACAATGGTAATACAATAATTGGTCGTGTTGGTCAGGGCACAGGTACACTGACTGTCCACGGTGACGCAACTTTCAACGACAATACACAGTTTACTGACAACGTAACTATCGGTAATGCAAACACCGATACTCTTACAGTCAATAGCAACACAACTCTAACTGATGACGTTAGAATTAATGGGTCACTAATTGTTGACACGAATGCTACAATAGAAGGTAACCTGACTGTTAACGGCACAACAAGCACAGTTAACTCTACTGTTGTAACGTTAGACGATCCTATTATTACTTTAGGTGGTGACACTGCTCCTAGCACCAATGATGCTAAGGATCGTGGTGTTGAGTTTAGGTATTACGATTCACAAGCAAGACTAGGATTCTTTGGTTGGGATAACTCTGCAGGAAGATATGCACTTTATCATGCTGCTACTAATTCTTCAGAGGCATTCGCAGGCACAAGATCTGGTCTAGATGCAGGATCATTAAAATTATTTGATACAACAAATGCGACAAACTCTGCTACTGGGACTCTCATCGTTGGGGGCGGTGTTGGTATTGGACTGGATCTCTACGTTGGAGACGATCTCGTCGTCACAGACGATGGATCATTTGGTGGAGATGTCAGTATCACTGGCACGCTCGATGTAACCAATGACTTTGCAATAAACACTACTAAGTTTACTGTTGCGTCTTCCTCAGGTAACACCGTTGTCCAAGGCACATTACAAGTTGATGGAAACACAACTATTGGTAATGCTTCTGGGGACGCACATGTAGTTACTGGTGGAGTCACATTCAACCAAGCGATTATCTCAACAGACATCACTGCCGATAACATTAAGATCGGTGTTGATGGATCTAGTGAAATCTCTACTACTTCTGGAAATCTAATTTTAGATTCAGATGGTGGCACAGTTAATATCACAGATAATGCTGACGTAGATGGAAACTTAAATGTTGACGGCAATACTCAAATTGATGGCACTCTTACTGTTGATGGCAATGCTACTATTGGCAACCAGTCAGGAGATAACCACACCGTTACTGGCACGGTTACATTTAACCAAGCAATCACCTCCACCGACATCACCGCCGACGCGATCAAGATCGGGGTCGATGCCGACAATGAAATTAGTACCACAACTGGTAACCTTATCCTCGACTCTGATGGAGGAAAAGTACACATCACAGATAACGCTGAGGTAGATGGTAACTTACAAGTTGATGGTAATTCAACATTAGGTGATGGAAGCACCGACACACTAACTGTCAATGCAACATCTACATTTAATGCTCCGATCACATCTACAGACATCACTGCTGATAACATTCAGATCGGTGTTAGTGGATCTTCTGAGATTGATACCGCTCTAGGTAATTTAACTATTGACTCTGCAACTGGTGAGACCATTGTAGATGACAACTTGACTGTCAATGGCACAGCAGATATCAATCAGTTGACTACAATCACTGATGGTTTGGTAGTCAAGGCAGATAATAAGCAAGTAAGAATTCAGACCGCAGGTGGTCTAGACAAAGTTACTATTGATACTGACAATGGTAATACAGATATTCAAGGCACACTTAATGTAGAGGGTGCCACAACTATTGACGATACTTTCAATGTCACTCAAGCAACTGATCTTGATAGCACTCTAAACGTAGATGGTGCAGCGACATTCCAAGATAACGTTACAATTAACGCTGATAATAAGTCATTCATTATCCAGAATAATTCTGGTGTAGATAAGTTTACAGTAGATACAGATAACGGAAACACAGTAACTCAGGGTAACCTAACTGTTACAGGCACAACAACTCTTGTTGATAACATTACTGCACAGGCAAGATTGGATCTCACTAAGAATGAGAATCCTACATCTCTGACTGGTAATGCACCGTTGATGATTCCTAACGGTGGTATGACTGTTGCAGAGGATGCCTTTATTGGTCAGACTCTAAAACTAGGACCTAACGCTGCTGAGACAATCACTCTTGTAGGTGCTACTGGTAACGCAACTATCGGAGGCACATTGGGTGTCACTGGTATCACTACTCTTACTACTCTAAACTTAGGAAGTATCACATCTACTGGTGCTGCAAACATCGGTGGTAGTTTGATTATCAACACTGATAAGTTTACGGTTTCATCTACAACTGGTAACACTGACATTGCAGGCACATTGAATGTCGATGGTCGTGTGATTATTGATGACACCTTGAATGTTACACAGGGTGTTGACTTTGACAGCACAATGAATGTAGATGGTAATTCCACATTCAGTGGCACAATCACTCAGAATAGCACTTCACTCTTCAAAGATGATGTTGTTTTAAGAGGATCTACCAAGACACTTAAGTTGCAGAATGGTAGTGGCACAACTAAAGTTGAGTTACAATCTACTTCTGGTAACGTTACTGCAGCAGGTCTTACAACCACTAACTCACTTGAGGTCGTAACTAACACCTCCATCGGAGGCACACTTGGTGTAACAGGACAGATCACTGGTGATGTAACTGGTGACCTAACAGGTACTGCTGACAAGGCAAACCTTGCTGACATCACAGATACCACAACATCTAACCTTACATACTTCCCAACATTCGTATCCACAAATAACGGATACACTGAATTACGCACAGACTCTACTAACCTTACATATAACCCATCTACAAACAGACTAACTGTTGAAAACTTCAGATCAACTACTGACTTTGAAGTCCAAGGTAACTTGAATATCACAGGTAATATTACCTTCGGTCAGTCACAGGTTGGTAGTATTGCAAACCATGACACTGATGCACTTACTGAAGGGTCAACTAACCTTTACTTCACAAACGAAAGAGTTGACGACAGAGTTAATGATCTGATCACTGGTGGCACAGGTATTACTGCAACATACGATGATGCAGGTAACATTCTAACCTTGAGTGCTACACAGGCAGACATCAATACTGACAACATCACAGAGGGATCCACTAACCTCTTTACCACTGCTGCACGATCAAGGACACACTTTACCTACGGAACGGGTATCGAGTTGTCTGGCAGTGGTCAGTTGTCAGTTACACAATCAGACATCAATACTGATAATGTTACCGAGGGATCAACAAATCTCTTTATCACTGCTGCTCGCACTAGAGGACATCTAAGTGCAAGTGGTGATCTGTCATATAACAGTAGCACAGGTGACTTTAGTGTAACTACATTTAAGACTGCTGATGCTCGTGGATCAGTCAGTGCAAGTGGTGATCTTTCTTACAACTCATCAACTGGTGTATTCTCATATACTCAGTCTGATACTGACGGTGTTAGCGAAGGATCTACTAATCTTTACTTTACTGATGCTCGTGCAGATTCAAGAGTTAACCTACAGACAGGTGCTAACCTAGACCTTTCTTCTAAGGACACTGGGGATCTTGCTGAAGGATCTAACCTTTACTACACAGATGCAAGAGCAGATACAAGAATTAATTTACAGACAGGTGCAAATCTTGATCTCTCATCTAAGGACACAGGCGATCTTGCTGAAGGATCTAACCTCTACTATACAGACGCAAGGGCAGACGCTCGCGTTACAGCAGGTATCACTGGAAAACTTGATGCTTCTGCAGTCAGTACATTTGGTGGCACCCTCATTGATGATGCTGACGCTGCTGCAGCAAGGACAACCCTTGGACTGGCAACTGTAGCATCTACAGGTGCATATGGTGATCTATCTGGCACACCTTCTCTTGGTGCTGTTGCCACATCTAATGATTATGATGACCTAAGCAACAAACCTACATTATTCTCTGGTGCATATGCTGATCTAACTGGCAAACCTACATTATTCTCTGGTGATTATGATGACCTAACCAACAAACCTACGTTGGGCACTGCTGCTGCAACCGCAGCAACTGCATATGCAACTGCTGCACAGGGATCTAAAGCAGACGCTAACGATACTGACATAGATGACATCTATACTCAGTTGGTTGCGATTGGTAATGACAACTCTATCACTACAGTTGCACAACTTAAGACTGCCCTACTCGCACTAGCAAGAAGTTAA

Genome Context

Tertiary structure

PDB ID

feaa1f8b25f172fa16ad1dfb1c195f7b098ef7e7da1d9e1ac28ed7165a270cff

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4533

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence