Protein

View in Explore

Genbank accession

AGH26128.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,87

TSP

Evidence RBPdetect2

Probability 0,81

Protein sequence

MATRIKLKRSTTATVVPTTSNLEDGEVALNIQDRKLYARNGSNIIEVANQKPNTGEVTTTMFATDVTNGPGNTFFVASTGNNNTTLANGGANGKHADTPFLTITKALETATSGDTIHIAAGEYQEVFPMTVPDGVTLRGANLRSTSVKPTGATNTNNAFILSGDCHVSDLTIKEFFYDSGNDKGYAFVVVSNMNSTQSPYVERVTVNTKGSVVSGSDPYGYTQGDAGRGALLDGANIAAASQHSSVLFNECTFITPNQVGLKITNGMRVEWLNCFNYFASIGIEGAQGATGKSGTGSTRLKFGGTSGTFSSSEVAYQLEDSFQSGTYARSGSTVTLTRTGHGLVTGDYIYADHISGGATDGFYQVTLVDANNVTYSSGSGTISSSNVTYKKAVATGTVASNDGTYVFITGKGTGEFTTVNKPTKTLSRFGDSQLSTAQKKFGTASILLDGTEDNVKVPTDEDFGFGSANFCIEAFIRPGSVTGTQRIFDLRDNSATDTAPTVYLDGTTLHYAVGNTSQINGGTLSTNTWYHVAVARSNGTTRLFLDGTQLGTYTDNNDYGSTKPVIIGSNYAASPVEAFNGYVDEVRISKASARFTAAFTPTTTEYGSDLNTVLLLHANGDNASTTFTDVSGGISDIRSSGGDSATSVITADYSAFGAELRSVASACVYGQKGVQADGSGVKLILTAHNFGYVGSGDDFTNDPSLAIQANEVVELNGGKVLYSSTDQDGDFRVGDAFTVDQETGNVQFQATSSAQSAANITLSDATGTTNIFPAYIETGNLRFAGNSMTSTAGQVIVDPAGEEDFVVNAETIVKEAVYFDVNKSISFGSTIQGALKIAGFGGSTVFGSSEASSFSTRSFVLLKNGLGTVNLTGAGSGYLSGQQTVDVTTNPFQTAQATAVLGTSGGLKTFTVTNRGIGYTALPTVTIDGSGNGAATAAFGVSGDIRSVTIGNGGSNYASPTGAIDAPPTNVFTGGATYEDANEVSYPVVDTSANTIYIPSHTFETGMEAIFDASTLDATATPVGGLTSSQSYYAIRVDQNLLKLASSLSDANAGNAISLTGQGTGDQFFQGRQATVNVGQTGGVIDTVTVTDIGSGYGAQPDLTITDSAGSNATFTVNVGRAINAVTVDTIGSYSSVPNITFTNASGDTTGSGAAATVALGYAVASVTLNNQGLGYRNLPTLSADGTPVAAAAFTVVLNEQEGRIGSIVVQNGGSGYDTAPTLTFTGGGGSGGQLLADVQSLTGNISANGSGYAPGVYPDVGFTVVTAAGTVSTVATATFTVPGFDGTITTAGSGYADGTYTSVPLVNTPTATYTVTVVTRDKN

Physico‐chemical properties

protein length:	1324 AA
molecular weight:	135796,85010 Da
isoelectric point:	4,53316
aromaticity:	0,08384
hydropathy:	-0,09350

Domains

Domains [InterPro]

IPR011050
97–405

IPR011050 G3DSA:2.60.120.200

IPR023366
321–400

IPR023366 IPR013320

PF13385
449–590

PF13385

AGH26128.1

1 1324

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR011050	97	405	InterPro	Pectin lyase fold/virulence factor
IPR023366	321	400	InterPro	ATP synthase subunit alpha, N-terminal domain-like superfamily
G3DSA:2.60.120.200	417	593	Gene3D	None
IPR013320	433	589	InterPro	Concanavalin A-like lectin/glucanase domain superfamily
PF13385	449	590	Pfam	None

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Prochlorococcus phage MED4-213 [NCBI]	889956	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Prochlorococcus [NCBI]	1218	Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae >

Coding sequence (CDS)

Genbank protein accession

AGH26128.1 [NCBI]

Genbank nucleotide accession

HQ634174 [NCBI]

CDS location

range 38645 -> 42619
strand -

CDS

ATGGCAACGAGAATCAAGCTAAAGAGATCGACAACAGCAACAGTAGTCCCGACGACTTCTAACCTAGAAGACGGTGAGGTCGCTCTTAATATACAAGACCGAAAACTGTATGCTAGAAATGGATCAAATATAATAGAGGTCGCCAACCAGAAACCTAATACTGGTGAGGTGACTACAACTATGTTTGCTACGGACGTGACGAACGGTCCTGGCAATACTTTTTTTGTTGCGTCTACTGGAAATAATAATACAACTCTTGCTAATGGTGGTGCTAATGGTAAACATGCAGATACACCATTTTTAACTATTACAAAAGCACTTGAGACTGCTACATCTGGCGATACAATTCACATTGCAGCTGGAGAATATCAGGAAGTCTTCCCAATGACAGTTCCTGATGGTGTCACATTACGTGGAGCAAACTTAAGATCAACATCTGTAAAACCTACAGGTGCTACAAACACTAATAACGCATTTATATTATCTGGAGACTGTCATGTTTCCGACTTAACAATCAAAGAATTTTTCTATGACAGTGGCAATGATAAAGGATATGCCTTTGTTGTAGTATCAAATATGAACTCTACACAGAGTCCTTATGTTGAGAGAGTAACAGTCAATACAAAAGGTAGTGTAGTATCTGGTTCAGATCCTTATGGATATACACAAGGAGATGCAGGACGTGGTGCTTTATTGGATGGTGCAAATATTGCAGCTGCATCACAACATAGTTCTGTTCTATTCAACGAGTGCACCTTTATAACACCTAATCAGGTTGGTCTAAAAATTACCAATGGTATGCGTGTAGAGTGGTTGAATTGCTTCAACTATTTTGCATCTATTGGTATTGAGGGTGCTCAAGGTGCTACAGGTAAATCTGGCACAGGTAGCACTAGATTAAAGTTTGGTGGAACTAGTGGAACATTCTCATCATCTGAGGTTGCGTATCAATTAGAAGATAGTTTTCAGTCAGGAACTTATGCAAGATCTGGATCTACAGTTACATTAACAAGAACTGGACATGGTTTAGTAACAGGCGATTACATATATGCAGATCATATCAGTGGTGGTGCTACAGATGGATTTTATCAAGTCACTTTAGTAGATGCTAATAATGTAACTTACTCTAGTGGATCTGGAACTATATCATCTAGCAATGTAACTTATAAAAAAGCAGTAGCAACTGGAACTGTTGCTAGTAACGATGGCACATATGTATTCATTACTGGTAAGGGAACTGGAGAATTTACAACAGTCAATAAACCAACTAAGACTCTAAGTAGATTTGGTGACTCACAATTAAGCACAGCACAAAAGAAATTTGGAACAGCATCCATATTATTAGATGGAACTGAGGATAACGTAAAAGTTCCTACTGATGAAGACTTTGGATTTGGTTCTGCAAACTTCTGTATAGAAGCATTTATTAGACCTGGCAGTGTAACAGGCACACAAAGAATATTTGATCTTAGAGATAATTCTGCTACAGATACAGCACCTACAGTATATCTTGATGGAACTACTCTACATTATGCAGTAGGAAATACATCACAAATTAATGGTGGAACTTTATCAACTAACACATGGTATCATGTTGCTGTTGCTAGAAGCAATGGAACTACAAGACTATTCTTAGATGGAACTCAATTAGGAACATACACAGATAATAATGACTATGGATCTACAAAACCAGTTATCATAGGATCTAACTATGCTGCATCTCCTGTAGAAGCATTCAATGGATATGTTGACGAAGTAAGAATTAGTAAAGCATCTGCTCGTTTCACTGCAGCATTTACTCCTACAACAACTGAGTATGGTTCTGACTTAAATACTGTTCTATTACTACATGCAAACGGTGACAACGCCTCTACGACCTTTACAGACGTCTCTGGTGGTATATCTGATATTAGATCTAGCGGTGGAGATTCTGCTACATCTGTTATCACTGCTGACTACTCAGCATTTGGTGCTGAACTACGTTCTGTAGCATCTGCATGTGTTTACGGACAGAAAGGTGTACAAGCAGATGGTTCTGGTGTAAAACTCATACTTACTGCACATAACTTTGGTTATGTTGGATCTGGTGATGATTTCACCAATGACCCATCATTAGCAATACAAGCAAATGAGGTAGTAGAACTTAATGGTGGTAAAGTATTATATTCATCTACAGACCAAGATGGTGACTTCCGTGTTGGTGATGCATTTACAGTAGATCAAGAAACTGGTAATGTTCAATTCCAAGCAACATCTTCAGCTCAATCAGCAGCAAACATTACGTTAAGTGATGCTACTGGAACAACTAATATATTCCCTGCATATATTGAAACTGGCAACTTAAGATTTGCGGGTAACAGTATGACTTCTACAGCGGGTCAGGTAATTGTTGACCCAGCTGGTGAAGAAGATTTCGTTGTTAACGCTGAAACAATCGTTAAAGAAGCAGTTTATTTTGATGTTAATAAGTCAATATCATTTGGTAGCACAATTCAAGGTGCTCTAAAAATTGCAGGATTTGGTGGATCTACAGTATTTGGATCTTCAGAAGCATCCAGTTTTTCTACTAGATCATTTGTTCTACTCAAGAATGGATTAGGAACTGTCAACCTAACAGGTGCAGGATCAGGTTATCTTAGTGGACAACAAACAGTAGATGTAACCACAAACCCATTTCAAACTGCACAAGCAACAGCAGTTTTAGGCACTTCGGGTGGATTAAAAACATTTACAGTAACCAATAGAGGAATTGGATACACCGCACTTCCAACAGTAACAATTGATGGATCTGGAAATGGAGCTGCAACCGCAGCGTTTGGTGTCAGTGGTGATATTCGTTCAGTAACGATTGGTAATGGAGGAAGCAACTATGCATCTCCTACAGGAGCTATAGACGCTCCACCAACTAATGTATTTACAGGTGGTGCTACATACGAAGACGCAAATGAAGTTAGTTATCCAGTCGTTGATACATCAGCAAACACAATTTATATCCCAAGTCATACTTTTGAGACAGGGATGGAAGCAATTTTTGATGCATCAACATTAGATGCAACTGCTACTCCCGTAGGTGGTTTAACCTCCAGTCAATCTTACTATGCTATTCGAGTTGACCAAAATCTCCTTAAATTAGCATCTAGTCTATCAGATGCAAATGCAGGAAATGCAATATCATTAACAGGTCAAGGAACAGGAGATCAGTTCTTCCAAGGTAGACAAGCAACAGTTAACGTTGGACAGACTGGTGGTGTTATTGATACCGTGACTGTTACTGATATTGGTTCTGGTTATGGTGCTCAACCAGATCTTACAATTACCGACTCTGCAGGATCAAATGCTACATTTACAGTTAATGTTGGACGTGCAATTAATGCAGTCACTGTAGATACTATTGGATCTTATTCATCTGTACCAAACATCACATTTACAAATGCATCAGGAGATACCACTGGATCAGGTGCTGCTGCTACTGTTGCATTAGGATACGCTGTTGCATCGGTTACATTAAACAATCAAGGTTTAGGTTATAGAAATCTTCCAACTTTAAGTGCTGATGGAACTCCAGTTGCAGCTGCAGCATTCACTGTAGTTTTAAACGAACAAGAAGGTAGAATTGGATCTATAGTTGTTCAAAACGGAGGATCAGGATATGACACTGCACCAACACTAACATTTACTGGTGGAGGTGGTAGTGGTGGTCAACTATTAGCAGATGTTCAATCACTAACTGGAAATATCTCAGCAAATGGATCTGGATATGCACCTGGCGTTTATCCTGACGTAGGATTTACTGTTGTTACCGCTGCAGGTACAGTCTCAACCGTTGCAACTGCTACGTTCACAGTTCCTGGTTTTGACGGAACTATTACAACAGCTGGATCTGGTTATGCAGACGGAACTTATACTAGCGTTCCACTCGTAAACACTCCAACTGCAACTTATACAGTAACTGTTGTAACGAGAGACAAAAATTGA

Tertiary structure

PDB ID

581473bb945e8ef11d7980378818c50611a8c0f72811f595fca11eaaceae94e1

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5632

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
The Genome Sequence of Cyanophage MED4-213	Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature