Protein

View in Explore

Genbank accession

WIC41292.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect

Probability 0,89

Evidence RBPdetect2

Probability 0,85

Protein sequence

MRADNALLINTIRNNKAKASNTRFLVADALDSLNQDKFGAEDTYTKEQINALLAGSIGDAYVPITGTTLAKPFTGALYGQPAVVDPQKPRSFSIGMRTPGEPRSYGLNIQADTRDVSNTGYTTVTNIDSGLVFNSTYYDNNAITKTAKVKADIADITLSLSDVVSGVNAFAIEKNNIGFTYHAGQPDQYDINMASSGLYATKQFVPTSDNHFVQKKWVVDTIAGNTPQGFVPLVGTSAMTGQIVYTANVTPTDGKALVQKQWVDAQVATRIPLAGSANITGGLTGTALFAPTNNNSFVQKGWVDGAISTALSGIGGFVPLTGTNTSNPITGSLYGKGNAGTTFEFGATSTTSPKLSMIGSEIVGVDKTEIITYVDKTRTEFTNNVFQGNSATIRTKASIQQSNIGVTFVYANAATMATATNRLELNETITASIYNTSNQTYATYKFEGDGLRALAYMMPTSDNHYVQRRYVIDYVDEAISNIAMPFIPLAGSSSITGALVGTTQFTPTSDNAFVQKKWVTDAIAASSGGGNFIPLTGTTSTPVSGRIEFKDAGNSQNTMYIGTPLSGSLYGIQMHSNVATKTIDYSVNTDEFSYNAINTANEVAKINANLSGGVKLSSVTGRGDATLTTYGQNVTIVTNPPGITDPTNEVIFAPGHTFTQTPRDNSQYGQADFIQKAYHDYSNSWEQFTNRKIGGTADMDGNGVNMELYSIMLKQTFTAGQSVVNVDVSNFNPRRIFKVEGIVVDNATKNETMLNAFHPVTKRSTVIIANGMPDHIELSSTGDNFDGYALIYITYIK

Physico‐chemical properties

protein length:	797 AA
molecular weight:	85283,06160 Da
isoelectric point:	5,52057
aromaticity:	0,09034
hydropathy:	-0,20878

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Chryseobacterium phage MA9V-1 [NCBI]	2936916	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Chryseobacterium indologenes [NCBI]	253	cellular organisms > Bacteria > Pseudomonadati > FCB group > Bacteroidota/Chlorobiota group > Bacteroidota

Coding sequence (CDS)

Genbank protein accession

WIC41292.1 [NCBI]

Genbank nucleotide accession

OR050627 [NCBI]

CDS location

range 28818 -> 31211
strand +

CDS

ATGAGAGCAGACAACGCACTATTAATCAATACTATCCGTAATAACAAGGCCAAAGCGAGTAATACTCGCTTCCTTGTAGCGGATGCTTTAGACTCTTTGAACCAAGATAAATTTGGTGCCGAAGATACTTACACAAAAGAACAAATTAACGCTTTATTGGCTGGCAGTATTGGCGATGCATATGTACCAATTACAGGTACTACTTTAGCTAAACCATTTACTGGCGCACTTTATGGTCAGCCTGCTGTAGTAGACCCACAAAAACCGAGGTCATTTAGCATAGGCATGCGTACGCCTGGCGAACCAAGATCATACGGCTTAAATATTCAAGCAGATACTCGCGATGTATCTAACACAGGATATACTACAGTAACTAATATAGATTCTGGCTTAGTTTTTAATTCTACTTATTACGATAACAATGCAATAACTAAAACTGCAAAAGTTAAAGCGGACATTGCGGATATAACACTATCGTTATCTGATGTAGTATCTGGCGTAAATGCTTTTGCCATTGAAAAGAATAACATAGGCTTTACATATCATGCAGGTCAACCAGATCAGTATGATATCAACATGGCTAGCAGTGGACTTTATGCTACTAAGCAATTCGTTCCTACTTCCGATAACCATTTTGTTCAAAAGAAATGGGTAGTTGACACTATTGCAGGAAACACTCCGCAAGGATTTGTTCCTTTAGTAGGTACTAGTGCAATGACCGGACAAATAGTCTATACTGCTAACGTTACACCTACTGATGGCAAAGCATTAGTTCAAAAACAATGGGTTGATGCGCAAGTTGCTACTAGAATTCCTTTAGCAGGTTCAGCCAACATCACAGGAGGTTTAACCGGTACTGCACTTTTTGCGCCGACTAACAACAACTCATTTGTACAAAAGGGTTGGGTTGACGGTGCTATAAGCACAGCACTTTCAGGAATTGGCGGATTCGTTCCGCTTACTGGTACCAACACATCTAATCCGATAACTGGTAGTCTTTACGGTAAAGGTAATGCAGGTACTACATTTGAATTTGGCGCAACATCTACAACTTCGCCAAAGTTAAGTATGATTGGTTCGGAAATTGTTGGCGTAGATAAAACGGAAATCATAACTTACGTCGATAAAACTAGGACCGAATTTACTAATAACGTTTTCCAAGGAAACTCCGCAACTATACGTACAAAGGCTTCAATTCAGCAATCAAACATTGGTGTTACGTTCGTTTACGCTAACGCTGCTACAATGGCTACTGCAACAAACAGATTAGAACTAAACGAAACTATAACGGCTTCAATTTACAATACTAGCAACCAGACATATGCAACATATAAATTTGAAGGCGACGGATTAAGAGCTTTAGCATATATGATGCCGACATCAGATAATCATTACGTTCAAAGAAGATATGTAATAGATTATGTAGACGAAGCCATATCAAATATTGCTATGCCATTTATTCCTTTGGCAGGATCGTCTAGCATTACAGGAGCTTTAGTAGGTACTACACAATTTACTCCGACATCAGACAACGCATTTGTTCAAAAGAAATGGGTAACCGATGCTATCGCTGCAAGTTCAGGAGGAGGCAATTTCATTCCTCTAACAGGTACTACGTCTACACCAGTTTCTGGCAGAATAGAATTTAAGGATGCAGGTAATAGCCAAAACACTATGTATATAGGCACGCCTTTATCAGGTTCACTTTATGGCATACAAATGCATTCTAATGTAGCTACAAAAACTATAGATTATTCAGTAAACACTGACGAATTTAGTTATAACGCAATTAACACTGCAAACGAAGTTGCTAAAATAAATGCAAATCTATCTGGCGGTGTAAAATTATCATCTGTTACCGGCAGAGGCGATGCTACATTAACTACATATGGCCAAAATGTTACTATAGTAACTAATCCTCCGGGCATTACTGATCCTACTAATGAAGTTATTTTTGCACCAGGTCATACATTTACGCAGACACCTAGAGATAATTCGCAATATGGCCAGGCAGATTTTATACAAAAAGCTTACCACGATTACAGCAATAGCTGGGAACAGTTTACTAATCGTAAAATTGGAGGTACTGCAGATATGGACGGCAATGGCGTCAATATGGAATTGTATTCTATAATGCTAAAACAAACGTTTACTGCAGGGCAGTCAGTAGTAAACGTAGATGTTTCAAATTTCAATCCTAGACGAATATTTAAAGTAGAAGGCATTGTAGTTGATAACGCTACAAAAAATGAAACGATGCTTAACGCATTTCATCCAGTTACAAAACGTTCTACTGTAATTATAGCAAATGGCATGCCAGATCATATAGAACTATCATCTACTGGCGATAACTTTGATGGCTATGCGCTAATTTACATTACATACATTAAGTAA

Genome Context

Tertiary structure

PDB ID

7ee492edcd021864374e8ce518c04db0fcce698d14ffb244d707e68882eea746

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,4941

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence