Protein

View in Explore

Genbank accession

AVD99228.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect2

Probability 0,65

Protein sequence

MTTPTGPIDVEITAGEPEIVEVTQAPSPGLTLATAAPTNSFVAQAPAPGLTLTTAGPQGPPGTRLLPTVGQPSDSLGYAGEYAIDTGSGRLYGPKALTWPIWSEITPVTEGGWNFNGSAEIDPVEANDVYLTRAGGGFGGGTAWYSSLQSSTVDVSFEMEMSGGSGADGITFAFANTGTATTFVGGGGGDLGLVGTAAVAVAFDTASGSRARIVTTTGSSMSTVATYSGALDFRSAPVNVRVKYDGTKLYCWIDEVEIFNQTIAISSNVRLGWTAANGGSDDNHIIRHSSFLPSGGMLLKGERGDFGPIGPGVPAGGGSGQILQKNSVDDFDTLWVDNVTGVPDGGIAGQVLKKNGAADGDILWKDIYPAGGSAGQVLKKTGPNDTDVAWGSGVPAGGTTNQVLKKNSNTDFDAVWAAAPTPVPPGGTSGQVLKKNSATDYDMAWQADNGLIDPTTTKGDLMARTASAMSRFAIGLDGSILTADSSQAAGMKWATPTGWFRGEWVADTIAYDQGFSGGSIPSPFTGSHVGTASDPYIVATSAVGGSASPYTAAVKMQIGNINTGHSSTLTLPLASLGISGITRIKVWTGKTDANIDSSISKNGTAVFSQHQTTYNWTEREFAASSSDTFTFTCFGNYGVNSGTTGGLFVTGIRVYATASPYMTGQFVTYNGKLWKSTQDNNGTTPGAGGATWTEIPLNQMTGVAKDATTTKGDLLVRDSTAIVRLPVGSNGQVLTVDSAQAAGVKWAPAPAAVVSIKVVELSANVSKSDTTSWTTVLSGTFTPTGTSVAVTAGGVCSNSSAGVYANFQVTRDGGAGATLPMGNFYTNHNAQMPYWCRRVFTGLTPGTVYTFSLQVKMATSGTWQCRPASFPNDEQLSLTIDNVV

Physico‐chemical properties

protein length:	884 AA
molecular weight:	90868,78240 Da
isoelectric point:	4,80991
aromaticity:	0,08484
hydropathy:	-0,09231

Domains

Domains [InterPro]

G3DSA:2.60.120.200
STR
103–294

G3DSA:2.60.120.200 DC_0957 DC_0393

IPR013320
STR
111–293

IPR013320

AVD99228.1

1 884

Architecture

STR

STR 103-294 | STR 315-516 | STR 660-871 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	103	294	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	111	293	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
DC_0957	STR	DC_0957	315	516	Novel HMM	DC_0957	Central	Low	Positional only	26 proteins / 26 hits
DC_0393	STR	DC_0393	660	871	Novel HMM	DC_0393	Central	Low	Positional only	25 proteins / 25 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptomyces phage BillNye [NCBI]	2079426	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AVD99228.1 [NCBI]

Genbank nucleotide accession

MG757153 [NCBI]

CDS location

range 18819 -> 21473
strand +

CDS

ATGACAACGCCAACTGGACCAATTGATGTAGAAATTACTGCGGGAGAGCCTGAGATTGTTGAAGTAACTCAGGCTCCCTCCCCAGGGCTGACCCTAGCTACGGCTGCCCCTACAAATTCTTTTGTTGCCCAGGCTCCAGCTCCTGGACTAACCCTAACAACCGCTGGCCCCCAGGGTCCTCCTGGTACCCGTCTTCTTCCAACTGTTGGACAGCCTAGCGACTCTCTCGGTTATGCGGGAGAGTACGCTATCGACACCGGAAGCGGTCGTCTATACGGGCCAAAGGCCCTTACCTGGCCTATCTGGTCAGAGATTACTCCGGTTACCGAGGGCGGCTGGAATTTCAACGGCTCTGCCGAAATCGACCCGGTTGAGGCCAATGACGTATACCTTACCCGCGCTGGTGGTGGCTTTGGAGGAGGTACCGCATGGTACAGCTCCTTGCAGTCATCCACTGTAGACGTTTCTTTTGAGATGGAAATGAGCGGAGGCTCGGGTGCTGATGGTATTACTTTCGCATTCGCTAATACTGGCACTGCCACGACATTTGTCGGCGGTGGCGGTGGAGACCTCGGTCTAGTTGGTACCGCTGCCGTAGCCGTTGCATTTGATACGGCGTCCGGTAGCCGTGCTCGTATCGTCACGACCACAGGTTCGTCCATGAGCACCGTAGCTACTTATTCAGGCGCTCTCGATTTTAGGTCGGCACCAGTCAACGTCCGAGTTAAGTACGATGGCACAAAGCTTTACTGCTGGATTGACGAAGTAGAAATCTTCAATCAGACAATCGCTATCAGCTCCAATGTTCGATTGGGATGGACTGCCGCAAACGGTGGCTCCGACGATAACCACATCATTAGGCACTCAAGCTTCCTGCCAAGCGGCGGAATGCTGCTCAAGGGTGAGAGGGGCGACTTCGGTCCTATTGGCCCTGGTGTTCCTGCGGGCGGTGGTTCTGGTCAGATTTTGCAGAAGAATTCAGTCGATGACTTCGACACCTTGTGGGTAGATAACGTTACTGGAGTTCCAGATGGCGGTATTGCTGGCCAGGTATTGAAGAAGAACGGCGCAGCCGATGGCGATATTCTCTGGAAGGACATTTACCCAGCGGGCGGTTCTGCTGGACAGGTCTTGAAGAAGACTGGTCCCAATGACACTGACGTAGCTTGGGGCTCTGGTGTTCCTGCTGGAGGTACGACTAATCAGGTTCTAAAGAAGAACAGCAACACCGACTTCGACGCTGTGTGGGCTGCTGCTCCTACACCAGTTCCACCCGGTGGTACTTCTGGTCAGGTGCTAAAGAAGAATAGTGCCACGGATTACGACATGGCTTGGCAGGCAGATAATGGCCTTATTGACCCTACGACCACTAAGGGCGACCTTATGGCTCGTACCGCGTCAGCTATGTCTCGTTTTGCTATTGGTCTGGATGGCTCCATTCTTACCGCAGACTCTTCTCAGGCTGCTGGCATGAAGTGGGCGACTCCTACCGGATGGTTCCGTGGTGAATGGGTAGCTGACACTATTGCCTACGACCAGGGATTTTCTGGCGGGTCTATTCCATCTCCATTCACTGGTTCGCATGTTGGTACGGCATCTGACCCATACATCGTAGCCACGTCTGCGGTAGGTGGTTCAGCAAGTCCATACACTGCTGCCGTCAAGATGCAGATTGGTAATATCAACACCGGACATTCGTCCACGCTGACACTGCCACTCGCTTCGCTGGGAATTTCAGGAATCACCCGAATTAAGGTGTGGACTGGAAAGACTGATGCCAACATCGACTCGTCTATTTCCAAGAATGGCACGGCTGTTTTCTCTCAGCACCAGACGACCTATAACTGGACCGAGCGAGAATTTGCAGCGTCTTCTTCCGACACCTTTACGTTTACCTGCTTTGGTAACTACGGAGTTAACTCTGGTACGACCGGTGGTCTGTTCGTTACTGGTATTCGGGTTTATGCAACGGCCAGCCCGTACATGACTGGACAGTTTGTTACCTACAACGGCAAGCTGTGGAAGTCAACCCAGGACAATAACGGAACAACTCCGGGAGCTGGCGGTGCAACTTGGACCGAGATTCCTCTTAATCAGATGACGGGTGTTGCCAAGGATGCAACCACCACAAAGGGAGACCTTTTGGTTCGAGACTCGACCGCAATTGTTCGTCTGCCTGTCGGCTCGAATGGTCAGGTTCTAACTGTAGACTCTGCTCAGGCTGCTGGTGTTAAGTGGGCACCGGCTCCTGCTGCTGTTGTCAGCATAAAGGTGGTTGAGCTTTCCGCGAACGTAAGCAAGAGCGATACCACGTCCTGGACAACCGTGCTTTCCGGAACGTTTACGCCAACCGGAACTTCTGTGGCGGTGACGGCCGGTGGCGTTTGCTCGAACAGCTCTGCTGGTGTGTATGCCAATTTCCAGGTGACTAGGGATGGTGGAGCTGGAGCAACCCTGCCTATGGGTAACTTCTACACCAACCACAATGCCCAGATGCCATATTGGTGTCGCCGGGTATTTACGGGACTGACTCCAGGAACCGTGTACACGTTCTCGCTCCAGGTAAAGATGGCCACGTCTGGAACGTGGCAGTGTCGCCCAGCATCATTCCCGAATGATGAGCAGCTATCGCTGACAATTGACAATGTAGTCTAA

Genome Context

Tertiary structure

PDB ID

f56cfc9d856c3cb0d6b1cf4a60da5fcaf8f290f6593e01ae956f7c60c879347a

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7200

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence