Protein

View in Explore

UniProt accession

A0A8S5UH44 [UniProt]

Protein name

Uncharacterized protein

RBP type

Evidence RBPdetect

Probability 0,88

Protein sequence

MAKLIPLQALATTYYTAGAGAPPSLAIDVNNSTAWQTNSVGPTIPDVLVLQFGVPVTPKQFRFLFQTWSKDLRIGYSLTGGVAKANYTEIKAVDMTAEPNDSLGKPWANNALGSSTSKTNVVLLPDNTIAARFWAIWMNDTTGVDRARVMEFSAFDSVADDVVNPKIPATVPTAPWAATPVDWTRTEFNTPGTVNFTPAPDTKMVMVIAQAAGAGGAIKNFRNGDVNSALATPGGDTIISRANGDQLIVASGGRAPAVGDLTFPTIANWVQAPAALTAGNGSTINQNKYSGVGGASELGVRGASYYYEQEPDKDLTVDFRTASDPKWVPQLQSGWARNSQYGWYSTNKSANSTGNVIFQAVQYYAGQQVTFTWASSSEASDKLSIYALPPAGGSTAIVGGIGGVNNSGTAMYTIPADGMYRFQFSYSKDGTISSGLDQVWVTMVNTFSGYNADSIGGAAGRSASLLALAEPLTLTIGAGGVGAPADHAVTSAQNGTKGSGGAGGGNGGDGAVIIYEYKGFLTGEEPLPPEVVANYNVSDTAVVPGVYRTNYVGTRYVDATPNEFTTYQHRLRPRTKTVYALLIGAGGINTGAASGTPAYQTAPTTLKCGALEFIAESGFRQSYSTAGTGGSFSPTDAFVWARNGYTGYSYNNQGQNRPTSPLVSIYGQGGTQAFGSYAGGGGAAWGLVLLKDIPENRTLDLQVANVGTGTNSTATQGAIFIFETEAESGPYITQNSLQTLLKNSQSATQITQVSEQTLIKSPTFTGSQITQVSEQAFVKEKQVATQITQVSEQILITESDNVNNPLQVSYAAMAYIIDAPDPQTAITQVSEQVLVKAPNNNTNITQSAQQILLKAFPATFRFTQVSQQLLIAETPSVFWLNFGNLEYPVKNALYDSRTARCTSVPQDAYIQLEGDFAEGSYMLVNGVNVGLSSPVKENDQVQLHAGVTNYWQLSINVYTYYMTNGEVTREMVGRWNIIQPELSPQKPRAYSVYYTNKQWLLTKTKYSKASITSVFTKARIALSNTMQILFAKANTTIGTKLDVLFGRVTTAMLEPIAPVYNGVRFGTHANQSMFTKALSTIAAGARSMITKAYYGDFKLDKFQHVQAQDSYAKNTYNTGVGTGAAYYTMDPEQIQAAYGLATQEEFHRLAQGSALLENAEFIESGVGTESVDIAFDPLPLGSTAPVDQDFDYVQVGKSYSETQEYEAMLTTGFASTFEMGFTDTIAYSVLNSFDFVGVRSGGTGFWIVPLDTADITRPKMSLMQLFPAEKSNNHSEFVQNNPEAHGAHEFHNFSTYPIFAGAPGNALYRTGIIKRIERVVPVQIGWVRVKAQMGVYKNTPYRPAQIATGRGNASLYQGFDTLNDVLDFTANYSGVTTLQKFNGYVYNLDVDKTFVCEVYYNGPISGLMQGG

Physico‐chemical properties

protein length:	1411 AA
molecular weight:	151359,27890 Da
isoelectric point:	5,25183
aromaticity:	0,10631
hydropathy:	-0,17973

Domains

Domains [InterPro]

G3DSA:2.60.120.260
STR
5–155

G3DSA:2.60.120.260

IPR008979
STR
19–91

IPR008979

A0A8S5UH44

1 1411

Architecture

STR

STR 5-155 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	5	155	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	19	91	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Myoviridae sp. ctshb19 [NCBI]	2825194	Uroviricota > Caudoviricetes >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

DAF93756.1 [NCBI]

Genbank nucleotide accession

BK016086 [NCBI]

CDS location

range 76153 -> 80388
strand +

CDS

ATGGCAAAACTTATTCCGTTGCAGGCGTTGGCCACCACGTATTACACTGCTGGTGCTGGTGCCCCTCCTAGCTTGGCAATTGACGTAAATAACAGTACCGCGTGGCAAACCAACTCGGTAGGCCCTACAATTCCTGATGTACTGGTGCTGCAATTTGGTGTCCCTGTTACGCCAAAACAATTTCGGTTTTTGTTTCAAACGTGGTCCAAAGACCTGCGCATTGGCTACTCGCTCACGGGCGGGGTGGCAAAGGCGAATTACACTGAAATAAAAGCGGTTGATATGACCGCAGAACCTAACGATTCGTTGGGTAAACCGTGGGCTAATAACGCCCTCGGGTCGAGTACCAGTAAAACCAACGTTGTCTTGCTTCCTGATAACACGATTGCCGCACGTTTTTGGGCTATCTGGATGAATGACACGACGGGCGTTGATCGTGCCCGCGTCATGGAATTTTCTGCATTTGATTCGGTTGCGGACGATGTAGTAAACCCGAAAATTCCAGCCACCGTGCCGACCGCGCCGTGGGCAGCAACGCCTGTAGACTGGACACGCACTGAATTCAATACGCCGGGCACCGTCAATTTTACCCCTGCACCAGATACCAAAATGGTTATGGTTATTGCGCAGGCGGCAGGTGCTGGCGGCGCCATTAAGAATTTCCGAAATGGTGACGTAAACAGCGCGCTGGCAACGCCCGGCGGCGACACGATTATTTCCCGTGCAAACGGCGATCAATTAATTGTAGCGTCCGGTGGTCGCGCTCCGGCAGTGGGCGACCTGACATTTCCAACAATTGCCAACTGGGTACAAGCGCCCGCAGCGCTTACCGCTGGTAACGGCTCTACCATAAACCAGAACAAATATTCAGGTGTCGGTGGCGCGTCGGAGTTGGGTGTTCGAGGTGCATCGTATTACTACGAACAGGAACCAGATAAAGATTTAACAGTAGATTTTAGAACTGCCTCGGACCCTAAATGGGTTCCGCAACTGCAATCTGGTTGGGCGCGTAATAGTCAGTATGGTTGGTACAGTACCAACAAATCGGCCAACAGTACCGGCAATGTTATTTTTCAAGCTGTACAGTATTACGCTGGACAACAGGTCACATTTACATGGGCCTCAAGCAGCGAAGCCTCGGATAAACTAAGTATTTACGCGCTTCCACCGGCTGGCGGTTCAACTGCTATTGTTGGTGGAATCGGAGGCGTCAACAACTCCGGCACCGCGATGTATACGATTCCTGCCGACGGCATGTATCGTTTCCAGTTTTCGTATTCCAAGGATGGCACGATTTCCAGCGGACTCGATCAAGTTTGGGTCACGATGGTAAACACTTTCTCCGGTTACAATGCGGATTCGATAGGTGGTGCGGCGGGCCGTAGTGCAAGCCTTCTGGCATTGGCCGAGCCTTTGACGCTGACCATTGGTGCCGGGGGCGTTGGCGCACCAGCAGATCACGCCGTAACTTCTGCACAAAACGGTACAAAAGGTTCTGGTGGTGCGGGCGGTGGTAATGGCGGTGATGGCGCCGTTATTATTTACGAATACAAAGGATTTTTGACGGGTGAGGAACCGCTGCCGCCAGAAGTAGTGGCGAATTACAACGTTTCTGACACTGCTGTGGTTCCCGGCGTTTACCGGACCAACTATGTTGGTACACGCTACGTTGATGCAACACCGAACGAATTTACGACCTATCAACACAGACTGCGCCCCCGGACAAAAACCGTTTATGCGTTACTGATTGGTGCGGGCGGCATTAACACGGGTGCTGCTTCTGGCACGCCTGCATACCAAACGGCACCGACCACACTGAAATGTGGCGCCCTTGAATTTATTGCGGAAAGTGGTTTTAGGCAAAGCTATAGCACTGCTGGAACAGGTGGCTCGTTTAGCCCAACAGACGCGTTTGTTTGGGCGCGAAATGGTTACACTGGTTATTCGTATAATAACCAAGGCCAAAATCGTCCCACATCACCATTAGTTTCTATTTACGGCCAAGGCGGCACACAGGCGTTCGGCAGTTATGCAGGCGGTGGTGGTGCGGCATGGGGCCTAGTTCTACTCAAAGATATTCCCGAAAACCGCACACTCGATCTACAAGTGGCAAACGTTGGTACAGGCACCAACTCGACGGCCACACAGGGTGCAATTTTCATCTTTGAGACGGAAGCGGAGAGCGGGCCTTACATAACGCAAAACTCACTGCAAACGCTGCTAAAAAATAGCCAGTCCGCCACGCAAATCACGCAGGTCAGTGAACAAACGCTGATTAAAAGTCCGACGTTCACCGGTTCGCAAATCACGCAGGTCAGCGAGCAGGCGTTTGTAAAAGAAAAACAAGTTGCGACACAAATCACGCAAGTGTCGGAACAAATCCTGATTACCGAATCTGACAATGTAAACAACCCGCTGCAAGTTTCTTATGCGGCCATGGCTTACATCATTGACGCACCTGATCCGCAAACGGCGATTACGCAGGTCAGCGAACAGGTTTTGGTAAAGGCCCCAAACAACAACACAAATATTACGCAGTCGGCTCAACAAATCCTGCTTAAAGCGTTCCCAGCAACGTTCCGCTTTACGCAGGTTTCGCAGCAGCTTTTGATTGCGGAAACCCCTTCTGTTTTCTGGTTGAATTTCGGCAACCTTGAATACCCAGTTAAAAACGCGCTTTATGATTCGCGAACAGCGCGTTGTACCTCGGTGCCACAGGATGCGTATATTCAGCTGGAAGGTGATTTTGCCGAAGGCTCTTACATGCTGGTTAACGGCGTGAATGTTGGCCTTTCTTCCCCGGTAAAAGAAAACGATCAAGTGCAATTGCATGCGGGTGTAACCAACTATTGGCAGCTGTCGATTAACGTTTACACCTATTACATGACTAACGGCGAAGTGACCCGTGAAATGGTTGGCCGTTGGAACATTATTCAGCCAGAACTGTCGCCGCAGAAACCGCGAGCATACAGCGTTTATTACACCAATAAACAATGGCTGCTTACCAAAACAAAATACTCGAAGGCATCCATTACGTCTGTGTTCACGAAGGCACGTATCGCGCTCTCGAATACGATGCAGATTTTGTTTGCAAAAGCCAACACAACAATTGGCACCAAACTGGATGTTCTGTTTGGCCGGGTAACTACTGCGATGTTGGAACCAATTGCGCCCGTTTATAACGGTGTACGCTTCGGTACTCATGCAAATCAAAGTATGTTCACGAAGGCCCTTAGCACCATTGCCGCTGGCGCCCGTTCGATGATTACCAAAGCGTATTATGGTGATTTCAAACTGGACAAATTCCAGCATGTGCAGGCGCAAGATTCCTACGCGAAAAACACCTACAATACCGGCGTCGGAACAGGGGCCGCGTATTACACCATGGACCCCGAACAAATTCAGGCTGCTTATGGGTTGGCTACACAGGAAGAATTCCATAGACTGGCGCAGGGTAGTGCCTTGCTGGAAAATGCTGAATTTATTGAATCCGGTGTAGGGACCGAGAGCGTAGACATTGCATTCGATCCGCTTCCATTGGGCAGCACTGCACCAGTCGATCAAGATTTTGATTATGTGCAGGTTGGTAAATCCTATAGCGAAACTCAGGAATATGAGGCAATGCTCACTACTGGGTTTGCTTCGACGTTTGAAATGGGGTTCACCGACACCATTGCCTATTCCGTACTGAATTCGTTCGATTTTGTCGGCGTTCGTTCGGGTGGTACAGGGTTCTGGATTGTTCCGTTGGATACTGCTGATATTACGCGCCCGAAAATGTCGCTAATGCAGCTGTTCCCGGCAGAAAAATCCAACAACCACTCAGAGTTTGTGCAAAATAATCCAGAGGCTCATGGTGCGCACGAATTCCACAATTTCAGTACCTATCCAATATTCGCCGGGGCGCCCGGTAACGCCCTGTATAGGACTGGCATTATCAAACGCATTGAACGCGTGGTGCCTGTTCAAATCGGTTGGGTGCGGGTGAAGGCACAAATGGGCGTGTACAAAAACACCCCTTATCGTCCTGCACAAATTGCTACCGGTCGAGGTAATGCTTCGTTGTATCAAGGTTTCGATACGCTAAATGACGTGCTCGATTTCACCGCGAACTATTCAGGCGTGACAACCCTGCAAAAGTTCAATGGGTATGTTTATAACCTTGACGTAGACAAAACATTCGTTTGTGAAGTCTATTACAACGGGCCAATTTCCGGCCTTATGCAAGGTGGTTAA

Genome Context

Tertiary structure

PDB ID

ec657966885a5407f8ee84682f879e9d353ec67d1e0f32f06bd08ec325b0fa47

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3002

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence