Protein

View in Explore

UniProt accession

A0A7S5KPF4 [UniProt]

Protein name

Host specificity protein J

RBP type

Evidence RBPdetect2

Probability 0,57

Protein sequence

MIFPFLAAIGAFLAANAVAIAFTFASMLYQRRRQKKLAAELDKQKGFDLVVDGEPINLPLTYGAQKIAGVRTIHKTFNNVKQRKNPANSGWVQFNYPLSSWPLDTDKDHSSSKNQYLLTQQALCFGGIDEFIDIEVNSQSWDKGKFSHMLEAHLDGGVDNISATASGIADTNKFTNAAWINAIFWLNRNDYNYQGVPNISAYVKGQRIWSLKENNGVISLDTKAYSNNNSYVLMDYLLRPRELGGVGLGNLNAQQWLAGDQPDLSRINLGSFYNAAQICDTTVETITGTARGRVNGVPPVDRRVKELSDRGNGKENGELVYVEDIKQIFEWSGGAWAELLADRTVKLYECNITIDTSRDFRDNIELLLETMGESEMTFSEGKYKLLLDYPENEVEQDQLIAMEIDDSYIVSEDVTVSYPGSADRLNRVTVKFKNEEHDFVMDSVSWPQWGDANHQKLMSEDNQVPSEQEIFFPGCSIRHLALAKAENMVRQSRIYVGDEIENPGSGHSLNQQIVSFTLDRRGIVLETGDLIKLNSEAAGISNRVFRIETLKYTNRMNVELTASQFNYTNLAYSSKDSVIPDPRTVYDNSVANVRNLAYNQGIRNGSPIDSNGYLNWNHPLDEEVRQYIISTSTNNVDWEQLGTTRRRFFDIPAEYDDGADRFFNVRVESTARIMNDGVTVFVNNLQTVAPISSFFGESRTNGANLNWSNPAADITRRYEVYWSKSATKPSTPNQVTRETYLEVTGLDGDTDYRFWVDAVGYSGTRGDMLTPIVVRPTSSEVDPDDVFGDPADPTNLQLSSTLDDDNGKANFSVSWTNPADMGYVAGFRVKITDVNAGETRIFDAPASPFERDYPRGVLLEATVESYNGAAKGGGYLTPQQHTTAADSVPPAVPQNLSGTGGFNTVWLEWSKVGDTDLAYYEVVKRTVGASAPGVNPSNVKQATDNSYAYLGLPDNHNRDYYVRAVDTSGNKSAWSTKVNVVTKDPALTGVTSDDIAGIVREDSFVLGLEPIKTVNTLPDPNGYTGSSVVLLTTDGKTYRYHNGAWTAEVPAVDISGQIQNNQINTVNAAKLTGTINEARIAGLAASKITGELTSDQIADLDAAKIAGQLTDSQLAGISAGKLVGNIVSSQIASIDSAKLTGTINEARIAGLAASKITGQLTDGQIASVATAKLTGEIVANQLAQGATLKDQPVFTMDQDSPYTITPANGSVSYDSTDKYSGTHAALITFTDASNPSGGGNTGAPFITIPDLVALRFGGKRIRISGYAKAPSTNAASEFGVAYSTSDNGNSGFQKFTPTSSWKEFSFTYDVPTPVAGGSDYLGFWADTSNSGKGTLFDQWSIEIIEDLGLASGQITETQISDDAISTPKLKANAVTASIIAANAVVADKIAANAVVADKIAANAITAGKIAANAVTASEIAAGAVTASEIAAGAVVADKIASNAITAEKIEAGAITAAKIAANTIGAGQIAANAITASELASNSIQSGHITSNAIVAAKIASNAITSVKINAGAVNADKLAANAVTAGKIDAGAVTAGKIASNAVTANKIAANAITAGKIDAGAVTTAKLAAGSVEASKIASGAVTTAKLAVGNGGNMIENSNWTAGLSTVANYSNDSTTFKNQHSWRIRPGSEGWSGGHGVLEIRQGGTASGTMNTYLHRMGGSSTYGWPCKPGAKYSASVQMSVHRCTARAVVVFRRADNSWIDAYDIGSNNGAQGSSEVIDDWPMVSNIVTAPTAARYAQLIIYKTGTNSGSDSYVFVHKPMLAETHAEATEATPYSPSGATLISGNEIMTGAITAEKIAANSISAVQIAANTIGVSELSANAVTSDKIAANAVSAGKIATNAISAGKIQAGAVSADKLAAKSITASKLAVGDFTNLNPDMDFADPDGWTGITRRIPTGVDWGGTTGVELDGASNTHKVATSKHIINFDPLGEKLRFEYRARNRLGNAGYVYADIQISKNPTFTGTNGTDYTFRSVGNTGNNYNAVDFAGDIDIPAGFIYGRIRLIKGNNGSTRAQFGVPRLYRKNAGKLIVDGSIKANHVGANEIIANTANIKNGVITNAKIANATIENVKIKDGTIENVKIKNSTITGSKIAGSTIAASNIKNSTITGGKIANATITGGNISTNTIEATHIKANTITGDKIKANTISADRLKIGVGGGNLLLNTDFSQDVVHWYLNKSGNIGSSGRYHIRPPGSWSGRDFPVLEVASSRDTTSSGYVEAQLRVQNPDGSWRRGVPVTGGKWYQASARINALRSKLLMEVRWYDDSGNQIDQDSVSDTNPFSSSSADPGSWRLYSKNWQAPSGAESAVICFRLTETTSNSDGYIFVHNPQLVEVDGSAVQYVPYGPGGTTTINGGSIRTGSITAGVGIFQNGLKSSNFNGAMTSSDITNYGTAGWAIASNGDAVFNNLVARSWVQVGAVSKGASYSGYSSAGKVDGDVVTRTTGPFSLGEFWQIAARIEYRTRKRTSIYYQGKGGSSYSRYRHRTRPYLEYREKNGGTWSGWTVLHQFPDSPTNDSWTTQEVVKSKMDSNQDTQIRIRVHVYAQNAGDSSNGWNDDWKNVRNVTLYSRALVR

Physico‐chemical properties

protein length:	2575 AA
molecular weight:	275207,24610 Da
isoelectric point:	5,73917
aromaticity:	0,08078
hydropathy:	-0,29359

Domains

Domains [InterPro]

DC_0187
STR
1–782

DC_0187 IPR036116 G3DSA:2.60.120.260 DC_1194 DC_1576 G3DSA:2.160.10.20 G3DSA:2.60.120.260

IPR013783
STR
683–781

IPR013783 IPR003961 DC_1194 DC_0591 DC_1335 DC_1904

IPR003961
STR
687–763

IPR003961 DC_0784 IPR053336

IPR003961
STR
687–780

IPR003961 IPR013783 SSF141571

IPR036116
STR
697–839

IPR036116 IPR003961 DC_0595

IPR003961
STR
699–760

IPR003961

IPR003961
STR
700–775

IPR003961

A0A7S5KPF4

1 2575

Architecture

STR

ATT

STR

RBD

STR 1-2010 | ATT 2011-2115 | STR 2116-2343 | RBD 2344-2573 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0187	STR	DC_0187	1	782	Novel HMM	DC_0187	Central	Low	Positional only	466 proteins / 466 hits
IPR013783	STR	IPR013783	683	781	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	687	763	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	687	780	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR036116	STR	IPR036116	697	839	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR003961	STR	DC_0003	699	760	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	700	775	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
DC_0784	STR	DC_0784	769	1198	Novel HMM	DC_0784	Central	Low	Positional only	4 proteins / 4 hits
IPR036116	STR	IPR036116	888	983	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR003961	STR	DC_0003	889	985	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR013783	STR	IPR013783	889	988	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	890	972	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1193	1347	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_1194	STR	DC_1194	1258	1455	Novel HMM	DC_1194	Central	Low	Positional only	27 proteins / 27 hits
DC_1194	STR	DC_1194	1436	1526	Novel HMM	DC_1194	Central	Low	Positional only	27 proteins / 27 hits
DC_0591	STR	DC_0591	1511	1753	Novel HMM	DC_0591	Central	Low	Positional only	18 proteins / 18 hits
DC_1576	STR	DC_1576	1689	2031	Novel HMM	DC_1576	Central	Low	Positional only	13 proteins / 13 hits
DC_1335	ATT	DC_1335	2011	2115	Novel HMM	DC_1335	N-terminal	Low	Positional only	11 proteins / 11 hits
G3DSA:2.160.10.20	RBD	G3DSA:2.160.10.20	2041	2154	Merged direct domain	G3DSA:2.160.10.20	C-terminal	Low	Positional only	6 proteins / 6 hits
IPR053336	Unmapped	-	2051	2175	InterPro	Rhoptry Surface-Associated Protein	-	-	-	-
SSF141571	STR	SSF141571	2053	2136	Merged direct domain	SSF141571	Central	Low	Positional only	8 proteins / 8 hits
DC_0595	STR	DC_0595	2095	2301	Novel HMM	DC_0595	Central	Low	Positional only	17 proteins / 17 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	2162	2343	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_1904	RBD	DC_1904	2320	2573	Novel HMM	DC_1904	C-terminal	Low	Positional only	28 proteins / 28 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacteriophage DSS3_VP1 [NCBI]	2664196	Uroviricota > Caudoviricetes > Naomviridae > Noahvirus arc >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QGH74587.1 [NCBI]

Genbank nucleotide accession

MN602266 [NCBI]

CDS location

range 8647 -> 16374
strand +

CDS

ATGATCTTTCCTTTCCTCGCAGCGATTGGGGCGTTCCTTGCAGCTAATGCTGTGGCGATCGCCTTTACCTTCGCTAGTATGCTCTATCAACGTCGGCGTCAAAAGAAGCTGGCAGCAGAGCTTGATAAACAAAAGGGCTTCGATCTCGTCGTTGACGGGGAGCCTATCAACCTTCCTCTTACTTATGGTGCTCAGAAAATCGCTGGTGTGCGGACTATCCATAAGACATTCAACAATGTGAAACAACGTAAGAATCCCGCTAACTCTGGCTGGGTACAGTTTAACTATCCTTTGAGTAGCTGGCCTTTGGACACTGACAAAGACCACTCTTCCAGCAAGAACCAGTATCTCTTGACTCAACAAGCCCTCTGTTTTGGTGGTATTGATGAATTCATCGATATTGAGGTCAACAGCCAAAGCTGGGACAAAGGTAAGTTCAGTCACATGCTCGAAGCACACCTTGACGGTGGTGTAGATAACATCTCTGCAACTGCTTCTGGTATTGCTGATACAAACAAGTTTACGAATGCAGCTTGGATCAATGCGATCTTCTGGCTGAACCGTAACGATTACAACTACCAAGGTGTCCCTAATATCTCGGCCTATGTTAAAGGTCAGCGTATTTGGTCCTTGAAAGAGAACAATGGTGTTATCTCGCTCGACACCAAAGCTTACTCCAACAACAACTCGTATGTTCTGATGGACTACCTCCTGAGACCCCGTGAACTCGGTGGTGTGGGTCTTGGTAATCTGAATGCACAACAGTGGTTGGCTGGTGATCAGCCTGATCTGTCTCGTATCAACCTTGGATCGTTCTATAATGCTGCTCAAATCTGTGATACTACTGTTGAGACTATCACTGGTACTGCCCGTGGTCGTGTTAATGGTGTTCCTCCGGTTGACCGCCGTGTGAAAGAACTCTCTGATCGCGGTAACGGTAAAGAGAACGGTGAATTGGTTTATGTTGAAGACATTAAACAGATCTTCGAATGGTCTGGTGGTGCTTGGGCAGAACTCCTTGCTGACCGTACTGTGAAGCTCTATGAGTGTAACATTACTATCGACACTTCTCGTGACTTCCGTGACAACATCGAACTTCTCCTTGAAACTATGGGTGAGTCTGAAATGACTTTCTCGGAAGGTAAGTATAAGCTTCTGCTTGACTACCCTGAGAATGAGGTCGAACAAGACCAACTCATCGCTATGGAGATCGATGATAGTTACATCGTTTCTGAAGATGTGACCGTTTCCTATCCGGGTTCGGCAGATCGTCTCAATCGTGTGACTGTAAAGTTCAAGAACGAAGAGCATGACTTTGTGATGGACTCTGTTAGCTGGCCTCAGTGGGGTGATGCTAACCATCAGAAACTTATGTCGGAAGATAATCAGGTTCCTTCTGAACAGGAAATCTTCTTTCCGGGTTGTTCTATTCGTCATTTGGCTCTTGCCAAGGCTGAGAACATGGTTCGCCAGTCGCGTATCTATGTCGGTGATGAGATCGAGAACCCCGGTTCTGGTCATTCTTTGAACCAACAGATCGTGAGCTTTACACTTGATCGTCGTGGTATCGTTCTTGAAACAGGTGACTTGATCAAGCTCAATAGTGAAGCTGCTGGAATCTCTAACCGGGTGTTCCGTATCGAGACCTTGAAGTACACCAATCGTATGAACGTGGAGCTTACTGCTTCTCAATTCAACTACACGAACTTGGCTTACTCTTCAAAGGACTCGGTGATCCCGGATCCTCGTACTGTCTATGACAACTCGGTTGCCAACGTTCGTAACTTGGCTTATAACCAAGGGATCCGTAACGGTTCTCCTATTGACAGCAACGGCTATCTGAACTGGAACCATCCTCTGGATGAAGAAGTTCGCCAATACATCATCAGCACCAGTACCAACAATGTTGATTGGGAACAACTTGGAACTACTCGTCGTAGGTTCTTTGACATCCCTGCTGAGTATGATGATGGTGCAGATCGTTTCTTCAATGTTCGCGTTGAGAGTACTGCTCGTATCATGAACGATGGTGTTACCGTCTTTGTGAACAACCTCCAAACTGTTGCTCCGATTAGCAGCTTCTTTGGCGAGTCTCGTACTAATGGTGCTAACCTGAACTGGTCTAACCCGGCTGCGGACATTACTCGTCGTTATGAAGTCTACTGGTCTAAGTCGGCTACTAAACCTAGCACTCCTAACCAAGTCACACGGGAAACCTATCTTGAGGTGACTGGTCTTGACGGTGACACTGATTACCGTTTCTGGGTGGATGCTGTAGGTTATAGTGGTACTCGTGGTGACATGCTCACCCCGATCGTTGTCCGTCCTACTTCTTCTGAAGTGGACCCTGATGATGTCTTCGGTGATCCGGCTGACCCTACAAACCTTCAGTTGTCGTCCACTCTAGACGATGATAACGGTAAGGCTAACTTCTCTGTATCTTGGACTAACCCTGCTGATATGGGTTATGTTGCTGGTTTCCGTGTGAAGATCACTGATGTGAATGCTGGTGAGACTCGTATCTTTGATGCTCCTGCTTCTCCCTTTGAGCGTGACTATCCTCGCGGAGTCTTGCTAGAGGCTACCGTAGAGAGCTACAACGGGGCTGCTAAAGGGGGTGGGTATCTAACTCCTCAACAGCACACCACAGCGGCAGACTCTGTACCTCCTGCGGTACCTCAGAACCTCAGTGGTACTGGTGGTTTCAATACCGTCTGGTTGGAGTGGAGTAAAGTTGGTGACACTGACCTCGCTTACTATGAGGTTGTTAAACGGACTGTGGGCGCTTCTGCTCCGGGTGTAAATCCGTCAAACGTCAAACAAGCAACTGACAACAGCTATGCTTATCTTGGGCTTCCTGATAATCACAACCGTGACTACTACGTCCGTGCTGTGGACACTTCGGGTAACAAGTCTGCATGGTCTACTAAAGTGAACGTCGTAACTAAAGATCCTGCTCTGACGGGTGTTACAAGTGACGATATCGCTGGGATCGTTCGTGAGGACTCTTTTGTTCTCGGCCTCGAACCGATCAAGACTGTGAATACACTTCCTGACCCTAATGGTTATACGGGTTCTAGTGTTGTCCTTCTGACGACTGATGGCAAGACTTATAGGTATCACAATGGCGCTTGGACTGCTGAAGTCCCTGCTGTAGATATCTCCGGTCAGATCCAGAATAATCAGATCAATACTGTGAATGCTGCCAAACTGACGGGAACGATCAATGAAGCTCGTATCGCTGGTCTCGCTGCAAGCAAGATTACGGGTGAACTCACAAGTGACCAGATTGCTGACTTGGATGCTGCAAAGATCGCTGGACAACTCACGGATTCTCAACTTGCTGGTATTAGTGCTGGTAAACTTGTTGGCAATATCGTATCTAGCCAGATTGCTTCTATTGATTCAGCTAAACTGACGGGAACGATCAATGAAGCTCGTATTGCTGGCCTCGCTGCAAGCAAGATCACTGGCCAACTGACTGACGGTCAAATCGCCAGCGTAGCCACGGCTAAACTTACCGGGGAAATTGTAGCAAATCAGCTTGCTCAAGGTGCGACTCTGAAGGACCAACCTGTATTCACTATGGATCAGGACTCTCCTTATACGATCACACCAGCAAATGGTTCGGTTAGCTATGACTCGACGGATAAGTACTCTGGTACTCATGCTGCACTGATCACCTTCACGGATGCGTCAAACCCCAGTGGGGGTGGCAATACAGGAGCACCCTTTATCACGATCCCCGATCTGGTTGCTCTTCGCTTCGGCGGTAAGAGGATCCGTATTAGTGGTTATGCGAAAGCTCCTTCCACGAATGCAGCTTCTGAATTTGGTGTAGCGTACTCTACCTCTGACAATGGTAACTCTGGTTTCCAGAAGTTCACACCAACATCGTCTTGGAAGGAATTCTCTTTCACTTACGATGTACCAACCCCTGTTGCGGGCGGTAGTGACTACCTCGGGTTCTGGGCTGACACATCAAACTCTGGTAAAGGTACTCTGTTCGACCAGTGGTCTATTGAGATTATTGAGGATCTCGGCTTGGCGTCAGGTCAGATCACTGAGACTCAGATCTCGGATGATGCCATTTCTACACCTAAACTGAAGGCAAATGCAGTAACAGCGAGTATCATCGCTGCGAATGCTGTGGTCGCTGATAAGATCGCTGCGAATGCTGTGGTCGCTGATAAGATTGCTGCGAATGCAATTACTGCTGGTAAGATTGCTGCTAATGCGGTAACTGCAAGTGAGATTGCCGCTGGAGCCGTGACAGCTAGTGAGATTGCCGCTGGAGCTGTGGTTGCTGACAAGATCGCATCTAATGCTATTACAGCAGAGAAGATCGAAGCAGGAGCTATCACGGCGGCTAAGATTGCGGCTAACACAATCGGTGCAGGTCAGATTGCAGCTAATGCTATCACTGCAAGTGAGCTTGCATCAAACTCGATCCAGTCGGGGCACATCACCTCAAATGCTATCGTTGCAGCGAAGATTGCATCTAATGCTATCACATCTGTGAAGATCAATGCTGGTGCTGTAAATGCCGATAAGCTTGCTGCTAATGCTGTGACTGCTGGTAAGATCGATGCAGGAGCGGTAACTGCTGGGAAGATTGCATCCAACGCTGTAACTGCCAACAAGATCGCAGCTAACGCTATCACTGCTGGTAAGATCGATGCAGGAGCAGTAACGACTGCCAAACTTGCTGCGGGTTCTGTTGAAGCCTCGAAGATTGCTTCTGGTGCTGTGACTACTGCTAAATTGGCAGTGGGTAACGGCGGGAACATGATTGAGAACTCTAACTGGACTGCTGGTCTTTCTACCGTAGCCAACTATTCAAATGATAGTACGACCTTCAAGAATCAACACTCTTGGCGGATCCGTCCGGGTTCTGAAGGGTGGTCTGGGGGACATGGTGTTCTTGAGATTAGACAGGGAGGTACTGCTTCAGGGACTATGAACACTTACCTTCATAGGATGGGTGGAAGTAGCACCTACGGTTGGCCTTGTAAACCGGGTGCGAAGTACTCGGCCTCTGTGCAGATGTCTGTTCACCGTTGTACTGCGAGAGCGGTTGTTGTATTCCGTCGAGCTGATAACTCTTGGATCGATGCCTATGACATTGGGAGTAATAATGGTGCTCAAGGGAGTTCGGAGGTTATCGATGACTGGCCTATGGTTTCAAACATCGTAACAGCCCCTACTGCTGCACGTTACGCCCAGCTTATCATCTACAAGACTGGTACAAACAGTGGTTCGGATAGTTATGTGTTTGTTCACAAACCTATGCTTGCGGAAACCCATGCAGAAGCTACTGAAGCGACTCCTTATAGCCCTTCTGGTGCAACTCTGATCTCTGGTAATGAAATCATGACCGGAGCCATTACTGCTGAAAAGATTGCTGCGAACTCTATCTCGGCAGTCCAAATTGCAGCTAATACGATTGGTGTTTCTGAACTTTCTGCTAACGCGGTGACTTCGGATAAGATTGCGGCGAATGCTGTGTCTGCTGGTAAGATTGCCACTAATGCGATCTCGGCAGGGAAGATCCAAGCGGGTGCTGTGAGTGCTGACAAACTGGCTGCGAAATCGATTACGGCTTCAAAGCTTGCTGTTGGTGACTTCACTAACTTGAACCCTGATATGGACTTCGCTGACCCTGATGGGTGGACGGGTATCACTCGTCGTATCCCTACAGGTGTTGATTGGGGTGGTACAACCGGGGTTGAACTTGATGGTGCTTCTAACACACACAAAGTAGCGACTTCCAAGCATATCATTAACTTCGACCCTCTTGGTGAGAAGCTTCGGTTCGAGTACCGTGCAAGGAACCGCTTGGGGAATGCTGGTTATGTGTATGCAGATATCCAGATTTCTAAGAATCCTACGTTCACTGGCACTAACGGGACTGATTATACGTTCCGTAGTGTGGGTAACACTGGCAACAACTATAATGCTGTGGACTTCGCTGGGGATATTGACATCCCTGCTGGATTTATCTATGGTCGAATTCGTTTGATCAAAGGTAACAACGGTTCTACTCGTGCTCAGTTCGGTGTTCCTCGTCTCTACCGTAAGAACGCTGGTAAGTTGATCGTTGATGGCTCTATCAAAGCAAACCATGTTGGTGCCAACGAGATTATCGCTAATACGGCGAATATCAAGAATGGTGTCATCACGAATGCTAAGATTGCCAATGCGACTATCGAGAACGTTAAGATCAAAGATGGTACGATCGAGAATGTCAAGATCAAGAACTCAACTATTACGGGTTCCAAGATTGCTGGCTCTACGATTGCAGCGTCTAACATCAAGAACTCGACCATCACTGGTGGCAAGATCGCAAACGCAACGATCACGGGCGGGAATATCTCGACCAATACAATCGAAGCAACGCACATCAAAGCTAACACCATCACAGGTGACAAGATCAAAGCTAACACTATTTCGGCTGACAGGCTGAAGATTGGTGTTGGTGGCGGTAACTTGCTCCTGAACACGGACTTTAGCCAAGATGTTGTACACTGGTATCTAAACAAGTCTGGTAACATTGGTTCTAGTGGTCGTTACCATATCCGGCCTCCGGGTTCTTGGTCTGGTCGTGACTTCCCTGTTCTGGAAGTAGCTTCGAGCCGTGATACAACTTCGAGTGGTTATGTTGAGGCACAGCTGCGGGTTCAGAACCCTGATGGAAGCTGGCGTCGTGGTGTCCCTGTAACTGGTGGTAAGTGGTATCAAGCTTCGGCTCGTATCAACGCACTCCGGTCTAAACTCTTGATGGAAGTACGATGGTATGATGACTCTGGTAATCAGATTGATCAGGACTCTGTGTCTGATACGAACCCCTTCTCCTCTTCGAGTGCGGATCCGGGTTCTTGGCGCTTGTACAGCAAGAACTGGCAAGCTCCTTCTGGTGCTGAGTCTGCGGTCATCTGTTTCCGTTTGACTGAGACCACAAGTAACTCTGATGGTTACATCTTCGTCCACAATCCCCAACTAGTTGAAGTGGATGGCTCTGCGGTTCAGTATGTTCCGTATGGACCGGGTGGCACTACTACTATCAACGGTGGTTCTATCCGTACAGGGTCGATTACTGCTGGTGTGGGTATCTTCCAAAATGGTCTGAAGTCGAGCAACTTTAACGGTGCTATGACGTCCAGTGATATCACTAACTATGGTACTGCTGGTTGGGCTATTGCGAGTAATGGTGATGCAGTATTCAATAACCTTGTTGCCCGTTCGTGGGTTCAGGTTGGTGCTGTGTCGAAAGGTGCTTCTTACAGTGGTTACTCAAGTGCAGGTAAAGTTGATGGTGACGTTGTTACTCGTACAACTGGACCCTTCTCGCTTGGGGAATTCTGGCAGATTGCGGCTAGGATCGAGTATCGTACTCGTAAACGTACCTCGATCTACTATCAGGGCAAAGGTGGTTCCAGCTACAGTAGGTATCGTCACAGGACTCGTCCTTACCTCGAATATCGAGAGAAGAACGGTGGGACTTGGAGCGGCTGGACTGTACTTCACCAGTTCCCAGATAGCCCTACTAACGATTCTTGGACGACACAGGAAGTTGTGAAGTCTAAGATGGACAGTAACCAAGATACTCAGATTCGTATCCGTGTCCATGTCTACGCCCAAAATGCGGGGGATAGTAGCAATGGCTGGAACGACGATTGGAAGAACGTCCGTAACGTAACACTCTATTCGCGAGCACTTGTTCGCTAA

Genome Context

Tertiary structure

PDB ID

b5cd9a8d8b9a45bf72599b113337f5fb554ea0e5cfdf35433dd0f3036ad37a48

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,5207

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence