UniProt accession
A0A7S5KPF4 [UniProt]
Protein name
Host specificity protein J
RBP type
TF
Evidence RBPdetect2
Probability 0,57
Protein sequence
MIFPFLAAIGAFLAANAVAIAFTFASMLYQRRRQKKLAAELDKQKGFDLVVDGEPINLPLTYGAQKIAGVRTIHKTFNNVKQRKNPANSGWVQFNYPLSSWPLDTDKDHSSSKNQYLLTQQALCFGGIDEFIDIEVNSQSWDKGKFSHMLEAHLDGGVDNISATASGIADTNKFTNAAWINAIFWLNRNDYNYQGVPNISAYVKGQRIWSLKENNGVISLDTKAYSNNNSYVLMDYLLRPRELGGVGLGNLNAQQWLAGDQPDLSRINLGSFYNAAQICDTTVETITGTARGRVNGVPPVDRRVKELSDRGNGKENGELVYVEDIKQIFEWSGGAWAELLADRTVKLYECNITIDTSRDFRDNIELLLETMGESEMTFSEGKYKLLLDYPENEVEQDQLIAMEIDDSYIVSEDVTVSYPGSADRLNRVTVKFKNEEHDFVMDSVSWPQWGDANHQKLMSEDNQVPSEQEIFFPGCSIRHLALAKAENMVRQSRIYVGDEIENPGSGHSLNQQIVSFTLDRRGIVLETGDLIKLNSEAAGISNRVFRIETLKYTNRMNVELTASQFNYTNLAYSSKDSVIPDPRTVYDNSVANVRNLAYNQGIRNGSPIDSNGYLNWNHPLDEEVRQYIISTSTNNVDWEQLGTTRRRFFDIPAEYDDGADRFFNVRVESTARIMNDGVTVFVNNLQTVAPISSFFGESRTNGANLNWSNPAADITRRYEVYWSKSATKPSTPNQVTRETYLEVTGLDGDTDYRFWVDAVGYSGTRGDMLTPIVVRPTSSEVDPDDVFGDPADPTNLQLSSTLDDDNGKANFSVSWTNPADMGYVAGFRVKITDVNAGETRIFDAPASPFERDYPRGVLLEATVESYNGAAKGGGYLTPQQHTTAADSVPPAVPQNLSGTGGFNTVWLEWSKVGDTDLAYYEVVKRTVGASAPGVNPSNVKQATDNSYAYLGLPDNHNRDYYVRAVDTSGNKSAWSTKVNVVTKDPALTGVTSDDIAGIVREDSFVLGLEPIKTVNTLPDPNGYTGSSVVLLTTDGKTYRYHNGAWTAEVPAVDISGQIQNNQINTVNAAKLTGTINEARIAGLAASKITGELTSDQIADLDAAKIAGQLTDSQLAGISAGKLVGNIVSSQIASIDSAKLTGTINEARIAGLAASKITGQLTDGQIASVATAKLTGEIVANQLAQGATLKDQPVFTMDQDSPYTITPANGSVSYDSTDKYSGTHAALITFTDASNPSGGGNTGAPFITIPDLVALRFGGKRIRISGYAKAPSTNAASEFGVAYSTSDNGNSGFQKFTPTSSWKEFSFTYDVPTPVAGGSDYLGFWADTSNSGKGTLFDQWSIEIIEDLGLASGQITETQISDDAISTPKLKANAVTASIIAANAVVADKIAANAVVADKIAANAITAGKIAANAVTASEIAAGAVTASEIAAGAVVADKIASNAITAEKIEAGAITAAKIAANTIGAGQIAANAITASELASNSIQSGHITSNAIVAAKIASNAITSVKINAGAVNADKLAANAVTAGKIDAGAVTAGKIASNAVTANKIAANAITAGKIDAGAVTTAKLAAGSVEASKIASGAVTTAKLAVGNGGNMIENSNWTAGLSTVANYSNDSTTFKNQHSWRIRPGSEGWSGGHGVLEIRQGGTASGTMNTYLHRMGGSSTYGWPCKPGAKYSASVQMSVHRCTARAVVVFRRADNSWIDAYDIGSNNGAQGSSEVIDDWPMVSNIVTAPTAARYAQLIIYKTGTNSGSDSYVFVHKPMLAETHAEATEATPYSPSGATLISGNEIMTGAITAEKIAANSISAVQIAANTIGVSELSANAVTSDKIAANAVSAGKIATNAISAGKIQAGAVSADKLAAKSITASKLAVGDFTNLNPDMDFADPDGWTGITRRIPTGVDWGGTTGVELDGASNTHKVATSKHIINFDPLGEKLRFEYRARNRLGNAGYVYADIQISKNPTFTGTNGTDYTFRSVGNTGNNYNAVDFAGDIDIPAGFIYGRIRLIKGNNGSTRAQFGVPRLYRKNAGKLIVDGSIKANHVGANEIIANTANIKNGVITNAKIANATIENVKIKDGTIENVKIKNSTITGSKIAGSTIAASNIKNSTITGGKIANATITGGNISTNTIEATHIKANTITGDKIKANTISADRLKIGVGGGNLLLNTDFSQDVVHWYLNKSGNIGSSGRYHIRPPGSWSGRDFPVLEVASSRDTTSSGYVEAQLRVQNPDGSWRRGVPVTGGKWYQASARINALRSKLLMEVRWYDDSGNQIDQDSVSDTNPFSSSSADPGSWRLYSKNWQAPSGAESAVICFRLTETTSNSDGYIFVHNPQLVEVDGSAVQYVPYGPGGTTTINGGSIRTGSITAGVGIFQNGLKSSNFNGAMTSSDITNYGTAGWAIASNGDAVFNNLVARSWVQVGAVSKGASYSGYSSAGKVDGDVVTRTTGPFSLGEFWQIAARIEYRTRKRTSIYYQGKGGSSYSRYRHRTRPYLEYREKNGGTWSGWTVLHQFPDSPTNDSWTTQEVVKSKMDSNQDTQIRIRVHVYAQNAGDSSNGWNDDWKNVRNVTLYSRALVR
Physico‐chemical
properties
protein length:2575 AA
molecular weight: 275207,24610 Da
isoelectric point:5,73917
aromaticity:0,08078
hydropathy:-0,29359

Domains

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacteriophage DSS3_VP1
[NCBI]
2664196 Uroviricota > Caudoviricetes > Naomviridae > Noahvirus arc >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QGH74587.1 [NCBI]
Genbank nucleotide accession
MN602266 [NCBI]
CDS location
range 8647 -> 16374
strand +
CDS
ATGATCTTTCCTTTCCTCGCAGCGATTGGGGCGTTCCTTGCAGCTAATGCTGTGGCGATCGCCTTTACCTTCGCTAGTATGCTCTATCAACGTCGGCGTCAAAAGAAGCTGGCAGCAGAGCTTGATAAACAAAAGGGCTTCGATCTCGTCGTTGACGGGGAGCCTATCAACCTTCCTCTTACTTATGGTGCTCAGAAAATCGCTGGTGTGCGGACTATCCATAAGACATTCAACAATGTGAAACAACGTAAGAATCCCGCTAACTCTGGCTGGGTACAGTTTAACTATCCTTTGAGTAGCTGGCCTTTGGACACTGACAAAGACCACTCTTCCAGCAAGAACCAGTATCTCTTGACTCAACAAGCCCTCTGTTTTGGTGGTATTGATGAATTCATCGATATTGAGGTCAACAGCCAAAGCTGGGACAAAGGTAAGTTCAGTCACATGCTCGAAGCACACCTTGACGGTGGTGTAGATAACATCTCTGCAACTGCTTCTGGTATTGCTGATACAAACAAGTTTACGAATGCAGCTTGGATCAATGCGATCTTCTGGCTGAACCGTAACGATTACAACTACCAAGGTGTCCCTAATATCTCGGCCTATGTTAAAGGTCAGCGTATTTGGTCCTTGAAAGAGAACAATGGTGTTATCTCGCTCGACACCAAAGCTTACTCCAACAACAACTCGTATGTTCTGATGGACTACCTCCTGAGACCCCGTGAACTCGGTGGTGTGGGTCTTGGTAATCTGAATGCACAACAGTGGTTGGCTGGTGATCAGCCTGATCTGTCTCGTATCAACCTTGGATCGTTCTATAATGCTGCTCAAATCTGTGATACTACTGTTGAGACTATCACTGGTACTGCCCGTGGTCGTGTTAATGGTGTTCCTCCGGTTGACCGCCGTGTGAAAGAACTCTCTGATCGCGGTAACGGTAAAGAGAACGGTGAATTGGTTTATGTTGAAGACATTAAACAGATCTTCGAATGGTCTGGTGGTGCTTGGGCAGAACTCCTTGCTGACCGTACTGTGAAGCTCTATGAGTGTAACATTACTATCGACACTTCTCGTGACTTCCGTGACAACATCGAACTTCTCCTTGAAACTATGGGTGAGTCTGAAATGACTTTCTCGGAAGGTAAGTATAAGCTTCTGCTTGACTACCCTGAGAATGAGGTCGAACAAGACCAACTCATCGCTATGGAGATCGATGATAGTTACATCGTTTCTGAAGATGTGACCGTTTCCTATCCGGGTTCGGCAGATCGTCTCAATCGTGTGACTGTAAAGTTCAAGAACGAAGAGCATGACTTTGTGATGGACTCTGTTAGCTGGCCTCAGTGGGGTGATGCTAACCATCAGAAACTTATGTCGGAAGATAATCAGGTTCCTTCTGAACAGGAAATCTTCTTTCCGGGTTGTTCTATTCGTCATTTGGCTCTTGCCAAGGCTGAGAACATGGTTCGCCAGTCGCGTATCTATGTCGGTGATGAGATCGAGAACCCCGGTTCTGGTCATTCTTTGAACCAACAGATCGTGAGCTTTACACTTGATCGTCGTGGTATCGTTCTTGAAACAGGTGACTTGATCAAGCTCAATAGTGAAGCTGCTGGAATCTCTAACCGGGTGTTCCGTATCGAGACCTTGAAGTACACCAATCGTATGAACGTGGAGCTTACTGCTTCTCAATTCAACTACACGAACTTGGCTTACTCTTCAAAGGACTCGGTGATCCCGGATCCTCGTACTGTCTATGACAACTCGGTTGCCAACGTTCGTAACTTGGCTTATAACCAAGGGATCCGTAACGGTTCTCCTATTGACAGCAACGGCTATCTGAACTGGAACCATCCTCTGGATGAAGAAGTTCGCCAATACATCATCAGCACCAGTACCAACAATGTTGATTGGGAACAACTTGGAACTACTCGTCGTAGGTTCTTTGACATCCCTGCTGAGTATGATGATGGTGCAGATCGTTTCTTCAATGTTCGCGTTGAGAGTACTGCTCGTATCATGAACGATGGTGTTACCGTCTTTGTGAACAACCTCCAAACTGTTGCTCCGATTAGCAGCTTCTTTGGCGAGTCTCGTACTAATGGTGCTAACCTGAACTGGTCTAACCCGGCTGCGGACATTACTCGTCGTTATGAAGTCTACTGGTCTAAGTCGGCTACTAAACCTAGCACTCCTAACCAAGTCACACGGGAAACCTATCTTGAGGTGACTGGTCTTGACGGTGACACTGATTACCGTTTCTGGGTGGATGCTGTAGGTTATAGTGGTACTCGTGGTGACATGCTCACCCCGATCGTTGTCCGTCCTACTTCTTCTGAAGTGGACCCTGATGATGTCTTCGGTGATCCGGCTGACCCTACAAACCTTCAGTTGTCGTCCACTCTAGACGATGATAACGGTAAGGCTAACTTCTCTGTATCTTGGACTAACCCTGCTGATATGGGTTATGTTGCTGGTTTCCGTGTGAAGATCACTGATGTGAATGCTGGTGAGACTCGTATCTTTGATGCTCCTGCTTCTCCCTTTGAGCGTGACTATCCTCGCGGAGTCTTGCTAGAGGCTACCGTAGAGAGCTACAACGGGGCTGCTAAAGGGGGTGGGTATCTAACTCCTCAACAGCACACCACAGCGGCAGACTCTGTACCTCCTGCGGTACCTCAGAACCTCAGTGGTACTGGTGGTTTCAATACCGTCTGGTTGGAGTGGAGTAAAGTTGGTGACACTGACCTCGCTTACTATGAGGTTGTTAAACGGACTGTGGGCGCTTCTGCTCCGGGTGTAAATCCGTCAAACGTCAAACAAGCAACTGACAACAGCTATGCTTATCTTGGGCTTCCTGATAATCACAACCGTGACTACTACGTCCGTGCTGTGGACACTTCGGGTAACAAGTCTGCATGGTCTACTAAAGTGAACGTCGTAACTAAAGATCCTGCTCTGACGGGTGTTACAAGTGACGATATCGCTGGGATCGTTCGTGAGGACTCTTTTGTTCTCGGCCTCGAACCGATCAAGACTGTGAATACACTTCCTGACCCTAATGGTTATACGGGTTCTAGTGTTGTCCTTCTGACGACTGATGGCAAGACTTATAGGTATCACAATGGCGCTTGGACTGCTGAAGTCCCTGCTGTAGATATCTCCGGTCAGATCCAGAATAATCAGATCAATACTGTGAATGCTGCCAAACTGACGGGAACGATCAATGAAGCTCGTATCGCTGGTCTCGCTGCAAGCAAGATTACGGGTGAACTCACAAGTGACCAGATTGCTGACTTGGATGCTGCAAAGATCGCTGGACAACTCACGGATTCTCAACTTGCTGGTATTAGTGCTGGTAAACTTGTTGGCAATATCGTATCTAGCCAGATTGCTTCTATTGATTCAGCTAAACTGACGGGAACGATCAATGAAGCTCGTATTGCTGGCCTCGCTGCAAGCAAGATCACTGGCCAACTGACTGACGGTCAAATCGCCAGCGTAGCCACGGCTAAACTTACCGGGGAAATTGTAGCAAATCAGCTTGCTCAAGGTGCGACTCTGAAGGACCAACCTGTATTCACTATGGATCAGGACTCTCCTTATACGATCACACCAGCAAATGGTTCGGTTAGCTATGACTCGACGGATAAGTACTCTGGTACTCATGCTGCACTGATCACCTTCACGGATGCGTCAAACCCCAGTGGGGGTGGCAATACAGGAGCACCCTTTATCACGATCCCCGATCTGGTTGCTCTTCGCTTCGGCGGTAAGAGGATCCGTATTAGTGGTTATGCGAAAGCTCCTTCCACGAATGCAGCTTCTGAATTTGGTGTAGCGTACTCTACCTCTGACAATGGTAACTCTGGTTTCCAGAAGTTCACACCAACATCGTCTTGGAAGGAATTCTCTTTCACTTACGATGTACCAACCCCTGTTGCGGGCGGTAGTGACTACCTCGGGTTCTGGGCTGACACATCAAACTCTGGTAAAGGTACTCTGTTCGACCAGTGGTCTATTGAGATTATTGAGGATCTCGGCTTGGCGTCAGGTCAGATCACTGAGACTCAGATCTCGGATGATGCCATTTCTACACCTAAACTGAAGGCAAATGCAGTAACAGCGAGTATCATCGCTGCGAATGCTGTGGTCGCTGATAAGATCGCTGCGAATGCTGTGGTCGCTGATAAGATTGCTGCGAATGCAATTACTGCTGGTAAGATTGCTGCTAATGCGGTAACTGCAAGTGAGATTGCCGCTGGAGCCGTGACAGCTAGTGAGATTGCCGCTGGAGCTGTGGTTGCTGACAAGATCGCATCTAATGCTATTACAGCAGAGAAGATCGAAGCAGGAGCTATCACGGCGGCTAAGATTGCGGCTAACACAATCGGTGCAGGTCAGATTGCAGCTAATGCTATCACTGCAAGTGAGCTTGCATCAAACTCGATCCAGTCGGGGCACATCACCTCAAATGCTATCGTTGCAGCGAAGATTGCATCTAATGCTATCACATCTGTGAAGATCAATGCTGGTGCTGTAAATGCCGATAAGCTTGCTGCTAATGCTGTGACTGCTGGTAAGATCGATGCAGGAGCGGTAACTGCTGGGAAGATTGCATCCAACGCTGTAACTGCCAACAAGATCGCAGCTAACGCTATCACTGCTGGTAAGATCGATGCAGGAGCAGTAACGACTGCCAAACTTGCTGCGGGTTCTGTTGAAGCCTCGAAGATTGCTTCTGGTGCTGTGACTACTGCTAAATTGGCAGTGGGTAACGGCGGGAACATGATTGAGAACTCTAACTGGACTGCTGGTCTTTCTACCGTAGCCAACTATTCAAATGATAGTACGACCTTCAAGAATCAACACTCTTGGCGGATCCGTCCGGGTTCTGAAGGGTGGTCTGGGGGACATGGTGTTCTTGAGATTAGACAGGGAGGTACTGCTTCAGGGACTATGAACACTTACCTTCATAGGATGGGTGGAAGTAGCACCTACGGTTGGCCTTGTAAACCGGGTGCGAAGTACTCGGCCTCTGTGCAGATGTCTGTTCACCGTTGTACTGCGAGAGCGGTTGTTGTATTCCGTCGAGCTGATAACTCTTGGATCGATGCCTATGACATTGGGAGTAATAATGGTGCTCAAGGGAGTTCGGAGGTTATCGATGACTGGCCTATGGTTTCAAACATCGTAACAGCCCCTACTGCTGCACGTTACGCCCAGCTTATCATCTACAAGACTGGTACAAACAGTGGTTCGGATAGTTATGTGTTTGTTCACAAACCTATGCTTGCGGAAACCCATGCAGAAGCTACTGAAGCGACTCCTTATAGCCCTTCTGGTGCAACTCTGATCTCTGGTAATGAAATCATGACCGGAGCCATTACTGCTGAAAAGATTGCTGCGAACTCTATCTCGGCAGTCCAAATTGCAGCTAATACGATTGGTGTTTCTGAACTTTCTGCTAACGCGGTGACTTCGGATAAGATTGCGGCGAATGCTGTGTCTGCTGGTAAGATTGCCACTAATGCGATCTCGGCAGGGAAGATCCAAGCGGGTGCTGTGAGTGCTGACAAACTGGCTGCGAAATCGATTACGGCTTCAAAGCTTGCTGTTGGTGACTTCACTAACTTGAACCCTGATATGGACTTCGCTGACCCTGATGGGTGGACGGGTATCACTCGTCGTATCCCTACAGGTGTTGATTGGGGTGGTACAACCGGGGTTGAACTTGATGGTGCTTCTAACACACACAAAGTAGCGACTTCCAAGCATATCATTAACTTCGACCCTCTTGGTGAGAAGCTTCGGTTCGAGTACCGTGCAAGGAACCGCTTGGGGAATGCTGGTTATGTGTATGCAGATATCCAGATTTCTAAGAATCCTACGTTCACTGGCACTAACGGGACTGATTATACGTTCCGTAGTGTGGGTAACACTGGCAACAACTATAATGCTGTGGACTTCGCTGGGGATATTGACATCCCTGCTGGATTTATCTATGGTCGAATTCGTTTGATCAAAGGTAACAACGGTTCTACTCGTGCTCAGTTCGGTGTTCCTCGTCTCTACCGTAAGAACGCTGGTAAGTTGATCGTTGATGGCTCTATCAAAGCAAACCATGTTGGTGCCAACGAGATTATCGCTAATACGGCGAATATCAAGAATGGTGTCATCACGAATGCTAAGATTGCCAATGCGACTATCGAGAACGTTAAGATCAAAGATGGTACGATCGAGAATGTCAAGATCAAGAACTCAACTATTACGGGTTCCAAGATTGCTGGCTCTACGATTGCAGCGTCTAACATCAAGAACTCGACCATCACTGGTGGCAAGATCGCAAACGCAACGATCACGGGCGGGAATATCTCGACCAATACAATCGAAGCAACGCACATCAAAGCTAACACCATCACAGGTGACAAGATCAAAGCTAACACTATTTCGGCTGACAGGCTGAAGATTGGTGTTGGTGGCGGTAACTTGCTCCTGAACACGGACTTTAGCCAAGATGTTGTACACTGGTATCTAAACAAGTCTGGTAACATTGGTTCTAGTGGTCGTTACCATATCCGGCCTCCGGGTTCTTGGTCTGGTCGTGACTTCCCTGTTCTGGAAGTAGCTTCGAGCCGTGATACAACTTCGAGTGGTTATGTTGAGGCACAGCTGCGGGTTCAGAACCCTGATGGAAGCTGGCGTCGTGGTGTCCCTGTAACTGGTGGTAAGTGGTATCAAGCTTCGGCTCGTATCAACGCACTCCGGTCTAAACTCTTGATGGAAGTACGATGGTATGATGACTCTGGTAATCAGATTGATCAGGACTCTGTGTCTGATACGAACCCCTTCTCCTCTTCGAGTGCGGATCCGGGTTCTTGGCGCTTGTACAGCAAGAACTGGCAAGCTCCTTCTGGTGCTGAGTCTGCGGTCATCTGTTTCCGTTTGACTGAGACCACAAGTAACTCTGATGGTTACATCTTCGTCCACAATCCCCAACTAGTTGAAGTGGATGGCTCTGCGGTTCAGTATGTTCCGTATGGACCGGGTGGCACTACTACTATCAACGGTGGTTCTATCCGTACAGGGTCGATTACTGCTGGTGTGGGTATCTTCCAAAATGGTCTGAAGTCGAGCAACTTTAACGGTGCTATGACGTCCAGTGATATCACTAACTATGGTACTGCTGGTTGGGCTATTGCGAGTAATGGTGATGCAGTATTCAATAACCTTGTTGCCCGTTCGTGGGTTCAGGTTGGTGCTGTGTCGAAAGGTGCTTCTTACAGTGGTTACTCAAGTGCAGGTAAAGTTGATGGTGACGTTGTTACTCGTACAACTGGACCCTTCTCGCTTGGGGAATTCTGGCAGATTGCGGCTAGGATCGAGTATCGTACTCGTAAACGTACCTCGATCTACTATCAGGGCAAAGGTGGTTCCAGCTACAGTAGGTATCGTCACAGGACTCGTCCTTACCTCGAATATCGAGAGAAGAACGGTGGGACTTGGAGCGGCTGGACTGTACTTCACCAGTTCCCAGATAGCCCTACTAACGATTCTTGGACGACACAGGAAGTTGTGAAGTCTAAGATGGACAGTAACCAAGATACTCAGATTCGTATCCGTGTCCATGTCTACGCCCAAAATGCGGGGGATAGTAGCAATGGCTGGAACGACGATTGGAAGAACGTCCGTAACGTAACACTCTATTCGCGAGCACTTGTTCGCTAA

Tertiary structure

PDB ID
b5cd9a8d8b9a45bf72599b113337f5fb554ea0e5cfdf35433dd0f3036ad37a48
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5207
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50