UniProt accession
A0A7S5KPF4 [UniProt]
Protein name
Host specificity protein J
RBP type
TF
Evidence RBPdetect2
Probability 0,57
Protein sequence
MIFPFLAAIGAFLAANAVAIAFTFASMLYQRRRQKKLAAELDKQKGFDLVVDGEPINLPLTYGAQKIAGVRTIHKTFNNVKQRKNPANSGWVQFNYPLSSWPLDTDKDHSSSKNQYLLTQQALCFGGIDEFIDIEVNSQSWDKGKFSHMLEAHLDGGVDNISATASGIADTNKFTNAAWINAIFWLNRNDYNYQGVPNISAYVKGQRIWSLKENNGVISLDTKAYSNNNSYVLMDYLLRPRELGGVGLGNLNAQQWLAGDQPDLSRINLGSFYNAAQICDTTVETITGTARGRVNGVPPVDRRVKELSDRGNGKENGELVYVEDIKQIFEWSGGAWAELLADRTVKLYECNITIDTSRDFRDNIELLLETMGESEMTFSEGKYKLLLDYPENEVEQDQLIAMEIDDSYIVSEDVTVSYPGSADRLNRVTVKFKNEEHDFVMDSVSWPQWGDANHQKLMSEDNQVPSEQEIFFPGCSIRHLALAKAENMVRQSRIYVGDEIENPGSGHSLNQQIVSFTLDRRGIVLETGDLIKLNSEAAGISNRVFRIETLKYTNRMNVELTASQFNYTNLAYSSKDSVIPDPRTVYDNSVANVRNLAYNQGIRNGSPIDSNGYLNWNHPLDEEVRQYIISTSTNNVDWEQLGTTRRRFFDIPAEYDDGADRFFNVRVESTARIMNDGVTVFVNNLQTVAPISSFFGESRTNGANLNWSNPAADITRRYEVYWSKSATKPSTPNQVTRETYLEVTGLDGDTDYRFWVDAVGYSGTRGDMLTPIVVRPTSSEVDPDDVFGDPADPTNLQLSSTLDDDNGKANFSVSWTNPADMGYVAGFRVKITDVNAGETRIFDAPASPFERDYPRGVLLEATVESYNGAAKGGGYLTPQQHTTAADSVPPAVPQNLSGTGGFNTVWLEWSKVGDTDLAYYEVVKRTVGASAPGVNPSNVKQATDNSYAYLGLPDNHNRDYYVRAVDTSGNKSAWSTKVNVVTKDPALTGVTSDDIAGIVREDSFVLGLEPIKTVNTLPDPNGYTGSSVVLLTTDGKTYRYHNGAWTAEVPAVDISGQIQNNQINTVNAAKLTGTINEARIAGLAASKITGELTSDQIADLDAAKIAGQLTDSQLAGISAGKLVGNIVSSQIASIDSAKLTGTINEARIAGLAASKITGQLTDGQIASVATAKLTGEIVANQLAQGATLKDQPVFTMDQDSPYTITPANGSVSYDSTDKYSGTHAALITFTDASNPSGGGNTGAPFITIPDLVALRFGGKRIRISGYAKAPSTNAASEFGVAYSTSDNGNSGFQKFTPTSSWKEFSFTYDVPTPVAGGSDYLGFWADTSNSGKGTLFDQWSIEIIEDLGLASGQITETQISDDAISTPKLKANAVTASIIAANAVVADKIAANAVVADKIAANAITAGKIAANAVTASEIAAGAVTASEIAAGAVVADKIASNAITAEKIEAGAITAAKIAANTIGAGQIAANAITASELASNSIQSGHITSNAIVAAKIASNAITSVKINAGAVNADKLAANAVTAGKIDAGAVTAGKIASNAVTANKIAANAITAGKIDAGAVTTAKLAAGSVEASKIASGAVTTAKLAVGNGGNMIENSNWTAGLSTVANYSNDSTTFKNQHSWRIRPGSEGWSGGHGVLEIRQGGTASGTMNTYLHRMGGSSTYGWPCKPGAKYSASVQMSVHRCTARAVVVFRRADNSWIDAYDIGSNNGAQGSSEVIDDWPMVSNIVTAPTAARYAQLIIYKTGTNSGSDSYVFVHKPMLAETHAEATEATPYSPSGATLISGNEIMTGAITAEKIAANSISAVQIAANTIGVSELSANAVTSDKIAANAVSAGKIATNAISAGKIQAGAVSADKLAAKSITASKLAVGDFTNLNPDMDFADPDGWTGITRRIPTGVDWGGTTGVELDGASNTHKVATSKHIINFDPLGEKLRFEYRARNRLGNAGYVYADIQISKNPTFTGTNGTDYTFRSVGNTGNNYNAVDFAGDIDIPAGFIYGRIRLIKGNNGSTRAQFGVPRLYRKNAGKLIVDGSIKANHVGANEIIANTANIKNGVITNAKIANATIENVKIKDGTIENVKIKNSTITGSKIAGSTIAASNIKNSTITGGKIANATITGGNISTNTIEATHIKANTITGDKIKANTISADRLKIGVGGGNLLLNTDFSQDVVHWYLNKSGNIGSSGRYHIRPPGSWSGRDFPVLEVASSRDTTSSGYVEAQLRVQNPDGSWRRGVPVTGGKWYQASARINALRSKLLMEVRWYDDSGNQIDQDSVSDTNPFSSSSADPGSWRLYSKNWQAPSGAESAVICFRLTETTSNSDGYIFVHNPQLVEVDGSAVQYVPYGPGGTTTINGGSIRTGSITAGVGIFQNGLKSSNFNGAMTSSDITNYGTAGWAIASNGDAVFNNLVARSWVQVGAVSKGASYSGYSSAGKVDGDVVTRTTGPFSLGEFWQIAARIEYRTRKRTSIYYQGKGGSSYSRYRHRTRPYLEYREKNGGTWSGWTVLHQFPDSPTNDSWTTQEVVKSKMDSNQDTQIRIRVHVYAQNAGDSSNGWNDDWKNVRNVTLYSRALVR
Physico‐chemical
properties
protein length:2575 AA
molecular weight: 275207,24610 Da
isoelectric point:5,73917
aromaticity:0,08078
hydropathy:-0,29359

Domains

Domains [InterPro]
IPR003961
STR
687–763
IPR003961
STR
687–780
IPR036116
STR
697–839
IPR003961
STR
699–760
IPR003961
STR
700–775
A0A7S5KPF4
1 2575
Architecture
STR
ATT
STR
RBD
STR 1-2010 | ATT 2011-2115 | STR 2116-2343 | RBD 2344-2573 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Bacteriophage DSS3_VP1
[NCBI]
2664196 Uroviricota > Caudoviricetes > Naomviridae > Noahvirus arc >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QGH74587.1 [NCBI]
Genbank nucleotide accession
MN602266 [NCBI]
CDS location
range 8647 -> 16374
strand +
CDS
ATGATCTTTCCTTTCCTCGCAGCGATTGGGGCGTTCCTTGCAGCTAATGCTGTGGCGATCGCCTTTACCTTCGCTAGTATGCTCTATCAACGTCGGCGTCAAAAGAAGCTGGCAGCAGAGCTTGATAAACAAAAGGGCTTCGATCTCGTCGTTGACGGGGAGCCTATCAACCTTCCTCTTACTTATGGTGCTCAGAAAATCGCTGGTGTGCGGACTATCCATAAGACATTCAACAATGTGAAACAACGTAAGAATCCCGCTAACTCTGGCTGGGTACAGTTTAACTATCCTTTGAGTAGCTGGCCTTTGGACACTGACAAAGACCACTCTTCCAGCAAGAACCAGTATCTCTTGACTCAACAAGCCCTCTGTTTTGGTGGTATTGATGAATTCATCGATATTGAGGTCAACAGCCAAAGCTGGGACAAAGGTAAGTTCAGTCACATGCTCGAAGCACACCTTGACGGTGGTGTAGATAACATCTCTGCAACTGCTTCTGGTATTGCTGATACAAACAAGTTTACGAATGCAGCTTGGATCAATGCGATCTTCTGGCTGAACCGTAACGATTACAACTACCAAGGTGTCCCTAATATCTCGGCCTATGTTAAAGGTCAGCGTATTTGGTCCTTGAAAGAGAACAATGGTGTTATCTCGCTCGACACCAAAGCTTACTCCAACAACAACTCGTATGTTCTGATGGACTACCTCCTGAGACCCCGTGAACTCGGTGGTGTGGGTCTTGGTAATCTGAATGCACAACAGTGGTTGGCTGGTGATCAGCCTGATCTGTCTCGTATCAACCTTGGATCGTTCTATAATGCTGCTCAAATCTGTGATACTACTGTTGAGACTATCACTGGTACTGCCCGTGGTCGTGTTAATGGTGTTCCTCCGGTTGACCGCCGTGTGAAAGAACTCTCTGATCGCGGTAACGGTAAAGAGAACGGTGAATTGGTTTATGTTGAAGACATTAAACAGATCTTCGAATGGTCTGGTGGTGCTTGGGCAGAACTCCTTGCTGACCGTACTGTGAAGCTCTATGAGTGTAACATTACTATCGACACTTCTCGTGACTTCCGTGACAACATCGAACTTCTCCTTGAAACTATGGGTGAGTCTGAAATGACTTTCTCGGAAGGTAAGTATAAGCTTCTGCTTGACTACCCTGAGAATGAGGTCGAACAAGACCAACTCATCGCTATGGAGATCGATGATAGTTACATCGTTTCTGAAGATGTGACCGTTTCCTATCCGGGTTCGGCAGATCGTCTCAATCGTGTGACTGTAAAGTTCAAGAACGAAGAGCATGACTTTGTGATGGACTCTGTTAGCTGGCCTCAGTGGGGTGATGCTAACCATCAGAAACTTATGTCGGAAGATAATCAGGTTCCTTCTGAACAGGAAATCTTCTTTCCGGGTTGTTCTATTCGTCATTTGGCTCTTGCCAAGGCTGAGAACATGGTTCGCCAGTCGCGTATCTATGTCGGTGATGAGATCGAGAACCCCGGTTCTGGTCATTCTTTGAACCAACAGATCGTGAGCTTTACACTTGATCGTCGTGGTATCGTTCTTGAAACAGGTGACTTGATCAAGCTCAATAGTGAAGCTGCTGGAATCTCTAACCGGGTGTTCCGTATCGAGACCTTGAAGTACACCAATCGTATGAACGTGGAGCTTACTGCTTCTCAATTCAACTACACGAACTTGGCTTACTCTTCAAAGGACTCGGTGATCCCGGATCCTCGTACTGTCTATGACAACTCGGTTGCCAACGTTCGTAACTTGGCTTATAACCAAGGGATCCGTAACGGTTCTCCTATTGACAGCAACGGCTATCTGAACTGGAACCATCCTCTGGATGAAGAAGTTCGCCAATACATCATCAGCACCAGTACCAACAATGTTGATTGGGAACAACTTGGAACTACTCGTCGTAGGTTCTTTGACATCCCTGCTGAGTATGATGATGGTGCAGATCGTTTCTTCAATGTTCGCGTTGAGAGTACTGCTCGTATCATGAACGATGGTGTTACCGTCTTTGTGAACAACCTCCAAACTGTTGCTCCGATTAGCAGCTTCTTTGGCGAGTCTCGTACTAATGGTGCTAACCTGAACTGGTCTAACCCGGCTGCGGACATTACTCGTCGTTATGAAGTCTACTGGTCTAAGTCGGCTACTAAACCTAGCACTCCTAACCAAGTCACACGGGAAACCTATCTTGAGGTGACTGGTCTTGACGGTGACACTGATTACCGTTTCTGGGTGGATGCTGTAGGTTATAGTGGTACTCGTGGTGACATGCTCACCCCGATCGTTGTCCGTCCTACTTCTTCTGAAGTGGACCCTGATGATGTCTTCGGTGATCCGGCTGACCCTACAAACCTTCAGTTGTCGTCCACTCTAGACGATGATAACGGTAAGGCTAACTTCTCTGTATCTTGGACTAACCCTGCTGATATGGGTTATGTTGCTGGTTTCCGTGTGAAGATCACTGATGTGAATGCTGGTGAGACTCGTATCTTTGATGCTCCTGCTTCTCCCTTTGAGCGTGACTATCCTCGCGGAGTCTTGCTAGAGGCTACCGTAGAGAGCTACAACGGGGCTGCTAAAGGGGGTGGGTATCTAACTCCTCAACAGCACACCACAGCGGCAGACTCTGTACCTCCTGCGGTACCTCAGAACCTCAGTGGTACTGGTGGTTTCAATACCGTCTGGTTGGAGTGGAGTAAAGTTGGTGACACTGACCTCGCTTACTATGAGGTTGTTAAACGGACTGTGGGCGCTTCTGCTCCGGGTGTAAATCCGTCAAACGTCAAACAAGCAACTGACAACAGCTATGCTTATCTTGGGCTTCCTGATAATCACAACCGTGACTACTACGTCCGTGCTGTGGACACTTCGGGTAACAAGTCTGCATGGTCTACTAAAGTGAACGTCGTAACTAAAGATCCTGCTCTGACGGGTGTTACAAGTGACGATATCGCTGGGATCGTTCGTGAGGACTCTTTTGTTCTCGGCCTCGAACCGATCAAGACTGTGAATACACTTCCTGACCCTAATGGTTATACGGGTTCTAGTGTTGTCCTTCTGACGACTGATGGCAAGACTTATAGGTATCACAATGGCGCTTGGACTGCTGAAGTCCCTGCTGTAGATATCTCCGGTCAGATCCAGAATAATCAGATCAATACTGTGAATGCTGCCAAACTGACGGGAACGATCAATGAAGCTCGTATCGCTGGTCTCGCTGCAAGCAAGATTACGGGTGAACTCACAAGTGACCAGATTGCTGACTTGGATGCTGCAAAGATCGCTGGACAACTCACGGATTCTCAACTTGCTGGTATTAGTGCTGGTAAACTTGTTGGCAATATCGTATCTAGCCAGATTGCTTCTATTGATTCAGCTAAACTGACGGGAACGATCAATGAAGCTCGTATTGCTGGCCTCGCTGCAAGCAAGATCACTGGCCAACTGACTGACGGTCAAATCGCCAGCGTAGCCACGGCTAAACTTACCGGGGAAATTGTAGCAAATCAGCTTGCTCAAGGTGCGACTCTGAAGGACCAACCTGTATTCACTATGGATCAGGACTCTCCTTATACGATCACACCAGCAAATGGTTCGGTTAGCTATGACTCGACGGATAAGTACTCTGGTACTCATGCTGCACTGATCACCTTCACGGATGCGTCAAACCCCAGTGGGGGTGGCAATACAGGAGCACCCTTTATCACGATCCCCGATCTGGTTGCTCTTCGCTTCGGCGGTAAGAGGATCCGTATTAGTGGTTATGCGAAAGCTCCTTCCACGAATGCAGCTTCTGAATTTGGTGTAGCGTACTCTACCTCTGACAATGGTAACTCTGGTTTCCAGAAGTTCACACCAACATCGTCTTGGAAGGAATTCTCTTTCACTTACGATGTACCAACCCCTGTTGCGGGCGGTAGTGACTACCTCGGGTTCTGGGCTGACACATCAAACTCTGGTAAAGGTACTCTGTTCGACCAGTGGTCTATTGAGATTATTGAGGATCTCGGCTTGGCGTCAGGTCAGATCACTGAGACTCAGATCTCGGATGATGCCATTTCTACACCTAAACTGAAGGCAAATGCAGTAACAGCGAGTATCATCGCTGCGAATGCTGTGGTCGCTGATAAGATCGCTGCGAATGCTGTGGTCGCTGATAAGATTGCTGCGAATGCAATTACTGCTGGTAAGATTGCTGCTAATGCGGTAACTGCAAGTGAGATTGCCGCTGGAGCCGTGACAGCTAGTGAGATTGCCGCTGGAGCTGTGGTTGCTGACAAGATCGCATCTAATGCTATTACAGCAGAGAAGATCGAAGCAGGAGCTATCACGGCGGCTAAGATTGCGGCTAACACAATCGGTGCAGGTCAGATTGCAGCTAATGCTATCACTGCAAGTGAGCTTGCATCAAACTCGATCCAGTCGGGGCACATCACCTCAAATGCTATCGTTGCAGCGAAGATTGCATCTAATGCTATCACATCTGTGAAGATCAATGCTGGTGCTGTAAATGCCGATAAGCTTGCTGCTAATGCTGTGACTGCTGGTAAGATCGATGCAGGAGCGGTAACTGCTGGGAAGATTGCATCCAACGCTGTAACTGCCAACAAGATCGCAGCTAACGCTATCACTGCTGGTAAGATCGATGCAGGAGCAGTAACGACTGCCAAACTTGCTGCGGGTTCTGTTGAAGCCTCGAAGATTGCTTCTGGTGCTGTGACTACTGCTAAATTGGCAGTGGGTAACGGCGGGAACATGATTGAGAACTCTAACTGGACTGCTGGTCTTTCTACCGTAGCCAACTATTCAAATGATAGTACGACCTTCAAGAATCAACACTCTTGGCGGATCCGTCCGGGTTCTGAAGGGTGGTCTGGGGGACATGGTGTTCTTGAGATTAGACAGGGAGGTACTGCTTCAGGGACTATGAACACTTACCTTCATAGGATGGGTGGAAGTAGCACCTACGGTTGGCCTTGTAAACCGGGTGCGAAGTACTCGGCCTCTGTGCAGATGTCTGTTCACCGTTGTACTGCGAGAGCGGTTGTTGTATTCCGTCGAGCTGATAACTCTTGGATCGATGCCTATGACATTGGGAGTAATAATGGTGCTCAAGGGAGTTCGGAGGTTATCGATGACTGGCCTATGGTTTCAAACATCGTAACAGCCCCTACTGCTGCACGTTACGCCCAGCTTATCATCTACAAGACTGGTACAAACAGTGGTTCGGATAGTTATGTGTTTGTTCACAAACCTATGCTTGCGGAAACCCATGCAGAAGCTACTGAAGCGACTCCTTATAGCCCTTCTGGTGCAACTCTGATCTCTGGTAATGAAATCATGACCGGAGCCATTACTGCTGAAAAGATTGCTGCGAACTCTATCTCGGCAGTCCAAATTGCAGCTAATACGATTGGTGTTTCTGAACTTTCTGCTAACGCGGTGACTTCGGATAAGATTGCGGCGAATGCTGTGTCTGCTGGTAAGATTGCCACTAATGCGATCTCGGCAGGGAAGATCCAAGCGGGTGCTGTGAGTGCTGACAAACTGGCTGCGAAATCGATTACGGCTTCAAAGCTTGCTGTTGGTGACTTCACTAACTTGAACCCTGATATGGACTTCGCTGACCCTGATGGGTGGACGGGTATCACTCGTCGTATCCCTACAGGTGTTGATTGGGGTGGTACAACCGGGGTTGAACTTGATGGTGCTTCTAACACACACAAAGTAGCGACTTCCAAGCATATCATTAACTTCGACCCTCTTGGTGAGAAGCTTCGGTTCGAGTACCGTGCAAGGAACCGCTTGGGGAATGCTGGTTATGTGTATGCAGATATCCAGATTTCTAAGAATCCTACGTTCACTGGCACTAACGGGACTGATTATACGTTCCGTAGTGTGGGTAACACTGGCAACAACTATAATGCTGTGGACTTCGCTGGGGATATTGACATCCCTGCTGGATTTATCTATGGTCGAATTCGTTTGATCAAAGGTAACAACGGTTCTACTCGTGCTCAGTTCGGTGTTCCTCGTCTCTACCGTAAGAACGCTGGTAAGTTGATCGTTGATGGCTCTATCAAAGCAAACCATGTTGGTGCCAACGAGATTATCGCTAATACGGCGAATATCAAGAATGGTGTCATCACGAATGCTAAGATTGCCAATGCGACTATCGAGAACGTTAAGATCAAAGATGGTACGATCGAGAATGTCAAGATCAAGAACTCAACTATTACGGGTTCCAAGATTGCTGGCTCTACGATTGCAGCGTCTAACATCAAGAACTCGACCATCACTGGTGGCAAGATCGCAAACGCAACGATCACGGGCGGGAATATCTCGACCAATACAATCGAAGCAACGCACATCAAAGCTAACACCATCACAGGTGACAAGATCAAAGCTAACACTATTTCGGCTGACAGGCTGAAGATTGGTGTTGGTGGCGGTAACTTGCTCCTGAACACGGACTTTAGCCAAGATGTTGTACACTGGTATCTAAACAAGTCTGGTAACATTGGTTCTAGTGGTCGTTACCATATCCGGCCTCCGGGTTCTTGGTCTGGTCGTGACTTCCCTGTTCTGGAAGTAGCTTCGAGCCGTGATACAACTTCGAGTGGTTATGTTGAGGCACAGCTGCGGGTTCAGAACCCTGATGGAAGCTGGCGTCGTGGTGTCCCTGTAACTGGTGGTAAGTGGTATCAAGCTTCGGCTCGTATCAACGCACTCCGGTCTAAACTCTTGATGGAAGTACGATGGTATGATGACTCTGGTAATCAGATTGATCAGGACTCTGTGTCTGATACGAACCCCTTCTCCTCTTCGAGTGCGGATCCGGGTTCTTGGCGCTTGTACAGCAAGAACTGGCAAGCTCCTTCTGGTGCTGAGTCTGCGGTCATCTGTTTCCGTTTGACTGAGACCACAAGTAACTCTGATGGTTACATCTTCGTCCACAATCCCCAACTAGTTGAAGTGGATGGCTCTGCGGTTCAGTATGTTCCGTATGGACCGGGTGGCACTACTACTATCAACGGTGGTTCTATCCGTACAGGGTCGATTACTGCTGGTGTGGGTATCTTCCAAAATGGTCTGAAGTCGAGCAACTTTAACGGTGCTATGACGTCCAGTGATATCACTAACTATGGTACTGCTGGTTGGGCTATTGCGAGTAATGGTGATGCAGTATTCAATAACCTTGTTGCCCGTTCGTGGGTTCAGGTTGGTGCTGTGTCGAAAGGTGCTTCTTACAGTGGTTACTCAAGTGCAGGTAAAGTTGATGGTGACGTTGTTACTCGTACAACTGGACCCTTCTCGCTTGGGGAATTCTGGCAGATTGCGGCTAGGATCGAGTATCGTACTCGTAAACGTACCTCGATCTACTATCAGGGCAAAGGTGGTTCCAGCTACAGTAGGTATCGTCACAGGACTCGTCCTTACCTCGAATATCGAGAGAAGAACGGTGGGACTTGGAGCGGCTGGACTGTACTTCACCAGTTCCCAGATAGCCCTACTAACGATTCTTGGACGACACAGGAAGTTGTGAAGTCTAAGATGGACAGTAACCAAGATACTCAGATTCGTATCCGTGTCCATGTCTACGCCCAAAATGCGGGGGATAGTAGCAATGGCTGGAACGACGATTGGAAGAACGTCCGTAACGTAACACTCTATTCGCGAGCACTTGTTCGCTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
b5cd9a8d8b9a45bf72599b113337f5fb554ea0e5cfdf35433dd0f3036ad37a48
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5207
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50