Protein
View in Explore- Genbank accession
- AJA73002.1 [GenBank]
- Protein name
- host specificity protein J
- RBP type
-
TF
- Protein sequence
-
MGLFSRKRKNHTPKEAPETGRSKQIVNIVELLCEGEIEGLVDGFKSIYLDGTQIQNDDGSYNFNNVSGQLNVGTQDQNVLDGYDSSQNEVSVGVEVKKKSGAIVRTVTDERISRLRLTLGVRSLFHQNNQGDTNTTNVDLKITIGTRQYSHSFNGKYSSQYLESVVFDNLPPVPFNISVERVTKDSNSQRLQNGTIWSSYTEIIDTEFTYPNSAVAGISFDSEYFNNIPTRNYLIKAKKVKVPSNYDPVKRTYTGFWDGTFKIAWTNNPAWEIYDLAPILSKMLGVEISFDKWALYDVARYCDQLVPDGMGGMEPRFTCNVWLTEVKTAYDLLNDFCSVFRAIPIWTGTEVSVIIDRPRDPVWTYTNANVVGGFERSYSARKSRHNAVQVTYSDKTNGYESAIEYVSDDEEIKKHGLNLSQVTAFGCTSRGQAYRTGKWILETEKREKETITFTVGREGLMHLPGDIIRVADSHYAGTEIGGRVLAINGRKVTLDREISIDNASYFTYINGEATHSSIKIQSVNGKEITLDSNPTGLEVYGVWSLSTQQITSGLYRSISIVENADGTNTITALQHEPQKEAIVDNAAHFVETARTLYKAPQINAVEVSTGYDGKLYISSDISSGDGKLTYDIKITKDGNLYQFKKGLADPNIELSDLPNGDYSVIIYGKNAKGQIVTEKTQTFTIDRPPAPTGVVVTGGLGQITLEWDWVNEVTQTEIFAAETDNFALAKKIAKVTARTYAHTVRGNKVVRYYWLRHTRGINVGPFYQQQGVRGESAVDLDARLTELNTQLSRNIVDEIFDVAAPARGLELVKTVANLNDKRTKLASSQVYNQADGKLYTWNGTAYSATVAAEDVTGKLSKSKIDTSLISQLTGADNTANLARRLAETAQSNINQEITNRQDAVTAEANNRTKAIQAESANLTKKIQAEATARGAAVTQLQNVDAQQSQLISAVTAKADNALSGLEAEKTARANADKAESQAREALTARMSDAESNIATIQRTVATNAQSISEVSQNLNAKIDNINIGGRNLLRDSEFNAYNKWGNPQIDFTENANRRTIKVTSTGTNGPVGIVSSNRHSTSYFQQGETYTLSLFARGSKALDYLYLMRQDGNNVRLPVINVASETEFNHYKLTFKAPFTTQQGYVLIGFRQTSTEQFVEFHSVKLEKGNVATDWTPAPEDVDSAVSAVSADLTSYKQTQAATDSAQAQQLNQLSVNLTKAETNFNAKITEEKKARVDADKANAERLTDITSRVANAESTITNFQSTKANKSEVASLAQSSLQAVWKADTQSAIGELAVGGRNLLLKSNATNLINFVRSSQDVLDNTDFKTPVVRINCIQDSWFGRKTAITSGKLLAGKYTLSFKYRTNATINNTFIGYGGNQRRRLITSNVVGNETWQTCKLTFETTEDYPDIFIIIGGYGKADVSYIEFAELKLEKGAIATDWTPAPEDVESSVSAVSAKVDSVQQTLANADSALSSRIDTVNASVGSNSSKITQVSNAVASVDGKLSATHTIKTETIAGGRKAIAGIAFGATADNRNAESSVIVMADKFEVVKNAQDGTPVRLFGVVENKVAINGNLIATGSISGDHINANSVRTAVLTAGAIKTEHLAAGQISADKLAIGLGGNLLVNPIFATPDLSIAPFGWNYWRGEVGDRLNIDTRNIFNRNEQDNYGLKNGGLPNELVFSMRYSTTEETSDTGRIGWLSQDINVVPNKKYIASVWLACHRGQAKLVIENIEKPGGAYLGWIGDSEVITGYSANQGEFKNMKRVKVVFTAPTSGCIRFALRLDNIQGKANPFLFARRPMLEEASDNVTDITQPSPWQNAGVTAIHGGSIATNTVTAQQIAANTITANQIAVGTIAARNMAVDSIEARHIVGSSITADKLNVNNLAAISANLGAITAGSININNRFKVSNAGVVEMRANSGNVGMVMNNDSIIVYDEQGRVRVKMGKL
- Physico‐chemical
properties -
protein length: 1954 AA molecular weight: 213272,75760 Da isoelectric point: 6,34064 aromaticity: 0,07574 hydropathy: -0,34806
Taxonomy
Coding sequence (CDS)
Genbank protein accession
AJA73002.1
[NCBI]
Genbank nucleotide accession
KP137435
[NCBI]
CDS location
range 17474 -> 23338
strand +
strand +
CDS
ATGGGATTATTTAGTCGTAAGAGAAAAAATCATACTCCTAAAGAAGCACCGGAAACCGGTCGCTCTAAACAGATTGTAAATATTGTGGAATTGCTGTGCGAGGGCGAAATCGAGGGCTTGGTTGATGGCTTTAAATCGATTTACTTAGACGGCACGCAGATCCAAAACGATGACGGCAGCTATAACTTTAATAATGTGAGTGGTCAGTTAAATGTCGGTACGCAAGACCAAAATGTGTTAGACGGTTACGACAGCTCACAAAATGAAGTGAGTGTGGGTGTAGAAGTCAAGAAAAAAAGCGGTGCAATCGTCCGCACCGTTACTGATGAACGCATCAGCCGTTTGCGTTTAACGTTGGGCGTGCGGTCACTATTCCATCAAAATAATCAAGGCGATACCAATACCACCAATGTTGATTTAAAAATCACGATTGGCACACGGCAATATTCGCATAGCTTTAACGGCAAATACAGCTCGCAATACCTTGAATCTGTGGTGTTTGATAACCTGCCTCCTGTACCGTTTAATATCTCGGTTGAACGTGTAACAAAGGATAGCAATTCTCAACGACTACAAAACGGTACAATTTGGAGCAGCTATACCGAAATTATCGACACCGAATTTACTTACCCTAATTCAGCGGTTGCCGGTATCAGTTTTGATTCGGAGTATTTTAATAATATCCCGACCCGAAACTACCTAATTAAAGCGAAAAAAGTCAAAGTGCCAAGCAATTATGATCCAGTTAAACGCACTTACACCGGCTTTTGGGACGGCACATTTAAAATTGCGTGGACGAACAACCCTGCTTGGGAAATTTACGATTTAGCTCCGATTTTAAGCAAAATGCTTGGGGTTGAAATCAGTTTTGACAAATGGGCGTTGTATGATGTTGCTCGCTATTGCGATCAACTTGTGCCGGACGGTATGGGTGGAATGGAGCCTCGTTTCACCTGTAACGTATGGCTCACGGAAGTTAAAACTGCCTATGACTTGTTGAATGATTTCTGCTCGGTATTCCGTGCGATTCCGATTTGGACCGGAACAGAAGTATCGGTCATTATCGACCGTCCGCGTGATCCGGTTTGGACTTACACAAATGCTAATGTAGTTGGTGGATTTGAACGATCCTACTCTGCTCGCAAATCACGCCATAATGCAGTGCAAGTTACTTATTCGGATAAAACAAATGGCTATGAAAGTGCGATTGAATATGTCTCTGATGACGAGGAAATCAAAAAGCACGGCTTAAATTTAAGCCAAGTAACTGCCTTTGGCTGTACATCTCGTGGGCAAGCATACCGTACCGGCAAATGGATTTTAGAAACCGAAAAACGTGAAAAAGAAACCATCACTTTTACCGTGGGGCGTGAAGGCTTAATGCACTTGCCGGGCGATATTATTCGTGTGGCAGACAGCCATTATGCCGGTACGGAAATTGGCGGACGTGTACTGGCGATTAATGGGCGAAAAGTCACGTTAGATCGTGAAATTAGCATTGATAACGCCAGTTATTTTACCTATATCAACGGTGAGGCAACGCACTCTAGCATTAAAATCCAATCGGTAAACGGTAAAGAAATCACGCTAGACAGTAATCCAACAGGACTAGAAGTTTATGGGGTGTGGTCGTTATCTACCCAACAAATTACCTCAGGTTTATATCGCTCTATCTCGATTGTTGAAAATGCGGACGGTACGAATACGATTACGGCATTGCAACACGAACCGCAGAAAGAGGCGATTGTAGATAACGCTGCTCACTTTGTGGAAACGGCGAGAACGCTTTACAAAGCCCCGCAAATTAACGCAGTAGAAGTCTCGACTGGTTATGACGGCAAGCTCTATATCTCCAGTGATATTAGTTCTGGCGACGGCAAGCTGACCTATGATATTAAAATCACCAAAGATGGCAATTTGTATCAATTCAAGAAAGGATTAGCCGACCCAAATATTGAGTTGAGCGATTTACCGAATGGCGATTACAGCGTGATTATTTACGGTAAAAATGCCAAAGGGCAAATCGTCACCGAAAAAACACAAACCTTTACTATTGATCGACCTCCAGCTCCGACCGGTGTAGTAGTAACAGGTGGATTAGGGCAAATTACCCTCGAATGGGATTGGGTAAATGAGGTTACGCAAACCGAGATTTTCGCAGCGGAAACTGATAATTTCGCCCTTGCAAAAAAAATCGCAAAAGTGACCGCTAGAACCTACGCTCACACGGTAAGAGGTAATAAGGTTGTACGCTATTATTGGCTACGTCATACCAGAGGGATTAATGTCGGCCCGTTTTACCAACAACAGGGGGTAAGAGGCGAAAGTGCGGTTGATTTGGATGCTCGATTAACCGAATTAAACACTCAGCTATCACGCAATATTGTTGATGAGATTTTTGATGTTGCTGCACCGGCACGAGGTTTAGAGCTGGTCAAAACTGTGGCAAACTTGAACGATAAGCGGACGAAACTGGCGTCATCTCAAGTTTACAATCAGGCTGACGGCAAGCTCTATACTTGGAACGGTACAGCATACTCAGCTACAGTGGCTGCGGAAGATGTTACCGGCAAATTATCAAAATCTAAAATTGATACGTCCCTTATTTCGCAATTAACAGGTGCAGATAACACCGCAAATTTGGCAAGAAGATTAGCGGAAACAGCTCAAAGCAACATTAACCAAGAGATTACTAACCGACAAGATGCCGTTACTGCCGAAGCAAATAACCGTACTAAAGCCATTCAAGCTGAAAGTGCGAATTTAACGAAAAAAATTCAAGCTGAAGCAACCGCTCGTGGGGCTGCTGTTACACAGTTACAAAATGTTGATGCTCAACAATCACAACTGATTTCTGCTGTCACAGCAAAAGCTGATAATGCCTTATCCGGTTTGGAAGCAGAAAAAACAGCTCGAGCAAATGCTGATAAAGCTGAATCACAAGCCCGTGAAGCATTAACAGCAAGAATGAGTGATGCGGAAAGCAATATTGCAACTATTCAACGTACGGTAGCAACTAATGCCCAAAGCATTAGTGAAGTCAGTCAGAATTTAAATGCTAAGATTGATAATATTAATATCGGAGGTCGGAATTTATTAAGAGACAGCGAGTTCAATGCGTACAATAAATGGGGTAATCCACAGATTGATTTTACAGAAAATGCAAATCGTCGAACTATCAAAGTAACCTCAACAGGTACTAACGGTCCTGTTGGTATTGTTTCATCTAATCGCCATTCCACATCTTATTTCCAACAAGGAGAAACTTATACACTCTCATTATTTGCTCGAGGAAGTAAGGCACTAGACTATCTCTATCTAATGCGTCAAGATGGGAATAACGTTAGATTACCAGTGATTAACGTTGCCTCTGAAACTGAGTTTAATCATTACAAACTCACGTTCAAGGCTCCTTTTACCACGCAACAAGGTTATGTCTTAATCGGTTTTCGGCAAACCAGCACAGAGCAGTTTGTTGAGTTTCACAGCGTCAAACTTGAAAAAGGCAACGTAGCCACAGACTGGACGCCAGCACCTGAAGATGTGGACAGTGCGGTTAGTGCTGTTTCGGCTGATTTAACGAGTTATAAACAAACTCAAGCGGCTACCGATTCAGCACAAGCACAGCAACTTAATCAGTTATCTGTGAACTTGACCAAAGCAGAGACTAATTTCAACGCCAAAATCACGGAAGAAAAAAAAGCTCGTGTTGATGCAGATAAAGCGAATGCAGAGAGGCTCACAGACATAACAAGCCGTGTTGCAAATGCGGAATCAACTATTACCAATTTCCAATCAACCAAAGCGAATAAAAGTGAGGTTGCGAGCCTTGCACAAAGTTCGTTGCAGGCAGTTTGGAAGGCAGATACACAATCAGCGATTGGCGAGTTGGCTGTCGGTGGAAGAAATTTATTATTAAAATCCAACGCAACAAACTTAATCAATTTTGTCAGATCATCTCAAGATGTATTAGATAACACTGATTTCAAAACTCCAGTAGTACGAATCAACTGTATACAAGATAGTTGGTTTGGTCGAAAAACAGCGATTACATCGGGAAAATTGCTTGCTGGTAAATACACTCTATCGTTTAAGTATCGCACCAACGCTACAATTAATAATACTTTTATTGGTTATGGAGGCAATCAGCGCAGACGGCTTATCACATCAAATGTTGTCGGTAATGAGACATGGCAAACTTGCAAGCTCACATTTGAGACAACCGAGGATTACCCTGATATATTTATCATTATTGGTGGTTATGGTAAGGCGGATGTAAGTTATATTGAATTTGCCGAGCTGAAACTAGAGAAAGGCGCTATCGCTACAGATTGGACACCAGCACCGGAAGATGTGGAAAGTTCTGTAAGTGCAGTATCTGCAAAAGTAGATTCGGTTCAACAAACGCTGGCAAATGCAGATTCAGCACTAAGCTCTCGCATTGATACGGTCAATGCCTCAGTCGGATCAAACTCATCTAAAATTACCCAAGTCAGCAATGCGGTAGCAAGTGTGGACGGCAAATTATCTGCTACCCATACCATCAAAACCGAAACCATTGCCGGTGGACGCAAAGCGATTGCCGGTATTGCATTTGGTGCAACGGCAGATAACCGTAATGCGGAATCTTCTGTGATTGTGATGGCAGATAAATTTGAGGTCGTGAAAAACGCCCAAGACGGCACGCCAGTAAGACTATTTGGCGTGGTAGAAAATAAAGTAGCGATTAATGGGAATTTAATCGCAACAGGCTCGATTTCAGGAGACCACATCAATGCAAATTCCGTCAGAACTGCTGTATTGACTGCAGGAGCGATTAAAACGGAGCATTTGGCAGCAGGGCAAATATCGGCGGATAAGTTAGCGATTGGGCTAGGTGGGAATTTGCTGGTTAATCCTATTTTTGCAACACCCGATTTGTCAATAGCTCCGTTTGGCTGGAACTACTGGCGAGGAGAAGTTGGTGATCGGCTAAATATTGACACCCGTAATATTTTCAATAGGAATGAACAAGATAATTACGGACTAAAAAATGGAGGACTACCAAATGAGTTAGTATTTTCGATGCGGTATAGCACTACAGAGGAAACCTCTGATACTGGGCGAATTGGGTGGTTATCTCAGGATATTAATGTTGTGCCTAATAAAAAATATATTGCCTCCGTATGGTTAGCTTGTCATCGTGGGCAAGCTAAATTAGTCATTGAGAATATCGAAAAACCTGGTGGTGCTTACTTAGGTTGGATAGGCGACAGCGAGGTAATTACTGGCTATAGTGCTAATCAAGGCGAATTTAAAAATATGAAACGGGTTAAGGTTGTATTTACTGCACCTACTTCAGGCTGTATTCGTTTCGCATTACGATTAGATAATATTCAAGGTAAAGCTAATCCATTTTTATTTGCTCGTAGACCAATGCTTGAGGAGGCTAGTGATAATGTTACAGATATCACTCAGCCTAGCCCTTGGCAAAATGCCGGTGTAACCGCTATTCACGGTGGCTCAATAGCTACTAATACCGTTACTGCTCAACAAATTGCAGCAAATACCATTACCGCCAACCAAATCGCAGTCGGCACGATTGCTGCACGCAATATGGCGGTAGATTCGATTGAGGCTCGTCATATTGTGGGGAGTTCGATCACTGCGGATAAGCTAAATGTAAACAATTTAGCAGCAATATCGGCAAATCTCGGAGCTATTACAGCTGGTTCTATTAACATCAATAATAGATTCAAGGTAAGTAATGCTGGAGTAGTCGAAATGCGAGCCAATAGTGGAAATGTTGGTATGGTAATGAATAACGATAGTATTATTGTTTATGATGAACAAGGTAGGGTTAGAGTAAAAATGGGGAAATTATGA
Genome Context
Tertiary structure
No tertiary structures available.