Protein
- UniProt accession
- M1HLS3_9CAUD [UniProt]
- Protein name
- Peptidase S74 domain-containing protein
- RBP type
-
TF
evidence: RBPdetect2
probability: 0,9558
- Protein sequence
-
MPTALQLRRGSTSQNNSFTGAVGEVSVDTDKDTLRVHDGSTAGGFEVITATATQTLTNKTLTSPNISGASFTGASFTFEGATDDSFETTLTVVDPTADRTVTIPNATTTLVGTDVSQTLTNKTLTTPVIAEIDSGGSITLDATADIILDADGANVTIKDGGTTTLDFVSNGATDITLDAPGDVKIDADGGDIIFMDGGAVYGSATNNSGNLIIKSGTTTAATFSGANVTLAGTVASGAITSSGSFTGTQAILSNASPLVFEGATADSFETTIAVTDPTADRTLTLPDATDTLVGRATTDTLTNKTLTTPVIAEIDSAGNFTVDAATDIILDADGGDVFLKDAGTTYGSLTNTGGNLIIKSGTTTAMTMSGANVTIAGNLTVSGSTTTVDSSTVNLQTGFVFEGSTADSFETTLVATDPTADRTVTIPDLTGTVSLITATETLTNKTLTTPVIAEIDSGSTITLDATTDIILDADGDNITLKAGGTTALDFVLNGTTDITLDAPGDIKIDADGGDIFFLDAGTTYGSATNNSGNLIIKSGTTTAATFSGANVTLAGTVASGAITSSSTVTATGAVLSGSVVFEGATNDSFETTLGVVDPTADRAVNIANVAGTLQPFAAASTDAITATPAELNLIDGGTARGTTAIADGDGVLINDGGTMRMTTVETLAAYMDDEITAMPNLVTTGALNSGSITSGFGTINNGSSTITTTGQITGGIIQSTNNMLIGAGYSLVFEGSTNDSFETTLGVVDPTADRTVNIANVAGTLQPFASASTDQITATVAEINLIDGGTARGTTAVADGDGILINDAGTMRMTNVQTVSAYMSAESVGGSNIVTTGALNSGSITSGFGNIDNGSSTLDTGALTATTIAGTTITASTGVETKNGATGAGFVKFFEDSDNGTNAVTLVGPASTGDITITLPTQAGTVVVSNTTDGNDVQLDSLGLNTAASGTAGELRATNDITAFYSSDIALKENIINIPSPLEMIKKINGVFFDWKDSFIESKGGEDGYFVRKRDVGVIAQDVEKVMPEIVGTRPDGIKAVKYDRLVSVLIEAVKELTDEVTELKKKQ
- Physico‐chemical
properties -
protein length: 1068 AA molecular weight: 107670,18510 Da isoelectric point: 4,05003 aromaticity: 0,04401 hydropathy: 0,08755
Domains
Domains [InterPro]
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
Name | Taxonomy ID | Lineage | |
---|---|---|---|
Phage |
Pelagibacter phage HTVC008M [NCBI] |
1283076 | Uroviricota > Caudoviricetes > Kyanoviridae > |
Host |
Candidatus Pelagibacter ubique HTCC1062 [NCBI] |
335992 | Bacteria > Proteobacteria > Alphaproteobacteria > Pelagibacterales > Pelagibacteraceae > Candidatus Pelagibacter |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AGE60398.1
[NCBI]
Genbank nucleotide accession
KC465899
[NCBI]
CDS location
range 51699 -> 54905
strand +
strand +
CDS
ATGCCAACAGCATTACAATTAAGACGAGGATCAACGTCTCAAAATAATAGTTTTACAGGTGCTGTAGGTGAGGTAAGTGTAGATACTGATAAAGATACTCTTAGAGTCCATGATGGCTCGACAGCAGGCGGTTTTGAAGTAATAACGGCAACTGCTACACAAACACTCACAAACAAAACCTTAACGAGCCCAAATATTTCAGGCGCCTCTTTCACAGGTGCAAGTTTCACTTTTGAAGGTGCAACAGATGACAGTTTTGAAACAACTCTAACAGTTGTAGATCCAACAGCTGACAGAACAGTAACTATTCCAAATGCAACTACTACACTAGTTGGTACGGATGTTTCACAAACTCTTACGAACAAAACTTTAACTACACCAGTTATCGCTGAGATAGATAGTGGTGGTAGTATAACTTTAGACGCAACAGCAGATATTATATTAGACGCTGATGGTGCTAACGTAACTATAAAAGACGGCGGTACAACAACATTAGACTTTGTTAGTAACGGTGCAACAGATATTACACTAGACGCTCCAGGCGATGTTAAAATAGACGCTGATGGCGGAGACATAATCTTTATGGATGGTGGTGCTGTCTATGGTAGTGCAACAAACAATTCAGGTAACTTGATTATCAAATCAGGAACTACAACAGCTGCAACATTTAGTGGTGCAAATGTAACATTGGCAGGTACAGTTGCTTCAGGTGCAATTACATCATCTGGTTCATTTACTGGTACTCAAGCAATATTATCAAATGCAAGTCCATTAGTATTTGAAGGTGCAACAGCAGATAGTTTTGAAACAACTATTGCAGTTACAGACCCAACAGCAGATAGAACACTTACATTACCAGACGCAACAGACACATTAGTGGGAAGAGCAACAACAGATACGTTGACTAATAAAACACTAACTACTCCAGTTATTGCTGAAATAGATAGTGCTGGCAACTTTACAGTTGACGCAGCTACAGATATCATATTAGACGCAGATGGCGGAGATGTTTTCTTAAAAGACGCTGGTACTACTTACGGTTCATTGACGAACACAGGCGGTAACTTGATTATAAAATCAGGTACAACTACTGCTATGACCATGTCAGGTGCAAACGTAACAATCGCAGGTAACTTAACAGTATCAGGTTCTACAACTACAGTTGATAGTTCAACAGTTAACTTACAAACAGGTTTCGTTTTTGAAGGTTCAACAGCAGACAGTTTTGAAACAACACTAGTTGCTACTGACCCAACAGCAGATAGAACAGTAACTATACCAGATTTAACTGGTACAGTTTCTTTAATAACTGCTACAGAAACATTAACAAATAAAACACTTACAACTCCTGTAATTGCAGAAATAGATAGTGGTTCAACAATCACACTTGACGCAACTACAGACATTATCTTAGACGCTGATGGTGATAACATCACTTTGAAAGCGGGTGGTACAACTGCCTTAGATTTTGTTTTAAATGGTACAACTGATATTACATTAGACGCTCCAGGTGATATTAAGATAGACGCTGATGGCGGAGATATTTTCTTCCTAGACGCAGGTACTACTTATGGTAGTGCAACTAATAACTCTGGTAACTTAATTATAAAATCAGGTACAACTACAGCTGCAACATTTAGTGGTGCAAATGTAACATTAGCAGGGACAGTTGCTTCAGGTGCAATCACATCATCAAGTACAGTAACAGCAACAGGCGCAGTATTAAGTGGTTCTGTAGTATTTGAAGGTGCGACAAACGACAGTTTTGAAACAACATTAGGTGTAGTTGATCCAACTGCTGACAGAGCAGTCAACATCGCCAATGTTGCAGGTACATTACAACCATTTGCTGCTGCTTCAACAGACGCAATCACAGCAACACCGGCAGAATTAAATTTAATTGACGGTGGTACTGCTAGAGGCACAACAGCAATTGCAGACGGTGATGGTGTACTAATCAATGACGGCGGTACAATGAGAATGACTACAGTTGAAACTCTTGCTGCCTACATGGATGACGAAATTACAGCAATGCCAAATCTTGTGACAACAGGTGCATTAAACTCAGGTTCAATCACATCAGGTTTTGGTACTATAAACAACGGTTCATCTACAATCACAACTACAGGTCAGATAACTGGTGGTATTATTCAATCTACTAACAACATGTTAATAGGTGCAGGTTACTCACTTGTATTTGAAGGTTCAACAAATGATAGTTTTGAAACAACATTAGGTGTAGTTGACCCAACTGCTGATAGAACAGTTAATATTGCAAATGTAGCAGGTACTTTACAACCTTTTGCTTCTGCTAGTACAGACCAAATTACGGCAACAGTTGCTGAAATTAATTTAATAGATGGTGGTACTGCTAGAGGTACTACTGCTGTAGCAGACGGTGATGGTATTCTAATCAACGATGCTGGTACAATGAGAATGACGAATGTTCAAACTGTTTCAGCGTATATGTCTGCTGAAAGTGTTGGTGGTTCAAACATAGTTACTACTGGTGCATTAAACTCAGGTTCAATCACTTCAGGTTTTGGTAACATAGATAACGGTTCATCTACATTAGATACAGGTGCCTTAACGGCAACTACAATTGCAGGTACAACAATTACTGCTTCTACTGGAGTAGAAACAAAAAATGGTGCTACTGGTGCCGGTTTTGTTAAATTCTTTGAAGATAGTGACAACGGTACTAATGCAGTAACTTTAGTAGGTCCTGCTTCAACAGGTGATATAACGATTACTTTACCAACTCAGGCAGGTACAGTTGTTGTATCAAACACAACAGACGGTAATGATGTACAGTTAGACAGTTTAGGTCTTAATACTGCCGCTTCAGGTACTGCTGGTGAGTTAAGAGCAACAAACGATATTACTGCCTTCTACAGTTCAGATATAGCGCTTAAGGAAAACATTATCAACATTCCTTCTCCACTTGAAATGATTAAGAAAATCAACGGTGTATTCTTTGATTGGAAAGATAGTTTCATTGAGAGTAAAGGTGGCGAAGACGGATACTTTGTAAGAAAAAGAGATGTTGGTGTTATCGCACAAGATGTTGAAAAAGTTATGCCAGAAATCGTTGGTACAAGACCAGACGGTATCAAAGCAGTTAAATATGACAGACTAGTATCAGTATTGATTGAAGCTGTTAAAGAATTAACAGACGAAGTTACAGAATTAAAGAAAAAACAATAA
Gene Ontology
Description | Category | Evidence (source) | |
---|---|---|---|
GO:0098015 | virus tail | Cellular Component | IEA:UniProtKB-KW (UniProt) |
Enzymatic activity
No enzymatic activity data available.
Tertiary structure
No tertiary structures available.
Literature
No literature entries available.