Genbank accession
YP_011108621.1 [GenBank]
Protein name
hypothetical protein
RBP type
TF
Evidence Phold
Probability 1,00
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,87
TSP
Evidence RBPdetect2
Probability 0,96
Protein sequence
METNNRKQLVTQDNGNIEKIFPKNYMSNIVDEETGESLRIFLLKYNHIDLGYRSSKSSARLAVPIIMRRKGLYITYYLPNDIVITEFFNGNKTEVSDTNWVKDELWVKDVNELNVYDVKISDGSITLDKLSEEVMQLISSKGDITINNFPDNEDLELYTIYQDSNNKIDAIRFKDRDNSNGMAYKYLRKTKNMILSQSDFNQANTIYEIRYDFDLNGSTISIPDNCELKFIGGSLKNGTINFNNTLLNGNIKIKTNISGNIRNNEVNVLWFNVTGDGNADDRNAIQEVIDIVSESTTILFPKVSNFYNVIIAKGNGNTTIEQRANAVYSGSLYPLTINKNNITIVIRGIIKSTNILGNMFEVSGNNIVIIGEDGKLQGIGGTDNEGFLDTNTSDTTLQWHPCLIKINGDNCRINNLSFEDYPTHGIDCYGKALIVDSCLFIGGRIEHSTTGGTVLMGIRTNTGADSVIIKNNRFIANPKGGKCYSCIFPSGDKFIISNNICEKYHEHAVYAYGNYGSIIDNKFTDVDCIASDIQYFATYGIIKGNFSIGTEGFIQIMHGKGTIVEGNTVTNCRGGIIVRPYHTVDVDKLPSGLKLLNNFIELTVGTTGSCLSFYVLGTYDISDILISGNTFANGYYTQTSQVAASLLIGAGSSENNGIKFLRVENNVIRSGRGAVSWLKGIHNSIFKNNKFISESLNDVASAFSFAINANYVTNTIFEGNEFIDVKDTPTLARAIQLNTGTTNLSVIDNNIINYTSNIYLDYDTYTKLIYKRNNRRNYLPLAGTYDDKPNAYAQEYGAEYYDKDNQVPMWWSGVRWKDAEGCYIVLSKSDINTPNKIYKIRFNIDLGGTTLTLPANCTLDFQGGSFSNGTIVGSNTRFSGNIKLDTTLTFSGTYLLDTVNVDWFYTTRGSDASPYIQAALDFAKLIKASVTFGNKLTSGYIIKTTLNCDVPIIGNNARLSSTTVGVLNCKNECSIENLYIDFYPYQGASDVTDNKVIAINIGGETSTYNHYINNVTIDGFYYGIVMTNSWNLRCSNLRIIRTRIGIQAYGKCVNNSIVNANIDCKGTNSICIAFNDEVDHAASTYLSEGWTISNSILTSAQYGIFGVNMSNTFISNCIIDLCSKNAIKFSLNSLNIRIVDNYLACLANGIDVINFSGQNVLNNEDAGIIISNNTIKSYYSDSGSCNGINIGEGTYESIYILGNTISNLGGIGIVSLNGEITHINVSDNRFKINVGGYFYVLKATNKYIANNNAIDNYNNSGIKVANKMIIVADSAPTSNTKTWNAGDICLNSNASVGSIIGWFCATSGSPGTWFPIGTIEQYAGLKKQGTTAERPAMNQNYIGATYYDTTLKKVILWNGTTWTNVDGTALT
Physico‐chemical
properties
protein length:1371 AA
molecular weight: 151230,13690 Da
isoelectric point:5,43599
aromaticity:0,10212
hydropathy:-0,18322

Domains

Domains [InterPro]
IPR006626
Unmapped
408–430
YP_011108621.1
1 1371
Architecture
STR
STR
RBD
STR 1-846 | STR 891-1343 | RBD 1344-1368 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout
N-terminal
Central
C-terminal
YP_011108621.1
1 1371
Domain Start End Length (AA) Confidence
N-terminal 1 223 223 0,9822
Central domain 224 779 557 0,9685
C-terminal 780 1371 591 0,2375
Legend: N-terminal Central domain C-terminal
3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring
N-terminal
1-223
Central
224-779
C-terminal
780-1371

Taxonomy

  Name Taxonomy ID Lineage
Phage Caudoviricetes sp. 'Rudgehvirus jaberico'
[NCBI]
3028515 Uroviricota > Caudoviricetes > Crassvirales > Crudevirinae >
Host Bacteroides cellulosilyticus
[NCBI]
246787 cellular organisms > Bacteria > Pseudomonadati > FCB group > Bacteroidota/Chlorobiota group > Bacteroidota

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
YP_011108621.1 [NCBI]
Genbank nucleotide accession
NC_091965 [NCBI]
CDS location
range 19224 -> 23339
strand +
CDS
ATGGAAACTAACAATAGAAAACAATTAGTTACTCAAGATAATGGGAATATCGAAAAGATATTCCCTAAAAACTACATGAGTAATATAGTAGATGAAGAAACAGGTGAAAGTCTTCGTATATTTCTTCTTAAATATAATCATATAGATCTTGGATATAGAAGCAGTAAATCTTCTGCAAGACTTGCTGTTCCTATTATAATGCGTCGTAAAGGATTATATATAACTTATTATCTTCCTAATGATATAGTTATTACTGAATTCTTTAATGGAAACAAAACAGAAGTTAGTGATACTAATTGGGTTAAAGATGAACTTTGGGTTAAAGACGTTAATGAACTTAATGTTTATGATGTTAAGATATCTGATGGTAGTATTACTTTAGATAAATTGAGCGAAGAAGTAATGCAACTCATATCCTCTAAAGGGGATATTACAATAAATAACTTTCCTGATAATGAGGATTTAGAATTATATACTATATATCAAGATAGCAATAATAAAATAGATGCTATTAGATTTAAAGATAGAGATAATTCTAATGGTATGGCTTATAAATATCTACGTAAGACTAAGAATATGATTCTTAGTCAATCTGATTTTAATCAAGCTAATACTATTTATGAAATTAGATATGACTTTGATCTGAATGGTAGTACTATATCTATTCCAGATAATTGTGAGTTAAAGTTTATCGGAGGTAGTTTAAAGAACGGAACTATTAATTTTAATAATACACTACTTAATGGAAACATTAAAATAAAGACTAATATATCAGGTAATATTAGAAATAATGAAGTAAATGTATTATGGTTTAATGTAACAGGGGATGGAAATGCAGATGATCGTAATGCTATACAAGAAGTTATAGATATAGTATCTGAAAGTACAACTATATTATTTCCTAAAGTTAGTAATTTCTATAACGTTATTATAGCAAAAGGTAATGGAAATACAACAATAGAACAAAGAGCTAATGCTGTATATAGTGGTTCTCTTTATCCTTTAACTATAAATAAAAATAATATAACTATAGTTATTAGAGGTATAATAAAATCTACAAATATATTAGGTAATATGTTTGAAGTATCTGGTAATAATATAGTTATAATAGGAGAAGATGGCAAGTTACAAGGTATTGGAGGAACCGATAATGAAGGTTTCTTAGATACAAATACTTCAGATACTACTTTACAATGGCATCCTTGTTTAATAAAAATAAATGGAGATAATTGTAGAATAAACAATCTTTCTTTTGAAGATTATCCTACTCATGGAATCGACTGTTATGGTAAAGCATTAATTGTAGATTCTTGTTTATTTATAGGAGGTAGAATAGAACATTCTACAACAGGAGGTACTGTTCTTATGGGTATAAGAACTAATACTGGTGCTGATTCTGTTATTATAAAAAATAATAGATTTATTGCTAATCCAAAAGGTGGTAAATGTTATAGTTGTATATTTCCATCTGGAGATAAATTTATTATTTCTAATAATATTTGTGAGAAGTATCACGAACATGCTGTTTATGCTTATGGTAATTATGGTAGTATTATTGATAATAAATTTACTGATGTAGACTGTATAGCTTCTGATATACAATATTTTGCTACTTATGGAATTATTAAAGGTAATTTTAGTATTGGTACAGAAGGATTTATTCAAATAATGCACGGTAAAGGTACTATAGTTGAAGGTAATACTGTAACTAATTGTAGAGGAGGTATTATTGTAAGACCTTATCATACTGTTGATGTAGATAAACTTCCATCAGGATTGAAATTATTAAATAACTTTATAGAACTAACTGTTGGTACTACTGGAAGTTGTTTAAGTTTTTATGTATTAGGTACATATGATATTTCTGATATTCTTATATCTGGAAATACATTTGCAAATGGATATTATACTCAAACTTCTCAAGTTGCTGCTTCATTATTAATTGGCGCTGGTAGTTCTGAAAATAACGGTATCAAGTTTCTTAGAGTAGAAAATAATGTTATTAGAAGTGGTAGAGGCGCAGTATCTTGGTTAAAAGGAATACATAATTCTATATTTAAAAATAATAAATTTATTAGTGAAAGTTTAAATGATGTAGCAAGTGCATTTTCTTTTGCAATTAATGCTAATTATGTTACTAATACTATATTTGAAGGTAATGAGTTTATAGATGTTAAAGATACTCCTACTTTAGCAAGAGCTATTCAGCTTAATACAGGAACTACTAATTTAAGTGTTATAGATAATAATATAATTAATTATACTTCTAATATTTATTTAGATTATGATACCTATACTAAATTAATATATAAAAGAAATAATAGAAGAAATTATCTTCCATTAGCAGGAACTTATGATGATAAACCTAATGCTTATGCACAAGAATATGGTGCTGAGTATTATGATAAAGATAATCAAGTTCCTATGTGGTGGAGCGGAGTTAGATGGAAAGATGCAGAAGGATGTTATATAGTACTTTCTAAATCTGATATTAATACTCCAAATAAAATATATAAGATAAGATTTAATATAGATCTTGGTGGTACAACATTAACCTTGCCTGCAAATTGTACATTAGATTTCCAAGGTGGCAGTTTCAGTAATGGTACTATTGTGGGGAGTAATACAAGATTTAGTGGAAATATAAAATTAGATACTACATTAACTTTTAGTGGAACTTATTTATTAGATACTGTAAATGTAGATTGGTTTTATACTACTAGAGGTTCGGATGCTTCTCCTTATATACAAGCTGCTTTAGATTTTGCTAAACTTATTAAAGCATCTGTAACTTTTGGAAATAAATTAACATCTGGATATATTATTAAAACCACTTTAAATTGCGATGTTCCTATTATTGGAAATAATGCAAGATTATCAAGTACTACTGTTGGAGTATTAAATTGTAAAAACGAATGTAGTATAGAAAATTTATATATAGATTTTTATCCATATCAAGGAGCTTCTGATGTAACAGATAATAAAGTAATTGCTATAAATATAGGAGGAGAAACATCTACTTATAATCATTATATTAATAATGTTACTATTGATGGATTCTATTATGGAATAGTAATGACTAATTCTTGGAATCTAAGATGTTCTAATTTGAGAATTATTAGAACAAGAATAGGTATTCAAGCTTATGGTAAGTGTGTTAATAATAGTATTGTTAATGCTAATATTGATTGTAAAGGAACAAATTCTATATGTATTGCATTTAATGATGAAGTAGATCATGCAGCTTCGACTTATTTAAGTGAAGGATGGACTATAAGTAATTCTATATTAACTTCTGCGCAATATGGTATATTTGGAGTTAATATGAGTAATACTTTTATATCTAATTGTATTATAGATTTGTGTTCCAAAAATGCTATAAAATTTTCTTTAAATAGTCTTAATATTAGGATAGTAGATAATTACTTAGCATGTCTTGCTAATGGAATAGATGTTATTAATTTTAGTGGTCAAAATGTATTAAATAATGAAGATGCAGGTATCATAATTAGCAATAATACTATTAAAAGTTATTATTCAGATTCAGGTTCTTGTAATGGAATTAATATAGGTGAAGGTACTTATGAATCTATTTATATATTAGGTAACACTATTAGTAACTTAGGAGGTATAGGTATTGTATCTTTAAATGGAGAAATAACACATATAAATGTTTCTGACAATAGATTTAAAATAAATGTTGGTGGATATTTTTATGTATTAAAAGCTACAAATAAGTATATTGCTAATAATAATGCAATAGATAATTATAATAATTCAGGTATAAAAGTAGCTAATAAAATGATAATTGTGGCAGATAGTGCTCCTACTTCTAATACAAAAACTTGGAACGCAGGAGATATTTGTTTAAATTCTAATGCTTCTGTCGGTTCTATTATTGGTTGGTTTTGTGCTACTTCTGGTTCTCCGGGTACTTGGTTTCCTATTGGAACAATAGAACAATATGCTGGATTAAAAAAACAAGGGACTACTGCTGAAAGACCTGCAATGAATCAAAATTATATTGGTGCTACATATTATGATACTACACTTAAAAAAGTGATTTTATGGAACGGCACTACATGGACTAATGTTGATGGTACTGCATTAACTTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
a78882f1d02e136a293e56f18ad3028f52ea9b90d9dce304578e7b8d1bf0a047
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7176
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Host interactions of novel Crassvirales species belonging to multiple families infecting bacterial host, Bacteroides cellulosilyticus WH2 Papudeshi,B., Vega,A.A., Souza,C., Giles,S.K., Mallawaarachchi,V., Roach,M.J., An,M., Jacobson,N., McNair,K., Mora,M.F., Pastrana,K., Boling,L., Leigh,C., Cram,C., Plewa,W.S., Grigson,S.R., Bouras,G., Decewicz,P., Luque,A., Droit,L., Handley,S.A., Wang,D., Segall,A., Dinsdale,E.A. and Edwards,R.A. 2023 GenBank