Genbank accession
CAB5221893.1 [GenBank]
Protein name
Domain of unknown function DUF4815
RBP type
TSP
Evidence DepoScope
Probability 1,00
Protein sequence
MAINFNTDPYYDDYSEDKNFHRILFKPGVAVQARELNQLQTILQNQVSRFGNHVFKPGSMVIPGNTFFDKNFNYVKLEATYNSVDIDTANYLDRELIGQTSGIRAKVIKVEAATTTEPPTLFVKYLDSGTSRTATAFTTAEVIQTNDTGTVYYATVGATAPTGKCIGVSINTGVYFIRDAFVRVAADTLILDKYLSNSSYKVGLEVTESTVNSDDDETLLDPAIGTYNYFAPGADRYKIALTLAKRDINDASSADSFIELVRVKDGELVDIVTKPGYNVLADELARRTYDESGDYTVNPFNLKFIEHLKDTTNTDGYLITGDGGDSTKAIAVLSPGKSYVKGYEVATTSNRYLVFNKPRDTANVTNAIVRTPIGNYVSVSNAYSIPNFTSDLITVNLYNKYTATKGSAAGTLVGNARIRGVETTTSNVMSNASTFSTFLFDVKMRSGYTFDRDVKQLYHAAVSDTGYVSAAFTGDIVATDVVTSGSVNLTNGSNSVVGVNTLFTTDLKAGDYVQFTSDTSNSYLVDNVISNTAFYIGRTYPLANVSGANFTRDAATIVDSDKATYLFPFPNTTIKDLADITVRTRRALYGTLSAGVVTFSTAVGTTFASRSDTNYYAVGVSGGAAGKLYAITSGKFAFTDAPTNRNISIDLSGYGLTTEDVIVYATVIKASPTAKTKTSTSGQTSYTAATDCQAPVISLGYADAYAIANVKMSSNVFGTAYSDGNAVDVTSNYTLDTNQTPTYYGVSRIKLKPGAPAPTGPIQINFTYYAHGAGDYFCATSYPDYEDIPKFTDQGIVYDLRDCLDFRPRISNAATNFKDTGASRNEFLDYTNDFQTDYEYYLPRTDKIFLTTDKEIVYKEGVSSLTPAEPSTPVDAMPLYVIEHPAYGFDINRDSTFTSVDQKRYTMKDIGKLENRIKNLEYYTTLSLLELDTAVFSVKDSFGLDRYKNGFIVDSFRGHGVGDIRNSDYNISMDFEEGKLKPAYYQKNIKVSEVNTSDAQRTANGYVLVNNNTVMLEYTDEEYINVNVASGTESITPFDNFTFTGKMTLAPSGDTWFDDTTKPLVYKDDNGTYDTLIPDSVGEKTYGTVWNSWKQFWFSSDNKDKVKAIEGGAVVTDAGVTGDSTSVVFPYVRANSIAFNASRLKPNTHYYAFFDEYNVTNYCTSGNTTSNVFGFDANTTNFANIITDYTGTVNGVFNFDPVTSGLKVPSGKVTFRLTDSSTNSSNKESFADAFFVSNGTLIQAIPPRINYTADAPLSSGSALSTASPGLVAHAVAFITGNKDPNSITAEQAAAYEKYFKTTGGAGVAFNEALFQSLAPSGTNIYNVRSLITSNSYNFVSGNGTNATTSTGTDLNSYLTATNILEATNTVTGKTFVQEAYDRIQADLGYNAIAQVVEPVYQGVRGVAADVVAKSAGNYDSLPKDMKDFWEAGLANGSFTESAEGVAKALDNYAAAITVGYLDRSSSSSQAAASAAASNGLV
Physico‐chemical
properties
protein length:1481 AA
molecular weight: 160420,36810 Da
isoelectric point:4,78660
aromaticity:0,11614
hydropathy:-0,24092

Domains

Domains [InterPro]
DC_0414
STR
73–1071
DC_0082
RBD
1060–1258
CAB5221893.1
1 1481
Architecture
STR
RBD
STR 10-1071 | RBD 1072-1258 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout
N-terminal
Central
C-terminal
CAB5221893.1
1 1481
Domain Start End Length (AA) Confidence
N-terminal 1 68 68 0,9876
Central domain 69 267 200 0,4361
C-terminal 268 1481 1213 0,0258
Legend: N-terminal Central domain C-terminal
3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring
N-terminal
1-68
Central
69-267
C-terminal
268-1481

Taxonomy

  Name Taxonomy ID Lineage
Phage uncultured Caudovirales phage
[NCBI]
2100421 Uroviricota > Caudoviricetes > Peduoviridae > Maltschvirus maltsch >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAB5221893.1 [NCBI]
Genbank nucleotide accession
LR798294 [NCBI]
CDS location
range 90754 -> 95199
strand +
CDS
ATGGCGATTAATTTTAACACCGACCCGTACTACGACGACTATAGTGAAGATAAAAATTTTCACCGTATTCTCTTTAAGCCTGGGGTAGCAGTTCAAGCACGAGAACTAAATCAGCTACAAACAATTTTACAAAACCAAGTCTCAAGATTTGGTAACCATGTATTTAAACCAGGTTCTATGGTTATACCTGGTAATACATTTTTCGATAAGAACTTCAATTACGTTAAATTAGAAGCAACATATAATTCAGTTGATATCGATACAGCCAATTATCTAGACAGAGAGTTAATTGGTCAGACATCTGGTATCAGAGCAAAAGTTATTAAGGTAGAGGCTGCAACCACTACTGAGCCACCTACATTGTTTGTTAAGTATCTAGATTCAGGTACATCAAGAACAGCTACTGCTTTTACAACTGCAGAAGTTATTCAAACAAACGATACAGGTACAGTCTATTACGCCACAGTTGGTGCAACAGCTCCTACAGGTAAGTGTATTGGTGTATCTATCAATACTGGTGTCTACTTTATTAGAGATGCGTTTGTAAGAGTTGCTGCAGATACTTTAATCTTAGATAAGTATCTTTCTAATTCCTCATACAAAGTTGGTCTAGAAGTTACCGAGTCAACTGTTAACAGTGATGACGATGAGACATTGCTTGATCCAGCTATTGGTACATATAACTATTTTGCACCTGGTGCCGATCGTTATAAAATTGCACTAACACTTGCAAAAAGAGATATTAACGATGCATCCTCTGCTGATTCCTTCATTGAATTAGTTCGCGTCAAAGACGGTGAGTTAGTTGATATTGTAACTAAGCCAGGTTATAACGTTCTTGCTGATGAATTAGCAAGACGCACTTACGATGAATCTGGTGACTATACTGTCAACCCGTTCAATCTTAAGTTCATCGAACACTTAAAGGATACAACAAATACTGACGGTTATTTGATTACCGGGGACGGTGGTGATAGCACTAAAGCTATTGCTGTATTGAGTCCTGGTAAGAGTTATGTTAAAGGTTATGAAGTAGCTACTACATCTAACCGCTACTTGGTATTCAATAAGCCACGCGATACAGCTAATGTAACAAACGCAATTGTCCGCACTCCAATCGGCAATTATGTTTCAGTTTCTAATGCATATTCAATACCTAACTTTACTTCTGATCTAATTACGGTTAACCTATACAACAAGTATACTGCTACTAAAGGTAGTGCAGCTGGTACTTTGGTTGGTAATGCAAGAATCAGAGGTGTTGAAACAACAACAAGTAATGTAATGTCAAACGCATCGACATTCAGTACATTCTTGTTTGATGTTAAGATGAGAAGCGGGTATACGTTTGATCGCGATGTTAAGCAGCTATACCATGCAGCTGTATCTGATACCGGTTATGTTTCTGCAGCCTTCACTGGCGACATTGTTGCAACTGATGTTGTAACTTCTGGTTCAGTTAACCTAACTAACGGTAGTAACTCAGTTGTTGGTGTTAATACTTTATTCACAACAGATCTAAAAGCTGGTGATTACGTTCAGTTCACATCTGATACATCTAACTCCTATCTTGTTGATAATGTTATCAGCAATACAGCTTTTTATATTGGTAGAACGTACCCATTAGCAAACGTTTCTGGGGCAAACTTCACCCGTGATGCTGCAACGATTGTAGATAGCGATAAAGCTACCTATTTGTTCCCATTCCCAAATACAACTATTAAAGACCTAGCTGACATCACTGTTAGAACTAGACGTGCTTTATACGGTACATTGTCTGCCGGTGTTGTAACATTCTCTACAGCCGTTGGTACAACATTTGCATCTAGATCAGATACAAACTATTACGCTGTTGGGGTAAGTGGTGGTGCTGCTGGTAAGTTATACGCAATTACTTCTGGTAAGTTTGCGTTTACCGATGCTCCAACAAATAGAAATATCAGCATTGATTTAAGCGGTTATGGCTTAACAACAGAAGACGTTATTGTTTACGCTACTGTTATTAAAGCAAGCCCGACAGCTAAAACTAAGACATCTACTTCCGGTCAAACATCTTATACAGCTGCCACCGATTGCCAGGCACCTGTAATTTCTTTAGGTTATGCAGATGCTTATGCAATCGCTAACGTTAAGATGTCATCAAATGTATTTGGTACAGCGTACAGTGACGGTAATGCTGTTGATGTTACAAGTAACTACACATTAGATACTAATCAGACACCAACATATTACGGTGTATCAAGAATTAAGTTGAAGCCAGGTGCACCTGCACCGACTGGTCCAATTCAGATTAACTTCACCTATTATGCACATGGCGCAGGTGATTACTTCTGTGCTACATCTTACCCTGATTACGAAGATATTCCTAAGTTTACCGATCAAGGTATCGTATATGACTTAAGAGATTGTTTAGATTTTAGACCTCGTATCTCTAACGCAGCCACAAACTTCAAAGATACTGGTGCATCTAGAAACGAATTCTTAGATTATACTAACGATTTCCAAACTGATTATGAATACTATCTGCCTAGAACAGATAAGATCTTCTTGACAACAGATAAAGAAATTGTATACAAAGAAGGTGTGAGTTCGTTAACACCGGCAGAACCATCAACACCAGTTGATGCAATGCCATTGTATGTGATTGAGCATCCAGCATACGGTTTCGATATTAACAGAGATTCAACTTTTACATCCGTAGATCAAAAACGCTACACGATGAAAGATATCGGTAAGTTAGAAAACCGTATCAAGAATCTAGAATATTATACAACTTTATCTTTATTAGAGCTAGACACAGCTGTATTCTCTGTTAAAGACAGCTTTGGTTTAGACAGATATAAGAACGGCTTTATTGTTGATTCTTTCCGAGGTCACGGTGTAGGTGATATTCGTAATTCTGATTACAATATCTCTATGGATTTTGAAGAAGGTAAGTTAAAACCAGCTTACTATCAAAAGAACATTAAGGTATCTGAAGTTAATACATCGGATGCGCAAAGAACAGCTAACGGTTATGTATTAGTAAATAACAATACAGTAATGTTAGAATATACCGATGAAGAGTATATTAATGTTAATGTTGCAAGCGGTACAGAATCTATCACGCCTTTTGATAACTTTACATTCACTGGTAAAATGACTCTTGCTCCTTCCGGTGATACATGGTTTGATGATACAACTAAACCATTAGTGTATAAAGATGATAACGGAACATATGATACATTGATTCCTGATTCTGTAGGTGAGAAGACTTACGGTACAGTGTGGAATTCATGGAAACAATTCTGGTTCAGTTCTGACAACAAGGATAAAGTTAAAGCTATTGAAGGTGGTGCTGTTGTAACAGATGCCGGGGTAACTGGTGATTCTACATCAGTTGTATTCCCTTATGTTAGAGCCAACTCTATTGCATTTAATGCAAGTAGACTTAAACCAAATACACACTACTATGCATTCTTTGATGAGTATAATGTAACAAATTACTGTACCAGTGGTAATACAACGTCGAACGTATTTGGTTTTGATGCAAATACAACAAATTTTGCTAATATTATTACCGACTATACAGGTACAGTAAACGGGGTATTTAACTTTGATCCAGTTACATCTGGTTTGAAAGTTCCTTCTGGTAAAGTTACATTTAGATTAACAGACTCTTCTACAAATAGCTCTAATAAAGAATCCTTTGCTGATGCATTCTTTGTATCTAACGGTACATTAATTCAAGCAATTCCCCCTAGAATTAATTATACTGCGGATGCTCCTTTAAGTTCAGGTAGCGCATTATCTACTGCAAGTCCTGGTTTAGTTGCACACGCTGTTGCGTTCATTACCGGTAATAAGGATCCTAACTCTATTACAGCTGAACAAGCAGCTGCATATGAGAAGTACTTTAAGACTACAGGTGGTGCTGGTGTTGCATTCAACGAAGCTTTATTCCAATCACTGGCACCTAGCGGTACAAACATATACAATGTTAGAAGCTTAATTACATCTAACTCTTATAACTTTGTATCCGGTAATGGTACAAACGCAACTACCTCAACTGGTACAGATCTAAATAGTTATTTAACAGCGACAAATATTCTTGAAGCTACTAACACTGTAACCGGTAAGACGTTTGTTCAAGAAGCGTATGATAGAATTCAGGCAGACTTAGGATATAACGCTATTGCTCAAGTTGTTGAACCAGTATATCAAGGAGTAAGAGGTGTAGCTGCTGATGTTGTTGCTAAGTCTGCAGGTAATTATGATTCATTACCAAAAGATATGAAAGACTTCTGGGAAGCAGGTCTTGCTAATGGTTCATTTACAGAGTCAGCTGAGGGTGTTGCAAAAGCTCTCGACAATTACGCTGCAGCTATCACGGTTGGTTACTTAGATAGAAGTAGCTCCTCTTCTCAAGCTGCTGCATCTGCAGCAGCAAGCAATGGTTTAGTATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
fe497c02e0a025fab041d3650c0494fe754ab96de8b63c7a05f0ed23940807e5
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7551
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50