Genbank accession
QCG76181.1 [GenBank]
Protein name
structural protein
RBP type
TF
Evidence RBPdetect2
Probability 0,92
Protein sequence
MSIQSGPSVLNQFVPDFLIDSTPTNGQFLVYDDTVQAFVNSTNPRIVLDSSNILDGSITIDKLAISGNKVPGYVLTITSAGGMAFLPVPGSGRQLPSLGELLDTNIVSPTVTQYLKWDGSAWVNSNITLNDVSDVSVISPTADDVLAWESGSWTNKKIDYTSLTNKPDLSDVVRSSELSSVAFSGDYNDLVNIPSATSNTIVGLTDVNDTALPNGFLRWNASGDEVEFITSISATVITGLAPVATSGNYNDLLGKPNLSVYPLRTEFSTVATTGNYSDLNNVPLTFAPSAHTHPAAQITGLASVATSNDYNDLVNKPTAMAPTAHTHAISDIIGLQNSLDSKLTVNLTTRLPKDVIYFNGTSWINKQLSYTDISGTPNLDNYVTDSELSTVATTGRYSDLINKPELVENLNDLLDVDVSSKQTGNVLTWNGTAWVASAITQASIDWANISNKPSVFSPAAHTHDVVDVLGLQSLLDSKLDANIAFDGDYNSLTNKPGLIDLQDTFSPAVPNGFLRWNNLGTLVAYQDYIYPQDISGLSDVAISGQYSDLLGTPSLSTVAITGSYSDLIDAPPAFDGDYDSLTNKPFIPTNFDFKFIGLNDVSPTVQPGGYLKWNLDGSFVVSSANIPATDVAGLSVVSTTGQYSDLLGKPLLATVSSSGSYTDLINIPTEFNPAEHTHNIADVSGLQASLDNKLNTSDAFSGDYNDLTNAPTNSSYSLVGLSDTNSVPVANGFLRWNASGSSVEYIQTIPVNAITGLAPVASSGQYADLQGTPDLSDYVLSVSLADIATTGEYSDLINAPDLSVYANKTDLSDVATTGQYSDLLGIPTQFTPTVHVHNVSQISGLATVATSGSYDDLSNKPSFANVATTGSYDDLNNKPSIPTNGSFSLLGLNDTNNTPVADGILRWNSSANQVIYANTIDAQSVSGLATVATIGKLSSLSDVDLIGLNQNEILQWNGSAWVPVPYNPNQIQAYIESGNTKVSTNDILDSIVLTAGPTTGNIIFELGNTNSSIILNPVANNVDALISSTSRIKLDSSTGISLGNISYPMTDGTVGQAVVTNGAGQLSFETVVKPSQLATVATSGNYNDLTNKPTLVTELNGLADVRMRDTNGNYLAQPEDVLTYSNGIWQARPNTSSSFIGLSDTQNITLPEDRANAYLRWDTTGNLIIYEDSISASVIAGLAEVATTGDLHDLINVNVNLPDMNNPATQAVWGLIWDRQNQRWINYNLRNIAGSGGSTVVALNDLTDVTLTFPVVDGNVLRATVQPDNSIVWQNKQLSYSDLTGTISMSLLQLTDTSSSAVPNGFLRWDSSGSTVQYITTISTNDITGLAPVATSGNYNDLSNKPAIPASINDLADVNTVNPVPTNGYVLTWDSSSNNWIAKEPATNPSGSTALADLTDVSLSDLAASDVLKYNGTTWVNEPVTYSELTDLPTFALVAFSGDYNDLTNKPSGSTTSILDLTDTADTALPNGFLRWNASGDEVLYQSSIDVSDIIGLSGVAISGDYNDLSNKPENNSYYFRKLADAGNPQPNTFIKYPAFTIPPGSDIDDVNPILEYVSSINALTDIDNLAPVATNGILGSLVDVNLNSVEDGQVLTYDAVTNSWINKNSSGSPVVTSWTKINGNYTVTGSEYLLVDTTSASVTITLPVAPTENMVIRIADWKGTFRTNSCVVNTNGMPLMGASMDNTLTIQNQNASIELTFVDTTYGWKITDGIGEISKQNIPVTNWRTVDSSSTPAMLIAQPGEAIYVNTNNGAVTVKLPTGASVNAVVRIADLLGTYDKASCFVDGNGNPIMGKNEILEIANENASIEFTYVDSVVGWKVTDGIGELGRKTDIASDSDIIVYVATDGNDTTGSGTEESPFATLNAAFLSLDGKFVNSSAEIIVRVAEGVYEPTNPVAFSHIQGMNVKLIGELPQASSSFTVTNITNDAGLAKVTMQLSSVSDYEVGDIIKITSAATMLECVEIITAINTGSNTLEIVIPNSVLADVSDYTGYTGTISKFTTVFKNTNMYVAGGYSLGFIDNIALVDDTGLGTALTVGRTYTTGIYDGPAYVGLGANFAVYGYETAIQSIPGSSVVLAGNLCRQAGAAIRADGSILSFNAGQSVYIANQAQDGIVLKHGSKLIHNDDASQSFVFVIFNNIKSGTILSLDTSISTANFEVKNSEGIMIAATRHSTVDARSAIVSGTITGDLEVNATGMSVISINEPADSTDIPLAVVCNPAYGSNIELQKGYIGL
Physico‐chemical
properties
protein length:2236 AA
molecular weight: 236470,02320 Da
isoelectric point:4,09703
aromaticity:0,07424
hydropathy:-0,02925

Domains

Domains [InterPro]
DC_0165
STR
691–785
QCG76181.1
1 2236
Architecture
STR
ATT
STR
STR
ATT
STR
RBD
STR 1-261 | ATT 321-592 | STR 593-862 | STR 876-1118 | ATT 1119-1394 | STR 1395-1841 | RBD 1842-2236
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Pseudomonas phage vB_PaeM_PA5oct
[NCBI]
2163605 Uroviricota > Caudoviricetes > Arenbergviridae > Wroclawvirus PA5oct >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QCG76181.1 [NCBI]
Genbank nucleotide accession
MK797984 [NCBI]
CDS location
range 196408 -> 203118
strand +
CDS
ATGAGTATACAATCAGGTCCTTCTGTATTAAATCAATTTGTTCCAGATTTTCTGATAGATAGTACACCAACTAATGGTCAATTTTTAGTTTATGACGATACTGTCCAGGCATTTGTAAATAGCACAAATCCCAGAATCGTATTAGATTCGTCTAATATATTAGACGGTTCTATAACAATTGATAAACTTGCAATATCTGGTAATAAAGTACCTGGATACGTACTAACTATAACTTCCGCAGGCGGAATGGCATTTTTACCAGTACCTGGCAGCGGCAGACAGCTACCTAGTCTAGGTGAATTACTAGACACAAATATAGTATCTCCTACTGTAACCCAATATCTTAAATGGGACGGTTCTGCATGGGTTAATAGTAATATAACGTTAAATGATGTATCAGATGTCTCTGTTATCTCCCCTACAGCTGATGATGTATTAGCATGGGAATCAGGTTCTTGGACAAATAAGAAAATAGATTATACATCACTAACAAACAAACCAGATTTGAGTGATGTAGTTAGATCTAGCGAATTGTCATCAGTTGCATTCAGTGGTGATTATAATGATTTAGTAAATATTCCCAGTGCAACTTCTAATACTATAGTTGGATTAACAGATGTTAACGATACTGCACTACCCAACGGATTCTTGCGCTGGAACGCAAGTGGTGATGAGGTAGAATTTATTACTTCAATTTCTGCTACTGTAATAACCGGGTTAGCTCCAGTTGCTACTAGTGGAAATTATAATGACTTATTAGGAAAACCTAATTTGTCAGTGTATCCGCTTAGAACTGAATTTTCCACTGTTGCAACCACCGGTAATTATTCTGATTTGAACAATGTGCCTTTGACATTTGCACCAAGTGCGCATACTCACCCGGCTGCACAAATCACAGGATTGGCATCTGTAGCTACTAGCAACGATTATAACGATTTAGTTAATAAACCGACTGCAATGGCGCCAACCGCACATACGCATGCTATATCTGATATTATAGGATTGCAAAATTCGCTAGATAGTAAATTGACTGTCAATTTAACTACTAGACTTCCAAAAGATGTTATTTATTTTAACGGCACTTCATGGATAAACAAGCAATTATCTTATACTGATATTTCCGGTACTCCTAACTTAGATAACTATGTTACTGATTCAGAATTATCTACTGTTGCTACAACTGGCAGATATTCTGATTTAATAAATAAACCCGAGTTAGTAGAAAATTTAAACGACTTATTAGACGTAGATGTTTCTTCTAAACAGACAGGGAACGTATTAACCTGGAACGGAACAGCATGGGTTGCTAGTGCAATAACACAAGCAAGCATAGATTGGGCTAATATAAGCAATAAACCAAGCGTTTTTAGCCCCGCTGCGCATACACACGACGTAGTAGACGTACTAGGCCTGCAAAGTTTACTAGACAGCAAACTTGACGCAAATATTGCATTCGACGGCGATTATAATAGTTTAACAAATAAGCCGGGGTTAATAGATCTTCAAGATACATTTAGTCCTGCTGTACCTAATGGATTCTTACGGTGGAATAATTTAGGTACCTTAGTTGCATATCAAGATTACATATATCCGCAAGATATTTCAGGATTGTCAGATGTTGCTATATCGGGTCAGTATTCAGATTTATTGGGTACCCCTTCCTTATCGACTGTTGCTATAACCGGGAGTTATAGCGACTTAATTGATGCGCCGCCTGCGTTTGACGGCGATTATGATAGTTTAACAAATAAACCGTTTATTCCTACTAATTTTGATTTTAAATTTATAGGTTTGAATGATGTAAGTCCCACAGTTCAGCCCGGTGGCTATTTAAAATGGAACTTAGACGGTTCATTTGTTGTATCGTCAGCAAACATTCCTGCAACAGATGTAGCAGGATTGTCTGTTGTGTCTACAACCGGACAATATTCAGATTTATTAGGCAAACCGTTATTAGCTACAGTTTCTTCGTCGGGTAGTTATACTGATTTAATAAATATTCCTACTGAATTTAATCCAGCCGAACATACCCACAATATAGCAGACGTATCAGGATTACAGGCATCCCTAGACAATAAATTAAATACCTCTGATGCATTTAGTGGTGATTATAATGATTTAACCAACGCACCTACTAATAGTTCATATTCATTAGTGGGATTATCAGATACTAATTCTGTACCTGTTGCAAACGGATTCTTACGCTGGAATGCATCTGGAAGTAGTGTTGAATATATTCAAACAATTCCTGTAAATGCAATAACTGGATTGGCTCCTGTCGCATCATCTGGCCAGTATGCAGATTTGCAAGGAACACCGGATTTATCTGACTATGTTTTATCTGTATCATTAGCTGACATAGCTACGACTGGAGAATATTCAGATTTAATAAATGCACCCGATTTAAGTGTGTATGCTAATAAAACTGATCTGTCAGATGTAGCTACAACAGGACAATATTCGGATTTGTTGGGTATTCCTACGCAATTTACACCGACAGTTCATGTCCATAACGTTTCTCAAATAAGTGGATTAGCTACTGTTGCTACTAGCGGAAGTTATGATGATTTATCTAATAAACCGTCGTTTGCTAATGTTGCAACTACAGGCAGCTATGATGATCTAAACAATAAACCATCCATACCTACTAATGGCAGTTTTAGTTTACTTGGGTTAAATGATACAAATAATACGCCAGTTGCAGATGGTATATTGCGTTGGAATTCCAGTGCAAATCAGGTAATATATGCAAATACAATCGATGCACAATCTGTTTCTGGATTAGCTACTGTTGCGACTATAGGTAAACTATCTTCATTAAGTGATGTAGATTTAATAGGGTTGAACCAGAATGAAATATTGCAATGGAACGGTTCTGCATGGGTACCTGTACCTTATAATCCTAATCAAATACAAGCTTACATAGAGAGCGGAAATACAAAAGTTTCTACTAACGATATTTTAGATAGCATTGTTCTAACAGCAGGACCTACCACTGGAAATATAATATTCGAGTTAGGAAATACAAATAGCTCAATTATTCTAAATCCAGTTGCTAATAACGTAGATGCTCTTATTTCTTCTACTTCTAGAATAAAATTAGATTCATCTACTGGCATATCATTAGGTAATATAAGTTATCCAATGACCGACGGTACAGTTGGGCAAGCAGTAGTTACAAATGGAGCTGGCCAACTATCGTTTGAAACGGTAGTTAAACCCTCTCAATTGGCTACAGTTGCTACTAGTGGAAATTATAATGACTTAACTAATAAACCTACATTAGTAACTGAACTAAACGGACTTGCTGACGTTCGTATGCGTGATACTAATGGAAATTATTTAGCACAACCAGAGGATGTGTTAACATATTCTAACGGAATATGGCAAGCACGACCGAACACTAGTTCTTCTTTTATAGGTTTAAGCGATACCCAAAATATAACATTGCCAGAAGATAGGGCTAATGCATACTTACGTTGGGATACTACTGGAAATCTAATTATATACGAAGATAGTATTTCTGCAAGCGTAATTGCCGGATTAGCAGAAGTAGCAACCACAGGAGATTTGCACGATTTAATAAATGTAAATGTAAATTTACCTGATATGAACAATCCAGCTACACAAGCTGTTTGGGGTTTAATATGGGATCGTCAGAATCAACGTTGGATAAATTACAATTTACGTAATATAGCAGGTTCGGGTGGATCTACAGTAGTAGCATTGAATGACTTAACTGATGTTACTCTTACTTTCCCTGTAGTTGACGGTAATGTTCTTAGAGCAACTGTGCAACCAGACAATAGTATTGTTTGGCAGAACAAACAACTATCTTATAGTGACTTAACTGGAACTATAAGTATGAGTCTGTTGCAATTAACTGATACTAGTTCATCTGCTGTACCTAATGGATTCTTGCGGTGGGATTCATCGGGTAGCACAGTTCAGTATATTACTACAATAAGTACAAATGATATAACTGGGTTAGCTCCGGTTGCTACCAGTGGAAATTATAATGACTTATCTAATAAACCTGCTATACCGGCATCAATTAACGATTTAGCAGATGTTAATACCGTTAATCCTGTTCCTACAAACGGATATGTATTAACATGGGATAGTAGTTCGAATAATTGGATTGCAAAAGAACCTGCAACTAACCCATCTGGTAGTACAGCCCTAGCTGATCTAACAGATGTATCTCTATCTGATCTAGCTGCTAGTGATGTTTTAAAATACAACGGCACTACATGGGTAAACGAACCAGTTACGTATTCTGAATTAACAGATTTACCTACATTTGCGTTAGTTGCATTCAGTGGTGATTATAATGATTTAACTAATAAGCCATCGGGATCTACTACATCTATACTAGATCTAACTGACACTGCAGATACTGCACTACCCAACGGATTCTTGCGCTGGAACGCAAGCGGTGATGAGGTTTTATATCAATCATCTATTGATGTTTCTGATATAATAGGATTATCCGGTGTAGCTATAAGTGGTGATTATAACGATTTATCCAATAAACCGGAAAATAATTCGTATTATTTTAGAAAGTTAGCTGACGCAGGAAATCCGCAGCCTAATACATTTATAAAATATCCTGCGTTTACTATTCCGCCCGGTAGTGATATAGACGATGTTAATCCTATACTCGAATATGTAAGTAGCATAAATGCACTAACTGACATAGATAACCTAGCTCCGGTTGCTACTAACGGAATACTAGGAAGTTTAGTAGACGTAAATCTAAATTCAGTAGAAGACGGACAAGTTCTTACTTATGATGCTGTAACAAATAGCTGGATAAACAAAAATAGTTCAGGATCGCCGGTAGTAACTTCGTGGACAAAGATAAATGGCAACTATACTGTAACTGGCTCAGAATATTTATTGGTAGATACGACTTCTGCTAGTGTAACAATTACTCTGCCTGTTGCCCCTACCGAAAATATGGTAATTCGTATTGCTGATTGGAAAGGTACATTTAGAACAAATAGTTGCGTAGTGAATACCAATGGCATGCCTTTAATGGGTGCTAGCATGGATAACACACTAACTATTCAGAACCAAAATGCAAGTATAGAGTTAACATTTGTAGACACAACGTACGGTTGGAAAATAACAGATGGTATAGGTGAGATATCTAAACAAAACATTCCAGTTACGAACTGGCGTACTGTGGATTCATCTAGCACTCCTGCTATGCTAATAGCTCAACCGGGCGAAGCAATTTATGTTAATACCAACAATGGTGCAGTAACTGTTAAATTACCGACAGGAGCAAGTGTTAACGCTGTTGTCAGAATAGCTGACTTGTTAGGTACTTACGATAAAGCAAGTTGCTTTGTAGATGGCAACGGCAACCCAATAATGGGTAAAAACGAAATATTAGAAATTGCAAACGAAAATGCTTCTATAGAATTTACATACGTCGATTCGGTAGTCGGGTGGAAAGTAACAGACGGCATAGGTGAGTTAGGTAGAAAAACTGATATTGCATCTGATTCGGATATAATAGTTTATGTAGCTACAGACGGTAACGACACTACAGGAAGTGGAACCGAAGAATCTCCATTTGCTACATTAAATGCTGCTTTCCTTAGTCTAGATGGCAAATTTGTAAATAGTTCTGCAGAAATTATAGTTCGTGTTGCAGAAGGTGTCTACGAACCTACCAATCCTGTTGCGTTTAGTCACATTCAGGGAATGAATGTAAAACTTATAGGCGAATTGCCCCAAGCAAGTAGTTCATTCACTGTTACTAATATAACCAATGATGCAGGATTGGCAAAAGTAACAATGCAACTTTCTTCTGTCAGTGACTACGAAGTAGGGGACATTATAAAGATTACGTCGGCAGCAACTATGTTAGAATGTGTTGAAATTATAACAGCAATAAACACAGGATCTAATACTTTAGAGATAGTAATTCCTAATAGTGTATTAGCCGATGTATCTGACTATACTGGGTACACCGGAACTATATCTAAATTCACTACAGTATTTAAAAATACAAACATGTATGTAGCTGGCGGATATTCGTTAGGTTTCATAGATAACATAGCGTTAGTAGACGATACTGGATTAGGAACTGCACTTACTGTAGGAAGAACATATACCACAGGTATATATGATGGACCTGCGTATGTTGGTTTAGGTGCAAACTTTGCAGTATATGGATACGAAACTGCAATACAATCTATACCGGGTTCCAGTGTAGTATTGGCAGGAAATCTATGCAGGCAAGCAGGCGCTGCAATCCGTGCAGACGGTTCTATATTGTCATTTAATGCCGGACAATCTGTTTATATTGCAAACCAAGCACAAGATGGTATTGTGTTAAAACACGGAAGTAAACTAATACACAACGACGATGCTAGTCAATCGTTTGTATTTGTGATATTCAATAATATCAAATCCGGCACAATCCTGTCGTTAGATACAAGTATATCTACTGCTAATTTTGAAGTTAAAAACTCAGAAGGCATAATGATAGCTGCAACCAGACATAGTACAGTTGATGCTAGATCAGCTATTGTATCTGGAACAATAACGGGCGATTTAGAAGTAAATGCAACAGGCATGTCTGTAATCAGCATAAACGAACCTGCAGACAGTACAGATATACCATTAGCAGTTGTTTGTAATCCTGCTTATGGATCTAATATAGAATTACAAAAAGGTTACATAGGATTATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
17f1579f6cda087e0418c8c46f8e27befd2e20e49d193efb3dfcf2a1d6660a59
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,3666
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Integrative omics analysis of Pseudomonas aeruginosa virus PA5oct highlights the molecular complexity of jumbo phages Lood,C., Danis-Wlodarczyk,K., Blasdel,B.G., Jang,H.B., Vandenheuvel,D., Briers,Y., Noben,J.-P., van Noort,V., Drulis-Kawa,Z. and Lavigne,R. 2019 GenBank
Genomics, Transcriptomics, and structural analysis of Pseudomonas virus PA5oct highlights the molecular complexity among Jumbo phages Lood,C., Danis-Wlodarczyk,K., Blasdel,B., Jang,H.B., Vandenheuvel,D., Briers,Y., Noben,J.-P., Kawa,Z. and Lavigne,R. 2019-06-22 GenBank