Protein
View in Explore- Genbank accession
- QCG76181.1 [GenBank]
- Protein name
- structural protein
- RBP type
-
TF
- Protein sequence
-
MSIQSGPSVLNQFVPDFLIDSTPTNGQFLVYDDTVQAFVNSTNPRIVLDSSNILDGSITIDKLAISGNKVPGYVLTITSAGGMAFLPVPGSGRQLPSLGELLDTNIVSPTVTQYLKWDGSAWVNSNITLNDVSDVSVISPTADDVLAWESGSWTNKKIDYTSLTNKPDLSDVVRSSELSSVAFSGDYNDLVNIPSATSNTIVGLTDVNDTALPNGFLRWNASGDEVEFITSISATVITGLAPVATSGNYNDLLGKPNLSVYPLRTEFSTVATTGNYSDLNNVPLTFAPSAHTHPAAQITGLASVATSNDYNDLVNKPTAMAPTAHTHAISDIIGLQNSLDSKLTVNLTTRLPKDVIYFNGTSWINKQLSYTDISGTPNLDNYVTDSELSTVATTGRYSDLINKPELVENLNDLLDVDVSSKQTGNVLTWNGTAWVASAITQASIDWANISNKPSVFSPAAHTHDVVDVLGLQSLLDSKLDANIAFDGDYNSLTNKPGLIDLQDTFSPAVPNGFLRWNNLGTLVAYQDYIYPQDISGLSDVAISGQYSDLLGTPSLSTVAITGSYSDLIDAPPAFDGDYDSLTNKPFIPTNFDFKFIGLNDVSPTVQPGGYLKWNLDGSFVVSSANIPATDVAGLSVVSTTGQYSDLLGKPLLATVSSSGSYTDLINIPTEFNPAEHTHNIADVSGLQASLDNKLNTSDAFSGDYNDLTNAPTNSSYSLVGLSDTNSVPVANGFLRWNASGSSVEYIQTIPVNAITGLAPVASSGQYADLQGTPDLSDYVLSVSLADIATTGEYSDLINAPDLSVYANKTDLSDVATTGQYSDLLGIPTQFTPTVHVHNVSQISGLATVATSGSYDDLSNKPSFANVATTGSYDDLNNKPSIPTNGSFSLLGLNDTNNTPVADGILRWNSSANQVIYANTIDAQSVSGLATVATIGKLSSLSDVDLIGLNQNEILQWNGSAWVPVPYNPNQIQAYIESGNTKVSTNDILDSIVLTAGPTTGNIIFELGNTNSSIILNPVANNVDALISSTSRIKLDSSTGISLGNISYPMTDGTVGQAVVTNGAGQLSFETVVKPSQLATVATSGNYNDLTNKPTLVTELNGLADVRMRDTNGNYLAQPEDVLTYSNGIWQARPNTSSSFIGLSDTQNITLPEDRANAYLRWDTTGNLIIYEDSISASVIAGLAEVATTGDLHDLINVNVNLPDMNNPATQAVWGLIWDRQNQRWINYNLRNIAGSGGSTVVALNDLTDVTLTFPVVDGNVLRATVQPDNSIVWQNKQLSYSDLTGTISMSLLQLTDTSSSAVPNGFLRWDSSGSTVQYITTISTNDITGLAPVATSGNYNDLSNKPAIPASINDLADVNTVNPVPTNGYVLTWDSSSNNWIAKEPATNPSGSTALADLTDVSLSDLAASDVLKYNGTTWVNEPVTYSELTDLPTFALVAFSGDYNDLTNKPSGSTTSILDLTDTADTALPNGFLRWNASGDEVLYQSSIDVSDIIGLSGVAISGDYNDLSNKPENNSYYFRKLADAGNPQPNTFIKYPAFTIPPGSDIDDVNPILEYVSSINALTDIDNLAPVATNGILGSLVDVNLNSVEDGQVLTYDAVTNSWINKNSSGSPVVTSWTKINGNYTVTGSEYLLVDTTSASVTITLPVAPTENMVIRIADWKGTFRTNSCVVNTNGMPLMGASMDNTLTIQNQNASIELTFVDTTYGWKITDGIGEISKQNIPVTNWRTVDSSSTPAMLIAQPGEAIYVNTNNGAVTVKLPTGASVNAVVRIADLLGTYDKASCFVDGNGNPIMGKNEILEIANENASIEFTYVDSVVGWKVTDGIGELGRKTDIASDSDIIVYVATDGNDTTGSGTEESPFATLNAAFLSLDGKFVNSSAEIIVRVAEGVYEPTNPVAFSHIQGMNVKLIGELPQASSSFTVTNITNDAGLAKVTMQLSSVSDYEVGDIIKITSAATMLECVEIITAINTGSNTLEIVIPNSVLADVSDYTGYTGTISKFTTVFKNTNMYVAGGYSLGFIDNIALVDDTGLGTALTVGRTYTTGIYDGPAYVGLGANFAVYGYETAIQSIPGSSVVLAGNLCRQAGAAIRADGSILSFNAGQSVYIANQAQDGIVLKHGSKLIHNDDASQSFVFVIFNNIKSGTILSLDTSISTANFEVKNSEGIMIAATRHSTVDARSAIVSGTITGDLEVNATGMSVISINEPADSTDIPLAVVCNPAYGSNIELQKGYIGL
- Physico‐chemical
properties -
protein length: 2236 AA molecular weight: 236470,02320 Da isoelectric point: 4,09703 aromaticity: 0,07424 hydropathy: -0,02925
Domains
Domains [InterPro]
DC_0165
STR
1–261
STR
1–261
PF12789
STR
324–347
STR
324–347
DC_0165
STR
691–785
STR
691–785
1
2236
Architecture
STR 1-261 | ATT 321-592 | STR 593-862 | STR 876-1118 | ATT 1119-1394 | STR 1395-1841 | RBD 1842-2236
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Pseudomonas phage vB_PaeM_PA5oct [NCBI] |
2163605 | Uroviricota > Caudoviricetes > Arenbergviridae > Wroclawvirus PA5oct > |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
QCG76181.1
[NCBI]
Genbank nucleotide accession
MK797984
[NCBI]
CDS location
range 196408 -> 203118
strand +
strand +
CDS
ATGAGTATACAATCAGGTCCTTCTGTATTAAATCAATTTGTTCCAGATTTTCTGATAGATAGTACACCAACTAATGGTCAATTTTTAGTTTATGACGATACTGTCCAGGCATTTGTAAATAGCACAAATCCCAGAATCGTATTAGATTCGTCTAATATATTAGACGGTTCTATAACAATTGATAAACTTGCAATATCTGGTAATAAAGTACCTGGATACGTACTAACTATAACTTCCGCAGGCGGAATGGCATTTTTACCAGTACCTGGCAGCGGCAGACAGCTACCTAGTCTAGGTGAATTACTAGACACAAATATAGTATCTCCTACTGTAACCCAATATCTTAAATGGGACGGTTCTGCATGGGTTAATAGTAATATAACGTTAAATGATGTATCAGATGTCTCTGTTATCTCCCCTACAGCTGATGATGTATTAGCATGGGAATCAGGTTCTTGGACAAATAAGAAAATAGATTATACATCACTAACAAACAAACCAGATTTGAGTGATGTAGTTAGATCTAGCGAATTGTCATCAGTTGCATTCAGTGGTGATTATAATGATTTAGTAAATATTCCCAGTGCAACTTCTAATACTATAGTTGGATTAACAGATGTTAACGATACTGCACTACCCAACGGATTCTTGCGCTGGAACGCAAGTGGTGATGAGGTAGAATTTATTACTTCAATTTCTGCTACTGTAATAACCGGGTTAGCTCCAGTTGCTACTAGTGGAAATTATAATGACTTATTAGGAAAACCTAATTTGTCAGTGTATCCGCTTAGAACTGAATTTTCCACTGTTGCAACCACCGGTAATTATTCTGATTTGAACAATGTGCCTTTGACATTTGCACCAAGTGCGCATACTCACCCGGCTGCACAAATCACAGGATTGGCATCTGTAGCTACTAGCAACGATTATAACGATTTAGTTAATAAACCGACTGCAATGGCGCCAACCGCACATACGCATGCTATATCTGATATTATAGGATTGCAAAATTCGCTAGATAGTAAATTGACTGTCAATTTAACTACTAGACTTCCAAAAGATGTTATTTATTTTAACGGCACTTCATGGATAAACAAGCAATTATCTTATACTGATATTTCCGGTACTCCTAACTTAGATAACTATGTTACTGATTCAGAATTATCTACTGTTGCTACAACTGGCAGATATTCTGATTTAATAAATAAACCCGAGTTAGTAGAAAATTTAAACGACTTATTAGACGTAGATGTTTCTTCTAAACAGACAGGGAACGTATTAACCTGGAACGGAACAGCATGGGTTGCTAGTGCAATAACACAAGCAAGCATAGATTGGGCTAATATAAGCAATAAACCAAGCGTTTTTAGCCCCGCTGCGCATACACACGACGTAGTAGACGTACTAGGCCTGCAAAGTTTACTAGACAGCAAACTTGACGCAAATATTGCATTCGACGGCGATTATAATAGTTTAACAAATAAGCCGGGGTTAATAGATCTTCAAGATACATTTAGTCCTGCTGTACCTAATGGATTCTTACGGTGGAATAATTTAGGTACCTTAGTTGCATATCAAGATTACATATATCCGCAAGATATTTCAGGATTGTCAGATGTTGCTATATCGGGTCAGTATTCAGATTTATTGGGTACCCCTTCCTTATCGACTGTTGCTATAACCGGGAGTTATAGCGACTTAATTGATGCGCCGCCTGCGTTTGACGGCGATTATGATAGTTTAACAAATAAACCGTTTATTCCTACTAATTTTGATTTTAAATTTATAGGTTTGAATGATGTAAGTCCCACAGTTCAGCCCGGTGGCTATTTAAAATGGAACTTAGACGGTTCATTTGTTGTATCGTCAGCAAACATTCCTGCAACAGATGTAGCAGGATTGTCTGTTGTGTCTACAACCGGACAATATTCAGATTTATTAGGCAAACCGTTATTAGCTACAGTTTCTTCGTCGGGTAGTTATACTGATTTAATAAATATTCCTACTGAATTTAATCCAGCCGAACATACCCACAATATAGCAGACGTATCAGGATTACAGGCATCCCTAGACAATAAATTAAATACCTCTGATGCATTTAGTGGTGATTATAATGATTTAACCAACGCACCTACTAATAGTTCATATTCATTAGTGGGATTATCAGATACTAATTCTGTACCTGTTGCAAACGGATTCTTACGCTGGAATGCATCTGGAAGTAGTGTTGAATATATTCAAACAATTCCTGTAAATGCAATAACTGGATTGGCTCCTGTCGCATCATCTGGCCAGTATGCAGATTTGCAAGGAACACCGGATTTATCTGACTATGTTTTATCTGTATCATTAGCTGACATAGCTACGACTGGAGAATATTCAGATTTAATAAATGCACCCGATTTAAGTGTGTATGCTAATAAAACTGATCTGTCAGATGTAGCTACAACAGGACAATATTCGGATTTGTTGGGTATTCCTACGCAATTTACACCGACAGTTCATGTCCATAACGTTTCTCAAATAAGTGGATTAGCTACTGTTGCTACTAGCGGAAGTTATGATGATTTATCTAATAAACCGTCGTTTGCTAATGTTGCAACTACAGGCAGCTATGATGATCTAAACAATAAACCATCCATACCTACTAATGGCAGTTTTAGTTTACTTGGGTTAAATGATACAAATAATACGCCAGTTGCAGATGGTATATTGCGTTGGAATTCCAGTGCAAATCAGGTAATATATGCAAATACAATCGATGCACAATCTGTTTCTGGATTAGCTACTGTTGCGACTATAGGTAAACTATCTTCATTAAGTGATGTAGATTTAATAGGGTTGAACCAGAATGAAATATTGCAATGGAACGGTTCTGCATGGGTACCTGTACCTTATAATCCTAATCAAATACAAGCTTACATAGAGAGCGGAAATACAAAAGTTTCTACTAACGATATTTTAGATAGCATTGTTCTAACAGCAGGACCTACCACTGGAAATATAATATTCGAGTTAGGAAATACAAATAGCTCAATTATTCTAAATCCAGTTGCTAATAACGTAGATGCTCTTATTTCTTCTACTTCTAGAATAAAATTAGATTCATCTACTGGCATATCATTAGGTAATATAAGTTATCCAATGACCGACGGTACAGTTGGGCAAGCAGTAGTTACAAATGGAGCTGGCCAACTATCGTTTGAAACGGTAGTTAAACCCTCTCAATTGGCTACAGTTGCTACTAGTGGAAATTATAATGACTTAACTAATAAACCTACATTAGTAACTGAACTAAACGGACTTGCTGACGTTCGTATGCGTGATACTAATGGAAATTATTTAGCACAACCAGAGGATGTGTTAACATATTCTAACGGAATATGGCAAGCACGACCGAACACTAGTTCTTCTTTTATAGGTTTAAGCGATACCCAAAATATAACATTGCCAGAAGATAGGGCTAATGCATACTTACGTTGGGATACTACTGGAAATCTAATTATATACGAAGATAGTATTTCTGCAAGCGTAATTGCCGGATTAGCAGAAGTAGCAACCACAGGAGATTTGCACGATTTAATAAATGTAAATGTAAATTTACCTGATATGAACAATCCAGCTACACAAGCTGTTTGGGGTTTAATATGGGATCGTCAGAATCAACGTTGGATAAATTACAATTTACGTAATATAGCAGGTTCGGGTGGATCTACAGTAGTAGCATTGAATGACTTAACTGATGTTACTCTTACTTTCCCTGTAGTTGACGGTAATGTTCTTAGAGCAACTGTGCAACCAGACAATAGTATTGTTTGGCAGAACAAACAACTATCTTATAGTGACTTAACTGGAACTATAAGTATGAGTCTGTTGCAATTAACTGATACTAGTTCATCTGCTGTACCTAATGGATTCTTGCGGTGGGATTCATCGGGTAGCACAGTTCAGTATATTACTACAATAAGTACAAATGATATAACTGGGTTAGCTCCGGTTGCTACCAGTGGAAATTATAATGACTTATCTAATAAACCTGCTATACCGGCATCAATTAACGATTTAGCAGATGTTAATACCGTTAATCCTGTTCCTACAAACGGATATGTATTAACATGGGATAGTAGTTCGAATAATTGGATTGCAAAAGAACCTGCAACTAACCCATCTGGTAGTACAGCCCTAGCTGATCTAACAGATGTATCTCTATCTGATCTAGCTGCTAGTGATGTTTTAAAATACAACGGCACTACATGGGTAAACGAACCAGTTACGTATTCTGAATTAACAGATTTACCTACATTTGCGTTAGTTGCATTCAGTGGTGATTATAATGATTTAACTAATAAGCCATCGGGATCTACTACATCTATACTAGATCTAACTGACACTGCAGATACTGCACTACCCAACGGATTCTTGCGCTGGAACGCAAGCGGTGATGAGGTTTTATATCAATCATCTATTGATGTTTCTGATATAATAGGATTATCCGGTGTAGCTATAAGTGGTGATTATAACGATTTATCCAATAAACCGGAAAATAATTCGTATTATTTTAGAAAGTTAGCTGACGCAGGAAATCCGCAGCCTAATACATTTATAAAATATCCTGCGTTTACTATTCCGCCCGGTAGTGATATAGACGATGTTAATCCTATACTCGAATATGTAAGTAGCATAAATGCACTAACTGACATAGATAACCTAGCTCCGGTTGCTACTAACGGAATACTAGGAAGTTTAGTAGACGTAAATCTAAATTCAGTAGAAGACGGACAAGTTCTTACTTATGATGCTGTAACAAATAGCTGGATAAACAAAAATAGTTCAGGATCGCCGGTAGTAACTTCGTGGACAAAGATAAATGGCAACTATACTGTAACTGGCTCAGAATATTTATTGGTAGATACGACTTCTGCTAGTGTAACAATTACTCTGCCTGTTGCCCCTACCGAAAATATGGTAATTCGTATTGCTGATTGGAAAGGTACATTTAGAACAAATAGTTGCGTAGTGAATACCAATGGCATGCCTTTAATGGGTGCTAGCATGGATAACACACTAACTATTCAGAACCAAAATGCAAGTATAGAGTTAACATTTGTAGACACAACGTACGGTTGGAAAATAACAGATGGTATAGGTGAGATATCTAAACAAAACATTCCAGTTACGAACTGGCGTACTGTGGATTCATCTAGCACTCCTGCTATGCTAATAGCTCAACCGGGCGAAGCAATTTATGTTAATACCAACAATGGTGCAGTAACTGTTAAATTACCGACAGGAGCAAGTGTTAACGCTGTTGTCAGAATAGCTGACTTGTTAGGTACTTACGATAAAGCAAGTTGCTTTGTAGATGGCAACGGCAACCCAATAATGGGTAAAAACGAAATATTAGAAATTGCAAACGAAAATGCTTCTATAGAATTTACATACGTCGATTCGGTAGTCGGGTGGAAAGTAACAGACGGCATAGGTGAGTTAGGTAGAAAAACTGATATTGCATCTGATTCGGATATAATAGTTTATGTAGCTACAGACGGTAACGACACTACAGGAAGTGGAACCGAAGAATCTCCATTTGCTACATTAAATGCTGCTTTCCTTAGTCTAGATGGCAAATTTGTAAATAGTTCTGCAGAAATTATAGTTCGTGTTGCAGAAGGTGTCTACGAACCTACCAATCCTGTTGCGTTTAGTCACATTCAGGGAATGAATGTAAAACTTATAGGCGAATTGCCCCAAGCAAGTAGTTCATTCACTGTTACTAATATAACCAATGATGCAGGATTGGCAAAAGTAACAATGCAACTTTCTTCTGTCAGTGACTACGAAGTAGGGGACATTATAAAGATTACGTCGGCAGCAACTATGTTAGAATGTGTTGAAATTATAACAGCAATAAACACAGGATCTAATACTTTAGAGATAGTAATTCCTAATAGTGTATTAGCCGATGTATCTGACTATACTGGGTACACCGGAACTATATCTAAATTCACTACAGTATTTAAAAATACAAACATGTATGTAGCTGGCGGATATTCGTTAGGTTTCATAGATAACATAGCGTTAGTAGACGATACTGGATTAGGAACTGCACTTACTGTAGGAAGAACATATACCACAGGTATATATGATGGACCTGCGTATGTTGGTTTAGGTGCAAACTTTGCAGTATATGGATACGAAACTGCAATACAATCTATACCGGGTTCCAGTGTAGTATTGGCAGGAAATCTATGCAGGCAAGCAGGCGCTGCAATCCGTGCAGACGGTTCTATATTGTCATTTAATGCCGGACAATCTGTTTATATTGCAAACCAAGCACAAGATGGTATTGTGTTAAAACACGGAAGTAAACTAATACACAACGACGATGCTAGTCAATCGTTTGTATTTGTGATATTCAATAATATCAAATCCGGCACAATCCTGTCGTTAGATACAAGTATATCTACTGCTAATTTTGAAGTTAAAAACTCAGAAGGCATAATGATAGCTGCAACCAGACATAGTACAGTTGATGCTAGATCAGCTATTGTATCTGGAACAATAACGGGCGATTTAGAAGTAAATGCAACAGGCATGTCTGTAATCAGCATAAACGAACCTGCAGACAGTACAGATATACCATTAGCAGTTGTTTGTAATCCTGCTTATGGATCTAATATAGAATTACAAAAAGGTTACATAGGATTATAA
Genome Context
Genome Context
Tertiary structure
PDB ID
17f1579f6cda087e0418c8c46f8e27befd2e20e49d193efb3dfcf2a1d6660a59
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| Integrative omics analysis of Pseudomonas aeruginosa virus PA5oct highlights the molecular complexity of jumbo phages | Lood,C., Danis-Wlodarczyk,K., Blasdel,B.G., Jang,H.B., Vandenheuvel,D., Briers,Y., Noben,J.-P., van Noort,V., Drulis-Kawa,Z. and Lavigne,R. | 2019 | — | GenBank |
| Genomics, Transcriptomics, and structural analysis of Pseudomonas virus PA5oct highlights the molecular complexity among Jumbo phages | Lood,C., Danis-Wlodarczyk,K., Blasdel,B., Jang,H.B., Vandenheuvel,D., Briers,Y., Noben,J.-P., Kawa,Z. and Lavigne,R. | 2019-06-22 | — | GenBank |