Protein

View in Explore

Genbank accession

QCG76181.1 [GenBank]

Protein name

structural protein

RBP type

Evidence RBPdetect2

Probability 0,92

Protein sequence

MSIQSGPSVLNQFVPDFLIDSTPTNGQFLVYDDTVQAFVNSTNPRIVLDSSNILDGSITIDKLAISGNKVPGYVLTITSAGGMAFLPVPGSGRQLPSLGELLDTNIVSPTVTQYLKWDGSAWVNSNITLNDVSDVSVISPTADDVLAWESGSWTNKKIDYTSLTNKPDLSDVVRSSELSSVAFSGDYNDLVNIPSATSNTIVGLTDVNDTALPNGFLRWNASGDEVEFITSISATVITGLAPVATSGNYNDLLGKPNLSVYPLRTEFSTVATTGNYSDLNNVPLTFAPSAHTHPAAQITGLASVATSNDYNDLVNKPTAMAPTAHTHAISDIIGLQNSLDSKLTVNLTTRLPKDVIYFNGTSWINKQLSYTDISGTPNLDNYVTDSELSTVATTGRYSDLINKPELVENLNDLLDVDVSSKQTGNVLTWNGTAWVASAITQASIDWANISNKPSVFSPAAHTHDVVDVLGLQSLLDSKLDANIAFDGDYNSLTNKPGLIDLQDTFSPAVPNGFLRWNNLGTLVAYQDYIYPQDISGLSDVAISGQYSDLLGTPSLSTVAITGSYSDLIDAPPAFDGDYDSLTNKPFIPTNFDFKFIGLNDVSPTVQPGGYLKWNLDGSFVVSSANIPATDVAGLSVVSTTGQYSDLLGKPLLATVSSSGSYTDLINIPTEFNPAEHTHNIADVSGLQASLDNKLNTSDAFSGDYNDLTNAPTNSSYSLVGLSDTNSVPVANGFLRWNASGSSVEYIQTIPVNAITGLAPVASSGQYADLQGTPDLSDYVLSVSLADIATTGEYSDLINAPDLSVYANKTDLSDVATTGQYSDLLGIPTQFTPTVHVHNVSQISGLATVATSGSYDDLSNKPSFANVATTGSYDDLNNKPSIPTNGSFSLLGLNDTNNTPVADGILRWNSSANQVIYANTIDAQSVSGLATVATIGKLSSLSDVDLIGLNQNEILQWNGSAWVPVPYNPNQIQAYIESGNTKVSTNDILDSIVLTAGPTTGNIIFELGNTNSSIILNPVANNVDALISSTSRIKLDSSTGISLGNISYPMTDGTVGQAVVTNGAGQLSFETVVKPSQLATVATSGNYNDLTNKPTLVTELNGLADVRMRDTNGNYLAQPEDVLTYSNGIWQARPNTSSSFIGLSDTQNITLPEDRANAYLRWDTTGNLIIYEDSISASVIAGLAEVATTGDLHDLINVNVNLPDMNNPATQAVWGLIWDRQNQRWINYNLRNIAGSGGSTVVALNDLTDVTLTFPVVDGNVLRATVQPDNSIVWQNKQLSYSDLTGTISMSLLQLTDTSSSAVPNGFLRWDSSGSTVQYITTISTNDITGLAPVATSGNYNDLSNKPAIPASINDLADVNTVNPVPTNGYVLTWDSSSNNWIAKEPATNPSGSTALADLTDVSLSDLAASDVLKYNGTTWVNEPVTYSELTDLPTFALVAFSGDYNDLTNKPSGSTTSILDLTDTADTALPNGFLRWNASGDEVLYQSSIDVSDIIGLSGVAISGDYNDLSNKPENNSYYFRKLADAGNPQPNTFIKYPAFTIPPGSDIDDVNPILEYVSSINALTDIDNLAPVATNGILGSLVDVNLNSVEDGQVLTYDAVTNSWINKNSSGSPVVTSWTKINGNYTVTGSEYLLVDTTSASVTITLPVAPTENMVIRIADWKGTFRTNSCVVNTNGMPLMGASMDNTLTIQNQNASIELTFVDTTYGWKITDGIGEISKQNIPVTNWRTVDSSSTPAMLIAQPGEAIYVNTNNGAVTVKLPTGASVNAVVRIADLLGTYDKASCFVDGNGNPIMGKNEILEIANENASIEFTYVDSVVGWKVTDGIGELGRKTDIASDSDIIVYVATDGNDTTGSGTEESPFATLNAAFLSLDGKFVNSSAEIIVRVAEGVYEPTNPVAFSHIQGMNVKLIGELPQASSSFTVTNITNDAGLAKVTMQLSSVSDYEVGDIIKITSAATMLECVEIITAINTGSNTLEIVIPNSVLADVSDYTGYTGTISKFTTVFKNTNMYVAGGYSLGFIDNIALVDDTGLGTALTVGRTYTTGIYDGPAYVGLGANFAVYGYETAIQSIPGSSVVLAGNLCRQAGAAIRADGSILSFNAGQSVYIANQAQDGIVLKHGSKLIHNDDASQSFVFVIFNNIKSGTILSLDTSISTANFEVKNSEGIMIAATRHSTVDARSAIVSGTITGDLEVNATGMSVISINEPADSTDIPLAVVCNPAYGSNIELQKGYIGL

Physico‐chemical properties

protein length:	2236 AA
molecular weight:	236470,02320 Da
isoelectric point:	4,09703
aromaticity:	0,07424
hydropathy:	-0,02925

Domains

Domains [InterPro]

DC_0165
STR
1–261

DC_0165 DC_0755 PF12789 DC_0165 DC_1797 DC_0165 G3DSA:3.30.1910.20 DC_0829

PF12789
STR
324–347

PF12789 DC_0165 DC_0755 DC_0165

DC_0165
STR
691–785

DC_0165

QCG76181.1

1 2236

Architecture

STR

ATT

STR

ATT

STR

RBD

STR 1-261 | ATT 321-592 | STR 593-862 | STR 876-1118 | ATT 1119-1394 | STR 1395-1841 | RBD 1842-2236

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0165	STR	DC_0165	1	261	Novel HMM	DC_0165	Central	Low	Positional only	31 proteins / 31 hits
DC_0755	ATT	DC_0755	321	592	Novel HMM	DC_0755	N-terminal	Low	Positional only	28 proteins / 28 hits
PF12789	STR	DC_0212	324	347	InterPro cluster	PF12789	C-terminal	Low	Positional only	31 proteins / 33 hits
DC_0165	STR	DC_0165	559	699	Novel HMM	DC_0165	Central	Low	Positional only	31 proteins / 31 hits
PF12789	STR	DC_0212	675	695	InterPro cluster	PF12789	C-terminal	Low	Positional only	31 proteins / 33 hits
DC_0165	STR	DC_0165	691	785	Novel HMM	DC_0165	Central	Low	Positional only	31 proteins / 31 hits
DC_0165	STR	DC_0165	774	862	Novel HMM	DC_0165	Central	Low	Positional only	31 proteins / 31 hits
DC_1797	STR	DC_1797	876	1123	Novel HMM	DC_1797	Central	Low	Positional only	26 proteins / 26 hits
DC_0755	ATT	DC_0755	1119	1394	Novel HMM	DC_0755	N-terminal	Low	Positional only	28 proteins / 28 hits
DC_0165	STR	DC_0165	1384	1727	Novel HMM	DC_0165	Central	Low	Positional only	31 proteins / 31 hits
DC_0165	STR	DC_0165	1718	1841	Novel HMM	DC_0165	Central	Low	Positional only	31 proteins / 31 hits
G3DSA:3.30.1910.20	RBD	G3DSA:3.30.1910.20	1842	1908	Merged direct domain	G3DSA:3.30.1910.20	C-terminal	Low	Positional only	16 proteins / 16 hits
DC_0829	RBD	DC_0829	1909	2236	Novel HMM	DC_0829	C-terminal	Low	Positional only	10 proteins / 10 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage vB_PaeM_PA5oct [NCBI]	2163605	Uroviricota > Caudoviricetes > Arenbergviridae > Wroclawvirus PA5oct >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QCG76181.1 [NCBI]

Genbank nucleotide accession

MK797984 [NCBI]

CDS location

range 196408 -> 203118
strand +

CDS

ATGAGTATACAATCAGGTCCTTCTGTATTAAATCAATTTGTTCCAGATTTTCTGATAGATAGTACACCAACTAATGGTCAATTTTTAGTTTATGACGATACTGTCCAGGCATTTGTAAATAGCACAAATCCCAGAATCGTATTAGATTCGTCTAATATATTAGACGGTTCTATAACAATTGATAAACTTGCAATATCTGGTAATAAAGTACCTGGATACGTACTAACTATAACTTCCGCAGGCGGAATGGCATTTTTACCAGTACCTGGCAGCGGCAGACAGCTACCTAGTCTAGGTGAATTACTAGACACAAATATAGTATCTCCTACTGTAACCCAATATCTTAAATGGGACGGTTCTGCATGGGTTAATAGTAATATAACGTTAAATGATGTATCAGATGTCTCTGTTATCTCCCCTACAGCTGATGATGTATTAGCATGGGAATCAGGTTCTTGGACAAATAAGAAAATAGATTATACATCACTAACAAACAAACCAGATTTGAGTGATGTAGTTAGATCTAGCGAATTGTCATCAGTTGCATTCAGTGGTGATTATAATGATTTAGTAAATATTCCCAGTGCAACTTCTAATACTATAGTTGGATTAACAGATGTTAACGATACTGCACTACCCAACGGATTCTTGCGCTGGAACGCAAGTGGTGATGAGGTAGAATTTATTACTTCAATTTCTGCTACTGTAATAACCGGGTTAGCTCCAGTTGCTACTAGTGGAAATTATAATGACTTATTAGGAAAACCTAATTTGTCAGTGTATCCGCTTAGAACTGAATTTTCCACTGTTGCAACCACCGGTAATTATTCTGATTTGAACAATGTGCCTTTGACATTTGCACCAAGTGCGCATACTCACCCGGCTGCACAAATCACAGGATTGGCATCTGTAGCTACTAGCAACGATTATAACGATTTAGTTAATAAACCGACTGCAATGGCGCCAACCGCACATACGCATGCTATATCTGATATTATAGGATTGCAAAATTCGCTAGATAGTAAATTGACTGTCAATTTAACTACTAGACTTCCAAAAGATGTTATTTATTTTAACGGCACTTCATGGATAAACAAGCAATTATCTTATACTGATATTTCCGGTACTCCTAACTTAGATAACTATGTTACTGATTCAGAATTATCTACTGTTGCTACAACTGGCAGATATTCTGATTTAATAAATAAACCCGAGTTAGTAGAAAATTTAAACGACTTATTAGACGTAGATGTTTCTTCTAAACAGACAGGGAACGTATTAACCTGGAACGGAACAGCATGGGTTGCTAGTGCAATAACACAAGCAAGCATAGATTGGGCTAATATAAGCAATAAACCAAGCGTTTTTAGCCCCGCTGCGCATACACACGACGTAGTAGACGTACTAGGCCTGCAAAGTTTACTAGACAGCAAACTTGACGCAAATATTGCATTCGACGGCGATTATAATAGTTTAACAAATAAGCCGGGGTTAATAGATCTTCAAGATACATTTAGTCCTGCTGTACCTAATGGATTCTTACGGTGGAATAATTTAGGTACCTTAGTTGCATATCAAGATTACATATATCCGCAAGATATTTCAGGATTGTCAGATGTTGCTATATCGGGTCAGTATTCAGATTTATTGGGTACCCCTTCCTTATCGACTGTTGCTATAACCGGGAGTTATAGCGACTTAATTGATGCGCCGCCTGCGTTTGACGGCGATTATGATAGTTTAACAAATAAACCGTTTATTCCTACTAATTTTGATTTTAAATTTATAGGTTTGAATGATGTAAGTCCCACAGTTCAGCCCGGTGGCTATTTAAAATGGAACTTAGACGGTTCATTTGTTGTATCGTCAGCAAACATTCCTGCAACAGATGTAGCAGGATTGTCTGTTGTGTCTACAACCGGACAATATTCAGATTTATTAGGCAAACCGTTATTAGCTACAGTTTCTTCGTCGGGTAGTTATACTGATTTAATAAATATTCCTACTGAATTTAATCCAGCCGAACATACCCACAATATAGCAGACGTATCAGGATTACAGGCATCCCTAGACAATAAATTAAATACCTCTGATGCATTTAGTGGTGATTATAATGATTTAACCAACGCACCTACTAATAGTTCATATTCATTAGTGGGATTATCAGATACTAATTCTGTACCTGTTGCAAACGGATTCTTACGCTGGAATGCATCTGGAAGTAGTGTTGAATATATTCAAACAATTCCTGTAAATGCAATAACTGGATTGGCTCCTGTCGCATCATCTGGCCAGTATGCAGATTTGCAAGGAACACCGGATTTATCTGACTATGTTTTATCTGTATCATTAGCTGACATAGCTACGACTGGAGAATATTCAGATTTAATAAATGCACCCGATTTAAGTGTGTATGCTAATAAAACTGATCTGTCAGATGTAGCTACAACAGGACAATATTCGGATTTGTTGGGTATTCCTACGCAATTTACACCGACAGTTCATGTCCATAACGTTTCTCAAATAAGTGGATTAGCTACTGTTGCTACTAGCGGAAGTTATGATGATTTATCTAATAAACCGTCGTTTGCTAATGTTGCAACTACAGGCAGCTATGATGATCTAAACAATAAACCATCCATACCTACTAATGGCAGTTTTAGTTTACTTGGGTTAAATGATACAAATAATACGCCAGTTGCAGATGGTATATTGCGTTGGAATTCCAGTGCAAATCAGGTAATATATGCAAATACAATCGATGCACAATCTGTTTCTGGATTAGCTACTGTTGCGACTATAGGTAAACTATCTTCATTAAGTGATGTAGATTTAATAGGGTTGAACCAGAATGAAATATTGCAATGGAACGGTTCTGCATGGGTACCTGTACCTTATAATCCTAATCAAATACAAGCTTACATAGAGAGCGGAAATACAAAAGTTTCTACTAACGATATTTTAGATAGCATTGTTCTAACAGCAGGACCTACCACTGGAAATATAATATTCGAGTTAGGAAATACAAATAGCTCAATTATTCTAAATCCAGTTGCTAATAACGTAGATGCTCTTATTTCTTCTACTTCTAGAATAAAATTAGATTCATCTACTGGCATATCATTAGGTAATATAAGTTATCCAATGACCGACGGTACAGTTGGGCAAGCAGTAGTTACAAATGGAGCTGGCCAACTATCGTTTGAAACGGTAGTTAAACCCTCTCAATTGGCTACAGTTGCTACTAGTGGAAATTATAATGACTTAACTAATAAACCTACATTAGTAACTGAACTAAACGGACTTGCTGACGTTCGTATGCGTGATACTAATGGAAATTATTTAGCACAACCAGAGGATGTGTTAACATATTCTAACGGAATATGGCAAGCACGACCGAACACTAGTTCTTCTTTTATAGGTTTAAGCGATACCCAAAATATAACATTGCCAGAAGATAGGGCTAATGCATACTTACGTTGGGATACTACTGGAAATCTAATTATATACGAAGATAGTATTTCTGCAAGCGTAATTGCCGGATTAGCAGAAGTAGCAACCACAGGAGATTTGCACGATTTAATAAATGTAAATGTAAATTTACCTGATATGAACAATCCAGCTACACAAGCTGTTTGGGGTTTAATATGGGATCGTCAGAATCAACGTTGGATAAATTACAATTTACGTAATATAGCAGGTTCGGGTGGATCTACAGTAGTAGCATTGAATGACTTAACTGATGTTACTCTTACTTTCCCTGTAGTTGACGGTAATGTTCTTAGAGCAACTGTGCAACCAGACAATAGTATTGTTTGGCAGAACAAACAACTATCTTATAGTGACTTAACTGGAACTATAAGTATGAGTCTGTTGCAATTAACTGATACTAGTTCATCTGCTGTACCTAATGGATTCTTGCGGTGGGATTCATCGGGTAGCACAGTTCAGTATATTACTACAATAAGTACAAATGATATAACTGGGTTAGCTCCGGTTGCTACCAGTGGAAATTATAATGACTTATCTAATAAACCTGCTATACCGGCATCAATTAACGATTTAGCAGATGTTAATACCGTTAATCCTGTTCCTACAAACGGATATGTATTAACATGGGATAGTAGTTCGAATAATTGGATTGCAAAAGAACCTGCAACTAACCCATCTGGTAGTACAGCCCTAGCTGATCTAACAGATGTATCTCTATCTGATCTAGCTGCTAGTGATGTTTTAAAATACAACGGCACTACATGGGTAAACGAACCAGTTACGTATTCTGAATTAACAGATTTACCTACATTTGCGTTAGTTGCATTCAGTGGTGATTATAATGATTTAACTAATAAGCCATCGGGATCTACTACATCTATACTAGATCTAACTGACACTGCAGATACTGCACTACCCAACGGATTCTTGCGCTGGAACGCAAGCGGTGATGAGGTTTTATATCAATCATCTATTGATGTTTCTGATATAATAGGATTATCCGGTGTAGCTATAAGTGGTGATTATAACGATTTATCCAATAAACCGGAAAATAATTCGTATTATTTTAGAAAGTTAGCTGACGCAGGAAATCCGCAGCCTAATACATTTATAAAATATCCTGCGTTTACTATTCCGCCCGGTAGTGATATAGACGATGTTAATCCTATACTCGAATATGTAAGTAGCATAAATGCACTAACTGACATAGATAACCTAGCTCCGGTTGCTACTAACGGAATACTAGGAAGTTTAGTAGACGTAAATCTAAATTCAGTAGAAGACGGACAAGTTCTTACTTATGATGCTGTAACAAATAGCTGGATAAACAAAAATAGTTCAGGATCGCCGGTAGTAACTTCGTGGACAAAGATAAATGGCAACTATACTGTAACTGGCTCAGAATATTTATTGGTAGATACGACTTCTGCTAGTGTAACAATTACTCTGCCTGTTGCCCCTACCGAAAATATGGTAATTCGTATTGCTGATTGGAAAGGTACATTTAGAACAAATAGTTGCGTAGTGAATACCAATGGCATGCCTTTAATGGGTGCTAGCATGGATAACACACTAACTATTCAGAACCAAAATGCAAGTATAGAGTTAACATTTGTAGACACAACGTACGGTTGGAAAATAACAGATGGTATAGGTGAGATATCTAAACAAAACATTCCAGTTACGAACTGGCGTACTGTGGATTCATCTAGCACTCCTGCTATGCTAATAGCTCAACCGGGCGAAGCAATTTATGTTAATACCAACAATGGTGCAGTAACTGTTAAATTACCGACAGGAGCAAGTGTTAACGCTGTTGTCAGAATAGCTGACTTGTTAGGTACTTACGATAAAGCAAGTTGCTTTGTAGATGGCAACGGCAACCCAATAATGGGTAAAAACGAAATATTAGAAATTGCAAACGAAAATGCTTCTATAGAATTTACATACGTCGATTCGGTAGTCGGGTGGAAAGTAACAGACGGCATAGGTGAGTTAGGTAGAAAAACTGATATTGCATCTGATTCGGATATAATAGTTTATGTAGCTACAGACGGTAACGACACTACAGGAAGTGGAACCGAAGAATCTCCATTTGCTACATTAAATGCTGCTTTCCTTAGTCTAGATGGCAAATTTGTAAATAGTTCTGCAGAAATTATAGTTCGTGTTGCAGAAGGTGTCTACGAACCTACCAATCCTGTTGCGTTTAGTCACATTCAGGGAATGAATGTAAAACTTATAGGCGAATTGCCCCAAGCAAGTAGTTCATTCACTGTTACTAATATAACCAATGATGCAGGATTGGCAAAAGTAACAATGCAACTTTCTTCTGTCAGTGACTACGAAGTAGGGGACATTATAAAGATTACGTCGGCAGCAACTATGTTAGAATGTGTTGAAATTATAACAGCAATAAACACAGGATCTAATACTTTAGAGATAGTAATTCCTAATAGTGTATTAGCCGATGTATCTGACTATACTGGGTACACCGGAACTATATCTAAATTCACTACAGTATTTAAAAATACAAACATGTATGTAGCTGGCGGATATTCGTTAGGTTTCATAGATAACATAGCGTTAGTAGACGATACTGGATTAGGAACTGCACTTACTGTAGGAAGAACATATACCACAGGTATATATGATGGACCTGCGTATGTTGGTTTAGGTGCAAACTTTGCAGTATATGGATACGAAACTGCAATACAATCTATACCGGGTTCCAGTGTAGTATTGGCAGGAAATCTATGCAGGCAAGCAGGCGCTGCAATCCGTGCAGACGGTTCTATATTGTCATTTAATGCCGGACAATCTGTTTATATTGCAAACCAAGCACAAGATGGTATTGTGTTAAAACACGGAAGTAAACTAATACACAACGACGATGCTAGTCAATCGTTTGTATTTGTGATATTCAATAATATCAAATCCGGCACAATCCTGTCGTTAGATACAAGTATATCTACTGCTAATTTTGAAGTTAAAAACTCAGAAGGCATAATGATAGCTGCAACCAGACATAGTACAGTTGATGCTAGATCAGCTATTGTATCTGGAACAATAACGGGCGATTTAGAAGTAAATGCAACAGGCATGTCTGTAATCAGCATAAACGAACCTGCAGACAGTACAGATATACCATTAGCAGTTGTTTGTAATCCTGCTTATGGATCTAATATAGAATTACAAAAAGGTTACATAGGATTATAA

Genome Context

Tertiary structure

PDB ID

17f1579f6cda087e0418c8c46f8e27befd2e20e49d193efb3dfcf2a1d6660a59

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3666

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Integrative omics analysis of Pseudomonas aeruginosa virus PA5oct highlights the molecular complexity of jumbo phages	Lood,C., Danis-Wlodarczyk,K., Blasdel,B.G., Jang,H.B., Vandenheuvel,D., Briers,Y., Noben,J.-P., van Noort,V., Drulis-Kawa,Z. and Lavigne,R.	2019	—	GenBank
Genomics, Transcriptomics, and structural analysis of Pseudomonas virus PA5oct highlights the molecular complexity among Jumbo phages	Lood,C., Danis-Wlodarczyk,K., Blasdel,B., Jang,H.B., Vandenheuvel,D., Briers,Y., Noben,J.-P., Kawa,Z. and Lavigne,R.	2019-06-22	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature