Phage RBP Database

Genbank accession

WJZ47902.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TF

Evidence RBPdetect2

Probability 0,94

Protein sequence

MSTPIRIRRSAVPGKVPTVDQVQLGELAVNTYDGKAFLKKDVSGVESIVNIGGGYPGKTYFVTDEGLDTNDGESISSALATLKHALSLTVAGDTVELSSGTFTEIFPLTVPQGVIVRGKGIRSTIIEPTSGTERNDAFLLNGETTIEELTITNFYYNSSADTGYGFRFAPNMVTTTRSPYVQRVTVLTRGSDTSASDPYGFETADNYPTSKVAGRGAFIDGSVVSSATLEPAMLFNEATFITPNQTGLKMTNGARTEWVNCFTYFSSVSVDGFSGSVGVGSSANATLKLSGISTTVSANQVIKYYQSGSPVAIGTVVSTDGDYITISGKGSGVFNSVGLGSAQDVRIFESDGVTQVGTASTILWADYQKFGADMRSIGSASNFGTVGVRGDGVGVQLRLFGYNFGCVGSGKTFTQDPTLTVRANEAIQLNGGRVYFQSVDQAGNFRVGNIFEISQETGAVSLASTSDITINGTATIQNLSVTGVSTFANPVEFDSNVYVSGISTFANNVAITGFTTFSSDSMLGSNLNVAGITTTATFRVTGISTLMGDVELESNLRVAGVSTFNSSLMVNDDLNISGITTTATFRVTGISTLMGDVEINNNIRVSGIGTINNLRVTGVSTLSGDVNLTNNLNVLGITTTGNFRVTGVSTLTGDTNFTNNVNIAGITTTTTFRVTGISTLTGDVELNNALRVAGVSTFNSPSMINSNLNVTGITTTGNFRVTGISTLTGDVELSNALRVAGVSTFNSPSMINSNLNVTGITTTGNFRVTGVSTLSGDVNLSNNLNISGITTTATFRVTGISTLTGDVELSNALRVAGVSTFNSSAMINSNLNVTGITTTGNFRVTGVSTLTGDTNFTNNVNIGGITTTSTFRVTGISTLSGDVELSNNLRVAGVSTFNSPAMVNSNLNVTGITTTGNFRVTGVSTLTGDTNFTNNVNVSGITTTATFRVTGISTLTGDVELSNALRVAGVSTFNSPSMINSNLNVTGLTTTGNLRVAGVTTLAGSTRLDSNLYVAGITTLASPLYATSATLSDNVIINSNLTVAGNVTIGGTTIALTAQELKIKDKAIILGITTNAVDADVSTDTSANYGGIAIASTEGSPLVPLFVTGINTSPNTYKQWVWVKNNTMGAGTTDAWLSNYAVGIGSTVVPNGVRLSVGGIQLTDTNVTATKFIGRDGDISYLSGTNLYYSGIGSISTFNSNVGIVTYFTATNARVTGVSTFANVQIGFGNTALIVSGDARVTGILTIGTSSITLKGTTNEVFVGANTRIHTSGYDIGSSFVHSTGVELVNARFSGITTYTNSGNNIVQTAGTAALNNITIAGVSTFTGQLNAASIVVTGVGINTFAYLRVTNDANIENLYNVTGVVTTISGENLYYTTGIVTNFTSTVSAIETITANDATIGVSTITTLYNTTGNIQTLTGGTFTANSFIGTSNYISGTGYVESLTFNVGVGTTATFTDTNVNGTLTANNVNVTGSTYYNTIAAGLVTANTGIITNFSSSYFASNATSVGITTADIALGITTSVIGISTLNINTGDEVSAVSIPAGTLVTGISTTASEIFINNNTTNVAISTELVTIVRSNNAGISTFKTAYINVGIVTSLSVQGINVTGILTAINVNVSSAATINRVDANNVLIGVGTINTFISTDSYISNAYISTSYSATGIITQANITNASILGIATITDLVVSSGATIANLGISNVIANVGIITSLTATSAYVGVSTVSTLNFNVGFATNFDATRAVIGIATITTLDATNALVSGVTTANTLYSNIGSVTSINGTDLYYIGISTADNFYSNIGFVTFVSGTNLDYSGIGSISTFRSNVGFVTFVSGTNLNYSGVGTINTLYSDVGIVTTLSGTRLTYSDFTNTYLYNSGIGSISTLNVNVGFVTFVSGTNLQYLGVGTISNLYGVGIGYTSADLEYITNINIESSGIGTVSTLYSNVGFVTTISGTRATYDQADLTDTYTTGVSSISNLKANVGVVTFASGTNINYAGVGTINFLNGTNLYYTGVTTLGIVTALSITTQDFDLGGGALNFTGVATFFNLNSTNATAQFLSGTNFNYSGIGTVAFLNSVNIDNSGFTTTGSLHVGVGGSLFSVVSGIGSVGIGTTAAREALHVYGNIMYGDNTNTGTVRVAVTTTSPITIHETLSRLEYRSVEYQIQASTSGTGTTTGRYQFTKILSVHNGTIAYNVEYANVGTGVTDVATYEVDIDEGLDAGYIRLQATPAQVGVTTFIINFNGFRI

Physico‐chemical properties

protein length:	2241 AA
molecular weight:	231339,10260 Da
isoelectric point:	4,61819
aromaticity:	0,07898
hydropathy:	0,23672

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0763	STR	DC_0763	10	601	Novel HMM	DC_0763	Central	Low	Positional only	71 proteins / 71 hits
IPR011050	STR	IPR011050	55	447	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_0407	STR	DC_0407	673	796	Novel HMM	DC_0407	Central	Low	Positional only	72 proteins / 72 hits
DC_0407	STR	DC_0407	796	872	Novel HMM	DC_0407	Central	Low	Positional only	72 proteins / 72 hits
DC_0407	STR	DC_0407	871	948	Novel HMM	DC_0407	Central	Low	Positional only	72 proteins / 72 hits
DC_0407	STR	DC_0407	947	1138	Novel HMM	DC_0407	Central	Low	Positional only	72 proteins / 72 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WJZ47902.1

1 2241

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	112	112	0,7906
Central domain	113	1111	1000	0,6677
C-terminal	1112	2241	1129	0,1480

Note: Constraints were applied during segmentation.
Fixed 16 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-112

Central
113-1111

C-terminal
1112-2241

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage DSL-LC03 [NCBI]	3058961	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae

Coding sequence (CDS)

Genbank protein accession

WJZ47902.1 [NCBI]

Genbank nucleotide accession

OR003938 [NCBI]

CDS location

range 48604 -> 55329
strand +

CDS

ATGTCTACACCAATCAGAATACGTAGAAGTGCTGTACCTGGAAAAGTCCCAACAGTTGATCAGGTCCAGTTAGGCGAATTAGCCGTAAACACTTATGATGGTAAGGCGTTTTTAAAGAAAGATGTAAGTGGTGTAGAGTCGATTGTTAATATTGGTGGTGGGTATCCAGGTAAGACATATTTTGTTACTGACGAAGGTTTAGATACAAATGATGGCGAGAGCATCTCCAGTGCTCTTGCCACGCTTAAACATGCCTTAAGTTTAACAGTTGCAGGAGACACTGTTGAACTGTCTTCAGGCACCTTTACAGAGATATTTCCACTCACAGTACCACAAGGGGTTATTGTACGTGGTAAGGGTATACGTTCTACGATCATTGAACCAACTTCAGGTACAGAAAGAAATGATGCTTTCTTACTGAATGGTGAGACTACAATTGAAGAACTAACTATAACCAACTTTTATTATAATTCTTCAGCAGATACTGGTTATGGTTTCAGATTTGCTCCTAACATGGTTACGACCACTAGGAGTCCTTATGTACAGAGAGTTACTGTACTTACAAGAGGTTCTGATACAAGTGCATCTGATCCTTATGGATTTGAGACTGCTGATAACTATCCAACCTCAAAGGTGGCAGGTCGTGGTGCATTTATTGATGGTAGTGTAGTCAGTTCTGCTACACTAGAGCCAGCAATGCTCTTTAATGAAGCTACCTTCATTACACCAAATCAAACTGGTCTGAAAATGACCAATGGTGCAAGAACTGAGTGGGTTAACTGTTTTACTTACTTCTCTAGTGTTTCTGTTGACGGTTTTTCTGGTAGCGTAGGTGTTGGTAGCAGTGCAAATGCAACCCTAAAGTTATCAGGAATTAGCACAACTGTTAGTGCAAATCAAGTCATTAAGTATTACCAAAGTGGTTCTCCTGTAGCTATCGGTACTGTTGTATCTACTGATGGAGATTATATCACAATTAGTGGTAAGGGTTCTGGTGTTTTCAATTCTGTAGGACTTGGTTCTGCACAAGACGTTAGAATCTTCGAGTCTGACGGTGTAACTCAGGTAGGTACTGCAAGTACAATTCTTTGGGCAGATTATCAGAAGTTTGGTGCTGATATGAGATCCATTGGATCTGCATCAAACTTTGGTACTGTTGGTGTTCGTGGTGATGGAGTTGGAGTACAATTAAGACTCTTTGGATATAACTTTGGTTGTGTTGGTTCTGGTAAGACCTTCACACAAGATCCAACACTTACTGTTCGTGCAAACGAGGCAATTCAATTAAATGGTGGACGTGTATATTTCCAATCGGTAGATCAAGCTGGAAACTTTAGAGTTGGTAATATCTTTGAGATTAGTCAAGAAACTGGTGCTGTATCGCTTGCAAGTACAAGTGACATTACAATTAATGGTACGGCAACTATTCAAAACTTAAGTGTAACTGGTGTTTCTACTTTTGCCAATCCAGTTGAGTTTGATAGTAATGTTTATGTTTCTGGTATCTCCACATTTGCTAACAATGTAGCAATTACTGGATTCACTACATTCTCTAGTGATAGCATGTTGGGCAGCAACTTAAATGTTGCTGGAATCACTACAACTGCCACCTTTAGAGTTACTGGCATCTCTACACTCATGGGAGATGTTGAACTTGAAAGTAACCTAAGAGTTGCTGGAGTATCCACATTCAATTCATCATTGATGGTAAATGATGATTTGAATATTAGTGGAATTACTACAACTGCTACCTTTAGGGTTACTGGAATTTCTACATTAATGGGTGATGTAGAAATTAATAATAATATTCGTGTATCTGGTATTGGTACAATTAACAATCTTAGAGTTACTGGTGTTTCTACTCTGAGTGGAGATGTTAATTTAACTAATAATTTAAATGTTCTAGGCATTACAACCACTGGCAACTTTAGAGTTACTGGTGTTTCTACATTAACTGGAGACACAAATTTCACTAATAATGTTAATATTGCTGGAATTACTACAACTACTACCTTTAGGGTTACTGGAATTTCAACATTAACTGGTGACGTTGAATTGAATAATGCACTAAGAGTTGCTGGTGTTTCCACCTTCAATTCACCATCAATGATCAACAGTAACTTAAATGTTACTGGAATTACCACTACTGGAAACTTCAGAGTTACTGGTATCTCAACATTAACTGGTGATGTTGAACTAAGTAATGCATTAAGAGTTGCTGGAGTATCTACCTTCAATTCACCATCAATGATCAACAGTAACTTAAATGTTACTGGAATTACTACCACTGGTAACTTTAGAGTTACTGGTGTTTCTACTTTAAGCGGAGATGTTAATTTATCCAATAATTTAAATATCTCTGGAATTACTACAACTGCAACATTTAGAGTTACTGGAATTTCTACTTTAACTGGTGATGTTGAATTAAGTAATGCATTACGTGTTGCTGGAGTATCCACATTCAATTCTTCTGCAATGATTAACAGTAACTTAAATGTTACTGGTATCACTACTACAGGAAACTTTAGAGTTACTGGTGTTTCAACTCTAACTGGAGATACTAATTTTACTAATAATGTTAATATTGGTGGAATTACCACTACATCAACATTCAGAGTTACTGGAATATCTACTCTGTCTGGAGATGTTGAATTAAGCAATAATTTAAGAGTTGCTGGTGTATCCACATTTAATTCACCTGCAATGGTTAATAGTAACTTAAATGTTACTGGAATTACCACTACTGGAAACTTTAGAGTTACTGGAGTATCAACATTAACAGGCGATACGAATTTCACCAACAATGTTAATGTCAGTGGAATCACTACAACAGCTACTTTCAGAGTTACTGGTATTTCAACATTAACTGGTGATGTTGAATTAAGTAATGCATTACGTGTTGCTGGAGTATCTACATTTAACTCACCATCAATGATCAACAGTAACTTGAATGTTACTGGTCTGACGACAACTGGAAATTTAAGAGTTGCTGGAGTTACTACTTTAGCTGGTAGCACAAGACTTGATAGTAATCTTTATGTTGCAGGAATTACTACGCTTGCAAGTCCTCTTTATGCCACGAGTGCAACTTTAAGTGATAATGTTATCATCAACAGTAATTTAACGGTTGCTGGTAATGTTACAATTGGCGGAACAACAATTGCATTAACTGCACAAGAATTAAAAATTAAAGATAAAGCAATCATTCTTGGTATTACTACAAATGCAGTAGATGCTGATGTTTCTACCGATACTTCTGCAAATTATGGTGGTATTGCTATTGCTAGCACCGAAGGTTCTCCATTAGTACCACTATTTGTAACTGGAATCAATACTTCACCAAACACTTATAAACAATGGGTTTGGGTAAAAAATAATACAATGGGCGCAGGAACTACAGATGCCTGGCTATCAAACTATGCTGTTGGTATAGGATCTACTGTAGTTCCTAACGGTGTTAGATTATCTGTTGGGGGAATTCAATTAACCGATACCAATGTAACTGCCACTAAGTTTATTGGTAGAGATGGAGATATTTCATATCTAAGTGGAACTAATTTATATTATTCTGGTATTGGCTCAATATCTACATTTAATTCTAACGTTGGTATAGTAACTTACTTTACTGCTACAAATGCAAGAGTTACAGGAGTTAGTACTTTTGCCAATGTTCAAATTGGTTTTGGAAATACTGCATTAATTGTCTCTGGTGATGCAAGAGTAACTGGCATTTTAACGATTGGTACTTCTTCTATCACATTAAAGGGTACTACAAATGAAGTGTTTGTTGGTGCAAATACGAGAATTCACACCTCTGGCTACGATATTGGCAGTTCGTTTGTTCATTCAACTGGCGTAGAACTTGTTAATGCAAGATTTAGTGGAATTACAACTTATACAAACAGTGGAAATAATATTGTTCAAACTGCAGGTACTGCGGCATTAAACAATATAACTATTGCAGGTGTTTCTACCTTTACTGGTCAGTTAAATGCTGCAAGTATTGTAGTTACTGGGGTTGGAATCAATACTTTTGCATATCTAAGAGTAACAAATGATGCAAACATTGAAAATCTTTATAATGTAACTGGCGTTGTAACTACAATTAGTGGTGAAAATTTATATTATACTACTGGAATTGTTACTAATTTTACATCCACAGTATCAGCAATAGAAACTATAACTGCCAATGATGCAACAATTGGCGTTTCTACGATCACCACTTTATATAATACAACGGGTAACATTCAAACTTTAACTGGTGGCACATTTACTGCTAATAGTTTTATTGGAACAAGCAATTATATTTCTGGAACTGGTTATGTTGAGTCTCTAACTTTTAATGTTGGGGTTGGAACCACTGCCACCTTTACTGACACAAATGTAAATGGAACCTTAACAGCCAATAATGTAAATGTAACTGGTTCTACTTATTATAATACGATTGCTGCTGGACTAGTAACAGCGAATACTGGCATTATTACTAATTTCTCCTCTAGTTATTTTGCAAGTAATGCAACAAGTGTTGGTATTACAACAGCAGATATAGCCTTAGGAATTACCACGAGTGTAATAGGAATTAGTACACTTAATATTAATACTGGTGACGAAGTATCAGCAGTTTCAATACCAGCTGGAACACTGGTCACGGGAATTTCTACAACTGCGTCAGAAATTTTCATTAATAATAATACAACAAATGTTGCAATTAGTACTGAATTAGTAACAATTGTAAGATCAAATAATGCTGGAATTTCTACATTTAAAACAGCTTATATTAATGTTGGAATTGTAACAAGTTTATCAGTCCAAGGAATTAATGTAACTGGAATTTTAACAGCAATAAATGTTAATGTAAGTTCTGCGGCAACTATTAATAGGGTTGATGCTAATAATGTGCTTATTGGTGTGGGTACAATTAATACATTTATCAGCACTGATTCTTATATAAGTAATGCCTATATTAGCACATCATATTCTGCAACTGGAATAATTACACAAGCAAATATTACTAATGCATCTATACTTGGAATCGCAACTATTACTGATCTTGTTGTAAGTTCTGGTGCTACCATAGCCAATTTAGGAATTTCTAATGTTATTGCAAATGTTGGTATTATTACAAGTTTGACAGCAACATCTGCATATGTTGGTGTTTCTACAGTATCTACTTTAAACTTTAATGTTGGTTTTGCGACAAATTTTGATGCTACTCGTGCAGTAATTGGAATAGCAACTATTACCACATTAGATGCAACAAATGCTTTAGTTTCTGGTGTTACAACTGCTAATACATTATATTCAAATATTGGATCTGTTACATCTATTAATGGAACTGACCTATATTACATTGGAATTTCTACAGCCGATAATTTTTATTCAAATATCGGCTTTGTAACATTTGTATCTGGAACAAATTTAGATTACAGTGGCATTGGATCAATTTCAACATTTAGATCTAACGTTGGCTTTGTAACATTTGTATCTGGAACAAATTTAAATTATAGTGGTGTTGGTACAATTAATACGTTATATTCAGATGTTGGAATTGTAACTACTTTAAGTGGTACAAGATTAACATATTCAGATTTTACTAATACTTATTTGTATAATAGTGGTATTGGAAGCATCTCTACATTAAATGTTAACGTTGGATTTGTTACTTTTGTAAGTGGAACAAATTTACAATACCTTGGCGTAGGTACAATCAGCAATTTATATGGCGTTGGAATTGGTTACACCTCAGCCGATCTTGAATATATTACCAATATTAATATTGAATCTAGTGGAATTGGTACGGTCAGCACCTTATATTCAAATGTAGGATTTGTCACAACAATTTCTGGAACAAGAGCGACTTATGACCAAGCAGATCTTACGGATACTTATACGACGGGTGTTTCCAGTATAAGTAATTTAAAGGCAAATGTTGGAGTTGTAACCTTTGCATCTGGTACAAATATAAATTATGCTGGCGTTGGTACTATTAATTTCTTAAATGGTACTAATTTATATTACACTGGAGTTACAACTCTTGGTATTGTAACTGCCTTATCAATTACAACTCAGGATTTTGATCTTGGTGGTGGTGCTCTTAACTTTACTGGTGTTGCAACATTCTTTAATTTAAATTCAACTAATGCGACAGCACAATTTTTAAGTGGTACAAACTTTAATTATAGTGGAATTGGAACAGTAGCATTTTTAAATAGTGTTAATATTGACAATAGTGGATTTACTACAACGGGAAGTTTGCATGTTGGTGTTGGTGGATCTCTATTCAGTGTCGTTAGTGGTATTGGATCGGTTGGTATTGGAACAACCGCAGCAAGAGAAGCCTTACATGTTTATGGCAATATAATGTATGGTGATAATACAAATACTGGTACTGTACGAGTTGCAGTCACAACAACAAGTCCAATTACAATTCATGAAACCCTTTCTAGACTAGAATATCGATCTGTTGAATATCAAATTCAAGCATCTACTTCTGGTACAGGAACAACTACAGGAAGATACCAATTTACAAAAATATTATCAGTACATAATGGAACTATTGCATATAATGTAGAATATGCAAATGTTGGTACTGGAGTTACTGATGTGGCTACTTATGAGGTTGATATTGATGAGGGTCTTGACGCAGGATACATTCGTTTACAAGCAACTCCTGCACAAGTTGGAGTTACGACATTTATAATTAACTTCAATGGTTTTAGAATATAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence