Phage RBP Database

Genbank accession

YP_010088172.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MKKFIKKIDGGLDLDVQIERLGVNKLSDAINVSSHNFNRKQGELNASLGFSNDGWSLHSKCLGQTIGGIEKWSMANSAELFSKCVFVHSHDAGDQSFIVANGLLGTNTKYTAFYTAERHKADVPEKVPEQLADHNVWNLTEVYVHEGEFIDESFSFATYSFYEEKFMFITKDNFAMRVLVNGANVKTELTSFNYDPLRESSPIIKNVRTGPSMAIPSMTRYVYRILYIDGTHGPFSSVSNIITIPADYPEEWSSDETMKWSDPKYARLIKSNILVTVHVDVHAEENVARIELYAMRYITNEGLSPGPAIVELVGDSANGKIIDFIDGVAHFPTEVTNSDIEVEVLIPPVFESGAVCAIKDEILYVGNTREHLDSDTKNAAFDAWDARVWQLNSDKKAIDSTGTEYTLEQLYELTTSPTWLQIQNCLLGRDSSTSTIPLLDNAGQPGAIGKNIHIGFIKGKLEVGGVYPEAYQSQSPTTTSYGMSYENCNVASYFRGLCAPSHSSGMDTYDGQWYADNTTKAGVSTQKTVDFTDGEDAYVASQDFASDGEPLGHSFANPRFASRYRSMQHDSVYRIGIYFIDERESASQIKWLGDIRTPSLNTYGFRLCDNARPVDNGKAVTWKSNTYTQFTEMVMYPIYMLVKLGSIPAPYTRARIVYAKRELYNRNVILTGVMHALANPIEPQYLQNRHFRDCQRHSLPPLPHINSSQWFFGGREGIVSFDGTNAGSDMRWAMSDSHTPGQNADVSTLNVDENYVYAGVWRTLKPSSKDERVMKMLTAISDNYLNIKNPPAMTESALPCSGATATAVLGVKGVVGDFTSKVTRTEEHSKTSADGTTTSSSGWSETESHTPNEQKHFNMVCSARFRAHPVEINAMTAGTARKRLYNFYAPELDHTDDADNPFISSMAEQNISFASDHSVCTHAFLTSLMASTSLGKEIAAVHSIQNKTADRNTRGESWVHSMGYFRDAQLVTNEYSNTKYDHNTFAGTNYAGMETYWVTSGITRQPRAINFYEDTEGYKDDMVKTFNSSVSLKTAKYFIMWDQLQGGEDVTTLNLTIKAGRYSPSPIKLSEDMFQYLWPCTFSAHVPPAYPGGAFPQKIEAVDVGTNSFVNICPLWSGKFIPTHAFGEAKSLMFAETMMYTEMTDKSRNHMFSLYRTAMATSKFKKSSSTISNLYGCPFGLAWANRDAFITPLSDHGAENFVDVDNIKFGDGADGKANKPFAKSKFVYDSARVHYPYTLQTPSRLYSPLTNRDIIVSYGSGYPTKNDYVFPDVSWVNYISLLNDYIPPFCFGGYTSGSSPVFPNGNFKGMIADMYDDVSKVVRETMGPGTSPDTFENFTMTLDLVSGLNYHGYGGNAITFDFDSNIPAFEDKFRVSHDKSGHHLFKRTHGATSAWGGDYMVHYSTADSQVEPDYLDHAIHRASHVVLSTVRSKVVPFKSDYIEMADWIECAPESEITLNEDGNPIATIITGFDMFVGIHKRMYMNAFYANGVGARSDASLSSSAPIQMMFPTETMINLDIANPCSELRSPANRNNAITPRISHFAGYKFPIAGYTQKKKDFTYNSVFSSEFSSKNQLVVNQMIRREVFFNRLWYATFNHNAGRFNAFKAGDSIDLDRQYGAITGIVPSMDRLVVLQERAMCVLNPSQPTVLADAAQEQRPVYIGSGRLFASGIRYTTTDSGMAKGDRAYPFLEKVYWVDRDNQRIMRFNQEETADISTIHGVRSWVKDILTVQPQAPYRMHELEDGNRRLAFNHSRELWGTFKFRPWVQRNCMEINESRDAFMSFITIGAPIVSNISGKNMYLYNAHFITDDSEPDGRNDREYTNRVFSDGRYDAYYYYEDRDVDPSVGMFINPMGDIKTDKEFNGISVPIVGTGEKRLVFDMEMKLMPEDAGGLLTVRRCMQTFMYPYTTKDNKGEKMTDDAIVSLVENQVPKVISDAIMHPKTGAAIDGFTSKVLKQVKKTDMVNQHGRQLGTAVPFGYYVYVPLNKVDQQSEVYRMMKPFIGNTPVDAFYTVNIPIRGFGFHLNMRMHDFSESSTNMLGQKFDTKVFRVPTNLGVRTRIEAYFNDISVAYAALIEHETETGG

Physico‐chemical properties

protein length:	2085 AA
molecular weight:	233879,95190 Da
isoelectric point:	5,76043
aromaticity:	0,11511
hydropathy:	-0,38897

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR057889	STR	DC_0599	356	969	InterPro cluster	Crassvirus muzzle protein, N-terminal region	Central	Low	Positional only	32 proteins / 45 hits
IPR057889	STR	DC_0599	1351	1802	InterPro cluster	Crassvirus muzzle protein, N-terminal region	Central	Low	Positional only	32 proteins / 45 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_010088172.1

1 2085

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	1233	1233	0,0015
Central domain	1234	1448	216	0,7288
C-terminal	1449	2085	636	0,6031

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-1233

Central
1234-1448

C-terminal
1449-2085

	Name	Taxonomy ID	Lineage
Phage	Azobacteroides phage ProJPt-Bp1 [NCBI]	1920526	Uroviricota > Caudoviricetes > Crassvirales > Dechshavirus > Dechshavirus japanensis
Host	Candidatus Azobacteroides pseudotrichonymphae [NCBI]	511435	Bacteroidota > Bacteroidia > Bacteroidales > Candidatus Azobacteroides >

Coding sequence (CDS)

Genbank protein accession

YP_010088172.1 [NCBI]

Genbank nucleotide accession

NC_055706 [NCBI]

CDS location

range 86410 -> 92667
strand +

CDS

ATGAAAAAGTTTATAAAGAAGATCGACGGTGGGCTAGACCTTGACGTACAGATTGAGCGTCTAGGGGTAAATAAGCTATCTGATGCGATCAATGTATCTAGTCACAATTTCAACCGTAAGCAAGGAGAGCTTAATGCCTCACTAGGCTTCAGCAATGATGGCTGGTCATTACATAGTAAATGCCTAGGCCAGACCATTGGTGGGATAGAGAAGTGGAGCATGGCTAATTCTGCCGAGCTGTTCTCTAAATGTGTGTTTGTTCACTCGCATGATGCTGGTGATCAATCCTTCATTGTTGCTAATGGCTTGCTTGGCACAAACACTAAGTACACTGCTTTCTACACTGCCGAGAGGCATAAGGCCGATGTACCAGAGAAAGTGCCTGAGCAACTAGCAGACCATAATGTATGGAACCTCACTGAGGTGTATGTGCATGAGGGTGAGTTCATTGATGAATCATTCTCTTTCGCTACCTACTCGTTCTACGAGGAGAAGTTCATGTTCATCACCAAGGATAATTTCGCTATGCGTGTGCTTGTCAATGGTGCTAATGTCAAGACTGAGCTCACATCCTTCAACTACGACCCATTACGTGAGTCATCACCGATAATCAAGAATGTACGTACCGGACCATCTATGGCTATACCATCCATGACCAGGTATGTGTATAGGATACTGTATATCGATGGTACACACGGCCCATTCTCATCTGTATCGAACATTATCACCATACCAGCCGACTATCCTGAGGAGTGGTCAAGTGATGAGACAATGAAATGGTCTGACCCTAAGTACGCTAGGCTAATCAAATCTAATATCCTTGTCACTGTACATGTTGATGTGCATGCTGAGGAGAACGTTGCTCGTATAGAGCTATATGCTATGCGTTATATCACTAATGAAGGTCTCTCACCAGGCCCAGCTATCGTTGAGCTTGTTGGTGACAGCGCTAATGGTAAGATAATAGACTTTATCGATGGTGTAGCACACTTCCCTACTGAGGTGACTAACTCAGATATAGAGGTTGAGGTACTCATCCCACCTGTGTTCGAGTCTGGTGCTGTATGTGCTATCAAGGACGAGATACTCTATGTTGGTAACACACGTGAACACCTTGACTCAGACACTAAGAACGCTGCTTTTGATGCGTGGGACGCACGTGTATGGCAGCTCAATAGTGATAAGAAAGCTATTGACTCAACAGGTACTGAGTACACACTAGAGCAACTATATGAGCTAACCACATCACCTACATGGCTACAGATACAGAACTGTCTACTTGGTAGAGACTCAAGCACCTCAACCATACCACTCCTTGATAATGCAGGCCAGCCAGGTGCAATAGGGAAGAACATCCACATAGGCTTCATCAAAGGCAAGCTAGAGGTTGGTGGTGTATACCCAGAAGCTTATCAGTCTCAATCACCAACAACAACCAGCTATGGCATGAGCTACGAGAACTGTAATGTAGCCTCATACTTCCGTGGTCTATGTGCACCATCACACTCATCTGGTATGGATACATACGATGGTCAATGGTACGCAGACAATACCACCAAGGCTGGTGTATCTACACAGAAAACTGTTGACTTCACTGATGGTGAGGATGCGTATGTAGCATCACAGGACTTCGCTAGTGATGGCGAGCCATTAGGACACTCCTTCGCTAACCCACGCTTCGCCTCTAGGTATAGAAGTATGCAGCACGACAGTGTATACCGTATAGGTATCTACTTCATTGATGAGCGTGAGAGTGCGTCACAGATCAAGTGGCTAGGAGATATACGTACACCATCCCTGAACACTTATGGCTTCCGGCTATGTGATAATGCTCGCCCAGTAGATAATGGCAAAGCTGTGACATGGAAGAGCAACACCTACACCCAGTTCACTGAGATGGTCATGTATCCTATCTATATGCTTGTCAAGCTAGGTAGTATACCTGCACCATACACCAGAGCACGTATTGTCTATGCTAAGCGTGAGCTATACAACCGCAATGTCATCCTCACTGGTGTCATGCATGCATTAGCTAACCCTATTGAACCTCAGTACCTACAGAACAGACACTTCCGTGACTGTCAGCGCCACTCATTACCACCATTACCACATATCAACAGCAGTCAATGGTTCTTTGGTGGACGTGAGGGGATAGTATCTTTTGATGGTACCAATGCTGGTAGTGATATGCGTTGGGCTATGTCCGACTCACACACGCCAGGACAGAACGCTGATGTGTCTACCCTGAACGTGGATGAGAACTACGTCTATGCAGGTGTATGGCGCACACTCAAGCCATCATCTAAGGACGAGCGTGTGATGAAGATGCTAACAGCTATCAGTGATAACTACTTGAATATCAAGAACCCACCTGCTATGACTGAGTCAGCGTTACCATGTAGTGGTGCCACAGCCACAGCAGTGTTAGGTGTCAAGGGTGTAGTAGGAGACTTCACTTCCAAGGTCACACGCACAGAGGAGCATAGCAAGACCAGTGCAGATGGCACAACAACATCATCTAGTGGATGGTCTGAGACTGAGTCACATACACCAAATGAGCAGAAGCACTTTAACATGGTCTGTTCAGCACGTTTCCGTGCACACCCAGTGGAGATCAACGCCATGACAGCAGGTACAGCAAGGAAGAGGTTATACAATTTCTACGCTCCTGAGCTAGACCATACGGATGATGCTGACAACCCCTTCATCAGCTCCATGGCTGAACAGAACATCTCTTTTGCTAGCGACCATTCAGTATGCACACACGCGTTCCTCACATCCCTCATGGCATCTACTAGCCTAGGTAAGGAGATAGCTGCAGTGCATTCCATACAGAACAAGACTGCTGATCGTAACACACGTGGTGAGTCATGGGTACACTCTATGGGGTACTTCCGTGATGCACAGCTAGTGACTAACGAATACAGCAATACCAAGTACGACCACAACACGTTCGCAGGTACTAACTATGCTGGCATGGAGACCTACTGGGTCACATCAGGCATAACCAGACAGCCTAGGGCAATCAACTTCTACGAAGACACTGAGGGGTATAAGGATGACATGGTCAAGACCTTCAACTCCTCTGTCTCACTCAAGACAGCTAAGTACTTCATCATGTGGGACCAGCTACAGGGTGGTGAAGATGTAACAACACTCAACCTAACTATCAAGGCAGGCAGGTACTCACCATCACCTATCAAGCTCAGTGAAGACATGTTCCAGTACCTATGGCCATGCACGTTCTCTGCACATGTCCCTCCAGCATACCCTGGTGGTGCTTTTCCACAGAAGATTGAAGCGGTAGATGTAGGTACGAACTCATTTGTTAATATATGCCCACTATGGTCAGGTAAGTTCATCCCTACCCACGCCTTTGGTGAGGCTAAGAGTCTTATGTTTGCTGAGACTATGATGTACACTGAGATGACAGATAAGAGCAGGAATCATATGTTCTCCTTGTACCGTACAGCCATGGCAACAAGCAAGTTCAAGAAATCATCCTCTACCATCAGTAACCTCTATGGCTGCCCATTTGGTTTAGCCTGGGCTAATAGGGATGCGTTCATCACACCACTATCTGACCATGGAGCAGAGAACTTCGTTGATGTAGACAATATCAAGTTCGGTGATGGTGCAGATGGCAAGGCTAACAAACCATTTGCTAAGAGCAAGTTCGTCTATGACAGCGCACGTGTGCATTATCCATACACACTACAGACACCTAGCAGACTATACTCACCACTAACAAACAGAGACATCATCGTCAGCTATGGTAGTGGCTACCCAACAAAGAACGACTACGTGTTCCCTGATGTGTCATGGGTGAACTATATCAGCCTACTCAATGACTATATCCCACCATTCTGTTTCGGTGGCTACACCTCAGGCTCATCACCAGTGTTCCCTAATGGCAACTTCAAAGGCATGATAGCAGATATGTACGATGATGTCAGCAAGGTCGTTAGAGAAACCATGGGTCCAGGCACATCACCAGACACCTTTGAGAACTTCACCATGACACTAGACCTAGTCAGTGGGCTTAACTACCATGGGTACGGGGGTAATGCGATAACATTTGATTTTGATAGTAACATACCAGCCTTTGAAGATAAGTTCCGTGTCTCGCACGACAAGAGTGGTCATCACCTGTTCAAACGTACTCATGGAGCTACATCAGCATGGGGTGGGGATTACATGGTTCATTACAGTACTGCTGATAGCCAGGTCGAACCAGACTATCTTGATCATGCTATACACCGTGCATCACATGTTGTTCTTTCTACCGTACGTTCTAAGGTCGTGCCATTCAAGAGTGACTATATCGAGATGGCTGACTGGATCGAGTGTGCACCAGAGAGTGAGATAACACTCAATGAGGATGGTAACCCAATAGCTACCATCATAACAGGTTTTGACATGTTCGTAGGGATACATAAACGTATGTATATGAACGCTTTCTATGCTAATGGTGTTGGTGCACGCTCAGATGCATCACTATCATCATCAGCACCTATACAGATGATGTTCCCTACAGAGACGATGATCAACCTTGACATTGCTAACCCATGCTCAGAGCTACGCAGCCCAGCGAACAGGAACAATGCTATCACACCACGTATATCCCACTTTGCTGGGTATAAGTTCCCTATTGCTGGCTATACACAGAAGAAGAAAGACTTCACCTACAACAGCGTGTTCTCATCTGAGTTCAGCAGCAAGAACCAACTCGTTGTTAATCAGATGATTAGGCGTGAGGTGTTCTTCAACAGGCTATGGTACGCCACCTTCAACCACAATGCAGGGCGGTTCAACGCTTTCAAGGCGGGGGATAGCATTGACCTAGACAGACAGTACGGGGCTATCACAGGTATAGTACCTAGCATGGACAGGCTTGTTGTCTTACAAGAACGTGCTATGTGTGTGCTTAACCCATCACAACCAACGGTATTAGCTGATGCAGCACAAGAACAACGACCGGTATATATAGGCTCAGGGAGGCTCTTCGCTTCAGGTATACGTTACACCACCACTGACTCGGGCATGGCTAAGGGCGACCGTGCATACCCATTCCTTGAGAAGGTCTACTGGGTTGACAGGGATAACCAACGTATCATGCGGTTCAATCAGGAAGAGACAGCAGATATAAGTACCATACATGGTGTACGATCATGGGTTAAGGACATACTCACTGTACAGCCTCAGGCACCATACCGTATGCATGAGCTAGAGGATGGTAATAGGAGGCTGGCTTTCAATCATTCCCGTGAGCTATGGGGCACCTTCAAGTTCAGGCCATGGGTACAACGTAACTGTATGGAGATCAATGAGTCACGTGATGCGTTCATGTCATTCATCACCATTGGCGCACCGATAGTATCTAATATATCAGGTAAGAACATGTACCTCTACAATGCACATTTCATCACTGATGATTCAGAGCCTGATGGACGTAATGACAGGGAGTACACTAACAGGGTCTTCAGTGATGGGCGTTATGATGCGTACTACTACTACGAGGATAGAGACGTAGACCCATCAGTAGGTATGTTCATCAACCCTATGGGGGATATCAAGACAGACAAGGAGTTCAACGGTATCAGCGTGCCTATCGTGGGTACAGGCGAGAAGAGGCTCGTGTTTGATATGGAGATGAAGCTCATGCCTGAGGATGCAGGAGGGTTATTAACTGTCAGACGATGCATGCAGACATTCATGTACCCATACACCACCAAGGATAATAAGGGTGAGAAGATGACTGATGATGCTATAGTTAGCTTGGTTGAGAACCAGGTACCTAAGGTTATCTCTGATGCTATCATGCATCCTAAGACCGGTGCAGCAATAGACGGGTTCACCAGTAAGGTGCTTAAGCAGGTTAAGAAGACCGACATGGTCAATCAGCATGGTCGTCAGCTAGGCACAGCAGTACCTTTTGGTTACTATGTGTACGTACCACTTAACAAGGTTGATCAACAGTCTGAGGTGTATCGTATGATGAAACCATTCATTGGTAACACGCCGGTAGATGCGTTCTACACAGTCAATATACCTATCCGGGGGTTTGGTTTTCATCTAAACATGCGTATGCATGACTTTAGTGAGAGCAGCACTAACATGCTTGGACAGAAGTTCGATACTAAGGTGTTTAGGGTCCCAACCAACCTAGGTGTACGTACGCGTATAGAAGCGTATTTCAACGATATCAGTGTAGCCTACGCAGCACTTATTGAGCATGAGACAGAGACAGGAGGGTAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence