Phage RBP Database

Genbank accession

XTK84686.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MKGRIFALLSLTVLLFAHLSVSLESHNTIYSNDAPRLEKINQSYYIDGQEALEVDTIINNDSSNYSKSIIESNEQEWNIATKNYTNNTLQFINFDQNHYSYRQFAFDSNNASNSKKSISKNVHLNDQTKIINTDESSSVTSDNIVGTEKCNYSMKSIIGSDDRQLISNPNSWPYKAAGQLVIKYVVQNNVTGNQDNMYFIGTGFLEGPDLLVTAGHCLYGDVTNSGDYEDHINNPRFADEIYYYPARNGNVDPYGGVKIERSYIEKEYYLNQQKDWGCCKLSNPIGNQTGWFGKISNFYEKDYEITTFGYPGSKNGFMYSSTGIMTKFEDNGWYYRTNLDTEGGQSGSPYRVTINGNTYVCGIHTYSVGNSYTGGIRIDSFMFAFFNSFVTGDKVYQIKPTDYNYADAYPVDSYTENTFVSHSLDNGLDFRTRRYRTGYIHNEYIVMSSIRKGIPKNEAMIEYSFNSPVTRIEVDLAYWRSVSNEWLSSSNGSAVLQIKNGEGWSNKFDLLSKETALPTNRSNPTTYTIDFDHPVYVFRFFCHYNGTSTLDSNRGRICIGNMNVWMQSENYMPLNGSELEYKPSEWNNNSMSNYNCYAYALNTKLHGFMQPGASDSSYNPYDSNYLTGSKLYEYVLLDGQNYNFSFKPIGKYDACDIGYYKVALVIAPNRDYHWYRQNYDGTWSHKPGGTAVTDLDRKGNLIYDPESCDRTTGFPSYSEFVGFYQVNVSNMI

Physico‐chemical properties

protein length:	732 AA
molecular weight:	83559,11790 Da
isoelectric point:	5,25638
aromaticity:	0,14754
hydropathy:	-0,62117

Domain architecture

XTK84686.1

1 732 aa

STR 173–292 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR050966
Unmapped

IPR050966

IPR009003
Unmapped

IPR009003

IPR043504
Unmapped

IPR043504

IPR008256
Unmapped

IPR008256 IPR018114 IPR008256 IPR008256 IPR008256

IPR043504
Unmapped

IPR043504

G3DSA:2.40.10.10
STR

G3DSA:2.40.10.10

XTK84686.1

1732 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR050966	Unmapped	-	96	390	InterPro	Glutamyl Endopeptidase	-	-	-	-
IPR009003	Unmapped	-	156	392	InterPro	Peptidase S1, PA clan	-	-	-	-
IPR043504	Unmapped	-	157	367	InterPro	Peptidase S1, PA clan, chymotrypsin-like fold	-	-	-	-
IPR008256	Unmapped	-	163	180	InterPro	Peptidase S1B	-	-	-	-
IPR043504	Unmapped	-	173	292	InterPro	Peptidase S1, PA clan, chymotrypsin-like fold	-	-	-	-
G3DSA:2.40.10.10	STR	G3DSA:2.40.10.10	173	292	Merged direct domain	G3DSA:2.40.10.10	Central	Low	Positional only	2 proteins / 2 hits
IPR018114	Unmapped	-	212	217	InterPro	Serine proteases, trypsin family, histidine active site	-	-	-	-
IPR008256	Unmapped	-	301	314	InterPro	Peptidase S1B	-	-	-	-
IPR008256	Unmapped	-	335	351	InterPro	Peptidase S1B	-	-	-	-
IPR008256	Unmapped	-	355	367	InterPro	Peptidase S1B	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

XTK84686.1

1 732 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	176	176	0,6666
Central domain	177	565	390	0,7702
C-terminal	566	732	166	0,9002

Note: Constraints were applied during segmentation.
Fixed 79 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Anaeroplasmataceae phage NatCom_34063 [NCBI] · taxon 3403515

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Anaeroplasmataceae [NCBI] · taxon 186333

cellular organisms Bacteria Bacillati Mycoplasmatota Mollicutes Anaeroplasmatales

Genbank protein accession

XTK84686.1 [NCBI]

Genbank nucleotide accession

PV036447 [NCBI]

CDS location

range 55180 -> 57378
strand +

CDS

ATGAAAGGAAGAATTTTTGCTTTATTAAGTTTAACTGTTTTACTTTTTGCACACTTAAGTGTTAGTTTAGAATCTCACAATACTATTTATTCAAATGATGCTCCTAGACTAGAAAAAATAAATCAAAGTTATTATATAGATGGGCAAGAAGCATTGGAAGTTGATACAATTATAAATAATGATAGTAGTAATTATTCAAAAAGTATAATTGAAAGTAATGAACAAGAATGGAATATCGCAACTAAAAATTATACTAACAACACTTTACAATTTATAAATTTTGATCAAAATCATTATTCATATAGGCAATTTGCATTTGATTCAAATAATGCTAGCAATTCAAAAAAGTCTATAAGTAAAAATGTTCATTTAAATGATCAAACAAAAATAATAAACACTGATGAATCATCTTCTGTTACTTCAGACAATATTGTTGGAACTGAAAAATGTAATTATTCAATGAAATCAATAATAGGTTCTGATGATAGACAATTGATTTCTAACCCTAATTCATGGCCTTATAAAGCGGCTGGACAATTAGTTATAAAATATGTTGTTCAAAATAATGTCACTGGGAATCAGGATAATATGTATTTCATTGGAACAGGATTTTTAGAAGGGCCCGATTTGTTGGTTACTGCCGGTCATTGCTTATATGGTGATGTAACAAATAGTGGCGATTACGAAGACCATATAAATAATCCACGTTTCGCTGATGAAATTTATTATTATCCAGCTCGAAATGGAAATGTAGATCCATATGGTGGAGTCAAAATTGAACGTTCATATATTGAAAAAGAATATTATTTAAATCAACAAAAAGATTGGGGATGTTGTAAATTATCTAATCCTATAGGTAATCAAACTGGTTGGTTTGGTAAAATAAGCAATTTTTACGAAAAAGATTATGAAATTACAACATTTGGATATCCAGGTAGCAAAAATGGTTTTATGTATAGTTCTACAGGAATTATGACTAAATTTGAAGATAATGGCTGGTACTATAGAACAAATTTAGATACGGAAGGTGGACAAAGTGGTTCACCATATAGAGTGACAATAAATGGCAATACATACGTTTGCGGAATTCATACTTATTCTGTAGGAAATTCTTATACTGGTGGCATTAGAATTGATAGTTTTATGTTTGCTTTTTTCAATAGTTTTGTAACTGGAGATAAGGTTTATCAAATTAAACCTACAGATTATAACTATGCTGATGCTTATCCTGTTGATTCATATACTGAAAACACTTTTGTGAGCCACAGCCTTGATAATGGCTTGGATTTTAGAACAAGAAGATATAGGACAGGATATATTCACAACGAGTATATTGTTATGTCATCTATTCGCAAGGGAATTCCTAAAAACGAAGCAATGATTGAATATTCATTTAATTCACCTGTTACACGTATTGAAGTAGATTTAGCTTATTGGCGTTCGGTTTCTAATGAATGGTTATCCAGTTCAAATGGATCGGCTGTATTGCAAATTAAAAATGGTGAAGGGTGGTCTAATAAATTTGATTTGCTATCAAAAGAAACAGCCTTACCAACTAATAGAAGCAATCCTACAACATACACAATTGATTTTGACCATCCTGTTTATGTTTTTAGATTTTTTTGTCATTATAATGGTACGTCAACTCTAGATTCTAACCGTGGTAGGATATGTATCGGCAATATGAATGTATGGATGCAATCAGAAAATTATATGCCTCTAAATGGTTCTGAGTTGGAATATAAACCAAGCGAATGGAATAATAATAGTATGAGTAACTACAATTGCTATGCATATGCTCTAAATACAAAACTTCATGGTTTTATGCAACCAGGAGCAAGTGATTCAAGCTATAATCCGTATGATTCAAACTATTTAACAGGCTCAAAACTATATGAATATGTGCTACTTGATGGACAAAACTACAATTTTTCATTTAAACCCATTGGTAAATATGATGCTTGTGACATAGGATATTATAAGGTAGCTTTAGTAATAGCTCCAAATCGAGATTATCATTGGTATAGGCAAAATTATGATGGAACATGGTCACATAAGCCAGGTGGAACAGCTGTTACAGATCTTGATCGAAAAGGTAATCTTATTTATGATCCTGAATCCTGTGATAGAACAACTGGCTTTCCATCGTATTCTGAATTTGTAGGTTTTTATCAAGTTAATGTGAGTAATATGATTTAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)