Phage RBP Database

Genbank accession

QHB37168.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TF

Evidence RBPdetect2

Probability 0,42

Protein sequence

MADFTGAYSGRPNHYLLLRVNGTAPAVAWEAWAIRGSGAVSFALDCFTWNVGIFGYAYGGCHNLDFRNTSQILLASGSTPASGTGYCGANHLNASIFGSAYAEGYFTAASAPPPPNIYCISPNPREITQTGMTVAFCSTGDGGSPITSWGLQRATDAAFTQNVQIVASSGTTVYNDMVPGTTYYFRARGQNAIGVGGWSGTVSATTLPAVPPGMTVAPALSGQSAVVTLTPPGGISGVTSYKVEYRNKAGGPTTTLTGASPMTVTGLTPGQTYEWRALANFGSAPSPWTAWTEYFQPNPNTNPGNYFDGATADTADLDFRWNATANNSPSTAYGKHATGWADFVQAAEVSGGTGAQYRVTGALARYPEGQAAGSFSARFAFFGDANVAGFRAGTDPVVGGAEVSEGGVYWCSIYAQPSRSQRLAAGVSWYDALGNLISRQIGAAQVVAPGAPVRLAMSAMCPEDGIATVEAVDVAGDGWSKWLGGETITVDGGMVTVGLQYPYFDGAAPDTAQYDYAWLAAAHASPSTRTTLDATNDDPLADPDCPPPPAPPSPPVITDDCITEVGVWRRYWVQVPPGEVAKWLATIPTLTLTTGEQAAREVRIRVFENPDDTPASTFEPGEWVSEQIVRYIPPNTSLRIDGVSQRVRASVNGAPLVAADHLLYGTGGGPASWPVLACGIGYLIALDVPLDAALGNLTTDLALTRRML

Physico‐chemical properties

protein length:	708 AA
molecular weight:	73947,46550 Da
isoelectric point:	4,68850
aromaticity:	0,10311
hydropathy:	-0,06031

Domain architecture

QHB37168.1

1 708 aa

STR 98–300 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR013783
STR

IPR013783 IPR013783

IPR003961
STR

IPR003961 IPR003961

IPR003961
STR

IPR003961 IPR003961

IPR003961
STR

IPR003961 IPR003961

IPR036116
STR

IPR036116

IPR003961
STR

IPR003961

QHB37168.1

1708 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_2279
ATT

DC_2279 DC_1862

QHB37168.1

1708 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR013783	STR	IPR013783	98	203	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	111	196	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	112	206	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	113	209	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR036116	STR	IPR036116	114	295	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	204	300	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	208	293	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	208	286	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	211	300	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	211	283	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

QHB37168.1

1 708 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0086
Central domain	11	207	198	0,5644
C-terminal	208	708	500	0,4077

Note: Constraints were applied during segmentation.
Fixed 3 C-terminal predictions appearing before Central domain|Sequence started with non-N-terminal domain|N-terminal too short, forced to 10 residues

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Microbacterium phage Terij [NCBI] · taxon 2686229

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host No host information

Genbank protein accession

QHB37168.1 [NCBI]

Genbank nucleotide accession

MN813684 [NCBI]

CDS location

range 24246 -> 26372
strand +

CDS

ATGGCTGACTTCACAGGGGCGTACTCCGGGCGCCCAAACCACTACCTCCTCCTCCGCGTCAACGGCACGGCGCCCGCGGTGGCATGGGAGGCGTGGGCGATCCGCGGGAGTGGCGCCGTCTCGTTCGCGCTCGACTGCTTCACCTGGAACGTCGGCATCTTCGGGTACGCCTACGGCGGATGCCACAACCTCGACTTCCGCAACACGTCGCAGATTCTCCTCGCGTCGGGCTCCACCCCGGCGAGCGGGACCGGCTACTGCGGGGCAAACCACCTGAACGCGAGCATCTTCGGGTCGGCGTACGCGGAGGGCTACTTCACCGCGGCCAGCGCACCGCCCCCACCGAACATCTACTGCATCAGCCCGAACCCGCGAGAGATCACGCAGACCGGCATGACCGTCGCGTTCTGCTCGACCGGCGACGGCGGCTCCCCGATCACGTCGTGGGGGCTCCAGCGGGCGACGGACGCCGCGTTCACGCAGAACGTCCAGATCGTCGCCTCCAGCGGCACGACCGTCTACAACGACATGGTGCCCGGCACGACGTACTACTTCCGAGCGCGGGGGCAGAACGCGATCGGCGTCGGCGGCTGGTCCGGGACCGTCTCGGCGACGACGCTCCCCGCCGTCCCGCCGGGCATGACCGTGGCCCCGGCGCTGTCCGGGCAGAGCGCCGTCGTCACGCTGACCCCTCCCGGCGGCATCTCCGGCGTCACCTCGTACAAGGTCGAGTACCGCAACAAGGCGGGCGGGCCGACGACGACCCTCACCGGCGCGAGCCCGATGACCGTGACCGGCCTGACGCCGGGGCAGACGTACGAGTGGAGGGCGCTGGCGAACTTCGGGAGCGCACCGAGCCCGTGGACGGCGTGGACCGAATACTTCCAGCCGAACCCGAACACGAACCCCGGCAACTACTTCGACGGCGCGACGGCAGACACCGCCGACCTCGACTTCCGGTGGAACGCGACCGCGAACAACAGCCCGAGCACGGCGTACGGAAAGCACGCGACCGGCTGGGCCGACTTCGTGCAAGCCGCGGAGGTATCGGGTGGAACCGGCGCGCAGTACCGGGTGACCGGCGCGCTCGCCCGCTACCCGGAGGGGCAGGCGGCAGGGTCGTTCTCCGCACGGTTCGCGTTCTTCGGAGACGCGAACGTGGCAGGCTTCCGCGCAGGCACGGACCCCGTGGTGGGCGGCGCCGAGGTGAGCGAGGGCGGCGTCTACTGGTGCTCGATCTACGCACAGCCCTCCCGATCGCAGAGGCTCGCCGCCGGAGTGTCCTGGTACGACGCGCTCGGCAACCTCATCTCCCGGCAGATCGGCGCCGCGCAGGTCGTCGCGCCAGGAGCGCCCGTACGGCTCGCGATGAGCGCCATGTGCCCCGAGGACGGCATCGCGACCGTGGAAGCGGTAGACGTGGCCGGAGACGGCTGGAGCAAGTGGCTGGGCGGCGAGACGATCACCGTGGACGGCGGCATGGTCACCGTCGGCCTCCAGTACCCGTACTTCGACGGCGCCGCACCCGACACGGCGCAGTACGACTACGCCTGGCTGGCCGCGGCGCACGCGAGCCCGAGCACGCGGACGACGCTCGACGCGACGAACGACGACCCGCTGGCCGACCCGGACTGCCCGCCGCCGCCCGCACCGCCGAGCCCGCCCGTCATCACGGACGACTGCATTACGGAGGTTGGCGTCTGGCGCCGGTACTGGGTGCAGGTGCCGCCCGGCGAGGTCGCGAAGTGGCTGGCGACGATCCCGACGCTGACGCTGACGACCGGAGAGCAGGCGGCGCGCGAGGTCCGCATCCGCGTGTTCGAGAACCCGGACGACACCCCGGCGAGCACGTTCGAGCCGGGAGAATGGGTCAGCGAGCAGATCGTCCGTTACATCCCGCCGAACACGTCGCTCCGCATCGACGGCGTGAGCCAGCGGGTGCGCGCGAGCGTGAACGGCGCACCGCTCGTCGCCGCCGACCACCTCCTCTACGGGACCGGCGGAGGCCCGGCGTCGTGGCCGGTGCTCGCGTGCGGGATCGGCTATCTGATCGCGCTCGACGTGCCGCTGGACGCCGCACTCGGTAATCTAACCACGGACCTCGCCCTGACCCGAAGGATGCTCTGA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)