Phage RBP Database

Genbank accession

YP_009194102.1 [GenBank]

Protein name

tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MTENKLLPYVFKGMGGDSLCTFQGNIWGMTRIGDEIYTTPYYNPDKIYVTKFGTFELVRTIKLEKPLWSYGGLGTDGEKLYARFDGEGIYIIREIDKNNGMIKGDLIQPKTSISGSIGSFVVNKDWNMILMPNYDGNIYAFDLTSGNQIGFNNSGLNSNTCGIAITNKEYIVVGSYSSNSIHVAKINDYATFTEKDFNALHFTSVDVSGGYVSGICSYGNILLYQIYDTGDLKWLNINRLRMGDSHPERYLVLHDSKYKTFNPLRKVKSLTNLVPVLTSNTSNGVASASSKYNDTFDAFRAFDGNGNTAWTTLSNSTYCWLAYEFTSPTLVNAYSIEANETTIGESPRSWHFEGFDGLKWIQLDRRLNETMWTKGEIRAFTFANTTAYIKYRIVCHSNWNKSASYLTIANLNFYNITDGQGGWMDYSTTIPSSINDVFIDGIKDLSIIRESDWNYLSNKDPRIKIIRYNDDTLSDLAKNKVNVIAVKNGYKNTFNMRFTPVNQVAIPLDNISINEDIEKFDLGIDREYHDRIRMFVSFNNGISWESFKFGEWRNVDTQDENDVMINGMRVWEFESLRTKDFKNKISFGYVKVGFMIETDVLEKGGVKVDDITAYINTYMNGADIGKMSLYILNTTAAINITFVGNKLSGTLSDFDLGLVQYRVSLNGKPYYPINGEFTPLDYSPEPINLNIRNQDVLMNQINSLSVDFKDYWGNVDTWTTHFIGTYAGLMFADPSGKYYTTDIGEILQKLNLGTLTAGQTTQENKIQLINQYGNNVKDLEIKAVNEKLPDGVRVELSKTQYPFLPSDKLTWNNNLAYGDRVLFFMRLTTDIEANSVPNGTFEIRAKATKV

Physico‐chemical properties

protein length:	850 AA
molecular weight:	96367,41600 Da
isoelectric point:	5,37455
aromaticity:	0,12706
hydropathy:	-0,34235

Domain architecture

YP_009194102.1

1 850 aa

ATT 21–235 · STR 236–257 · STR 277–420 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR015943
STR

IPR015943 IPR008979

IPR011044
ATT

IPR011044 G3DSA:2.60.120.260

IPR011044
ATT

IPR011044

YP_009194102.1

1850 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_1513
STR

DC_1513

YP_009194102.1

1850 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR015943	STR	IPR015943	21	257	Merged direct domain	WD40/YVTN repeat-like-containing domain superfamily	Central	Low	Positional only	5 proteins / 5 hits
IPR011044	ATT	IPR011044	25	235	Merged direct domain	Quinoprotein amine dehydrogenase, beta chain-like	N-terminal	Low	Positional only	7 proteins / 7 hits
IPR011044	ATT	IPR011044	33	235	Merged direct domain	Quinoprotein amine dehydrogenase, beta chain-like	N-terminal	Low	Positional only	7 proteins / 7 hits
IPR008979	STR	IPR008979	277	414	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	279	420	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

YP_009194102.1

1 850 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	12	12	0,8573
Central domain	13	268	257	0,9180
C-terminal	269	850	581	0,1612

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Brevibacillus phage Sundance [NCBI] · taxon 1691958

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Brevibacillus laterosporus [NCBI] · taxon 1465

Bacteria Firmicutes Bacilli Bacillales Paenibacillaceae Brevibacillus

Genbank protein accession

YP_009194102.1 [NCBI]

Genbank nucleotide accession

NC_028749 [NCBI]

CDS location

range 57135 -> 59687
strand +

CDS

ATGACAGAAAATAAACTTCTCCCTTATGTTTTTAAAGGCATGGGGGGAGACAGTCTTTGTACTTTCCAAGGAAACATATGGGGCATGACAAGAATTGGTGATGAAATTTATACGACACCCTACTATAATCCTGACAAGATTTATGTAACGAAGTTTGGAACTTTTGAATTGGTTAGAACTATAAAGTTGGAGAAACCTCTTTGGTCATATGGAGGATTGGGAACTGATGGAGAGAAACTTTATGCCAGATTTGATGGAGAAGGAATTTATATTATAAGAGAAATTGACAAAAATAATGGCATGATTAAGGGAGACTTAATTCAGCCTAAGACAAGCATATCAGGCAGTATTGGAAGCTTTGTTGTCAATAAGGATTGGAATATGATTTTGATGCCAAATTATGATGGAAATATTTACGCGTTTGATTTAACATCTGGAAATCAGATAGGTTTCAATAACTCTGGATTAAATTCCAACACTTGTGGAATTGCAATAACAAATAAAGAGTATATTGTTGTTGGAAGTTACAGTTCTAACTCAATACACGTTGCTAAAATCAATGATTATGCAACATTTACTGAAAAAGATTTTAACGCATTACACTTTACAAGTGTAGATGTTAGTGGTGGATACGTTTCAGGGATATGCTCATATGGCAACATCTTACTATATCAAATATATGATACAGGTGATTTGAAATGGTTAAATATTAATAGATTGAGAATGGGGGACTCGCACCCAGAACGGTATCTTGTGTTACACGACTCTAAATACAAAACATTTAATCCACTAAGAAAAGTTAAAAGTCTAACAAATCTAGTTCCTGTACTGACTAGCAATACATCAAATGGAGTGGCTTCTGCAAGCTCAAAGTATAATGACACATTTGACGCTTTTAGAGCATTTGATGGTAATGGCAATACTGCTTGGACTACATTATCCAATAGTACTTACTGTTGGCTTGCATATGAGTTCACATCACCAACATTAGTTAATGCTTATTCAATCGAAGCAAATGAGACTACTATAGGCGAATCGCCAAGAAGTTGGCATTTTGAAGGATTTGATGGTTTGAAGTGGATTCAACTTGACAGAAGGTTAAATGAAACAATGTGGACGAAAGGCGAGATTAGGGCTTTTACATTCGCAAATACAACAGCGTACATCAAGTATAGAATTGTATGTCATAGCAATTGGAACAAGTCAGCGTCTTACTTGACAATCGCAAATTTGAATTTTTACAACATCACAGATGGTCAAGGTGGTTGGATGGATTACTCAACCACAATTCCTTCAAGCATTAATGATGTCTTTATTGATGGAATTAAGGATTTGTCTATTATTCGTGAGTCGGATTGGAATTATTTATCAAACAAAGACCCTCGTATTAAAATTATTAGATACAATGATGACACTTTAAGCGACTTAGCTAAAAATAAGGTGAATGTGATAGCAGTTAAAAACGGATATAAAAACACTTTCAATATGCGTTTTACTCCTGTAAATCAAGTTGCGATTCCTCTCGATAACATTTCTATCAACGAAGATATTGAAAAGTTCGACCTTGGGATTGATAGAGAATATCATGATAGAATCAGAATGTTTGTTTCATTCAATAATGGCATCTCATGGGAGTCATTCAAGTTTGGTGAGTGGAGAAATGTTGATACTCAAGATGAGAATGATGTCATGATTAATGGAATGAGGGTTTGGGAATTTGAGTCACTTAGAACAAAGGATTTCAAAAACAAAATTTCATTTGGGTATGTCAAAGTTGGCTTCATGATTGAAACTGACGTTCTTGAAAAGGGCGGTGTGAAGGTAGATGATATCACAGCTTACATCAACACTTACATGAATGGCGCAGATATCGGCAAAATGTCTTTATATATCTTAAATACGACAGCCGCGATTAATATAACATTTGTTGGCAACAAGTTATCTGGTACATTGAGTGATTTTGATTTGGGTTTAGTTCAATATCGTGTATCCCTCAATGGAAAGCCATACTATCCAATCAATGGTGAATTTACTCCATTGGATTACTCGCCTGAACCTATCAACTTAAACATTAGAAATCAAGATGTGTTGATGAATCAAATCAATTCTCTCTCTGTTGATTTTAAAGACTATTGGGGAAATGTTGACACTTGGACAACGCATTTCATTGGAACATATGCTGGATTGATGTTTGCAGACCCATCAGGGAAATACTATACAACTGATATTGGTGAGATTCTACAGAAGCTTAATTTAGGCACTCTTACAGCAGGGCAAACAACTCAGGAGAATAAGATTCAACTCATTAATCAATATGGGAACAATGTTAAGGACTTGGAGATTAAAGCAGTAAACGAAAAGCTTCCTGATGGTGTTCGAGTGGAACTATCTAAAACGCAATATCCATTCCTTCCAAGTGATAAATTAACTTGGAATAACAACCTTGCTTATGGAGATAGAGTTTTGTTTTTTATGAGATTGACAACTGACATTGAAGCAAACTCTGTTCCAAATGGTACATTTGAAATTAGAGCAAAAGCAACTAAAGTCTAG

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)