Phage RBP Database

Genbank accession

WQZ19206.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,91

TSP

Evidence RBPdetect2

Probability 0,98

Protein sequence

MGYFQMTRNVEELFGGVVTAPHQIPFTYKSSVGGETFISLPFYPVTGVVTINGGMQVPLDNFEIDGNTLNLGRALSKDDVVYCLFDKILSPEDTSKGIRIYKFQAVGGETEFTPDFTSYGVQSLYIGGEYKTPDIEYSYNSTTGKVSLQTALTAGVWVVAEMSVKQPNISPAFDRSIQEIARSANVKDSEVIVSTDTISLLDDKKVVYDSAAQVIYGLPTIPDGSVISSVSDGKLTYNPGDVQVDLLPLPDSAQAVKLFYLQPSGAENIKVSSGDTVQDILNNINKHRVVSSISELLNISPTETSVVFVASFHPSTNYGGGFFRWDPSGNKATHNGGTIIDPDKTFPTWDSAGKTSWFTASGTGTGVWRRQDVMGHYRAEDFGALPWNVGDAHDSTKEFQQVANVAYRGGCWRWTGRHRITSYIDIPNKQTFGSYAQMTSVYSELFQPSNFQGVHVISDPSLARSVQNAVFFDAATGEAFRCGEGASPTDFLVYGRGFTTTGMDLATSLPSAASYCDTQAFRHGKAINVRNVTVALMKYALDSNPWDASKGDYYSTTDHMTILYCYCISRVPTGQDITFNTKHINMRAYVNQIGDYGLAVRNVVFIGGSIEGYNTSTFLRSSTQLSFKGTYFETGDTSFNGTVFSLVGWCTLNFEECLVYLNNTTNFVSSGGSGQSAGVLGLTIKSQGNVWRKTDAGTTTVFAVDPVTNKQALVGSEILNAASGATIAYWAGAVPPGTYTAPISVAF

Physico‐chemical properties

protein length:	747 AA
molecular weight:	80944,40910 Da
isoelectric point:	5,14929
aromaticity:	0,11513
hydropathy:	-0,13507

Domain architecture

WQZ19206.1

1 747 aa

ATT 161–249 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

G3DSA:3.30.2020.50
ATT

G3DSA:3.30.2020.50

WQZ19206.1

1747 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0116
ATT

DC_0116 DC_0516

DC_0397
ATT

DC_0397

WQZ19206.1

1747 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:3.30.2020.50	ATT	G3DSA:3.30.2020.50	161	249	Merged direct domain	G3DSA:3.30.2020.50	N-terminal	Low	Positional only	289 proteins / 289 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

WQZ19206.1

1 747 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	392	392	0,9923
Central domain	393	721	330	0,9847
C-terminal	722	747	25	0,4351

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Escherichia phage 241 [NCBI] · taxon 3110543

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host No host information

Genbank protein accession

WQZ19206.1 [NCBI]

Genbank nucleotide accession

OR924452.1 [NCBI]

CDS location

range 91433 -> 93676
strand +

CDS

ATGGGGTATTTTCAAATGACCAGAAATGTAGAAGAATTATTCGGCGGCGTAGTCACAGCTCCCCACCAGATTCCTTTCACTTATAAATCAAGTGTCGGTGGAGAAACTTTCATTTCTCTACCTTTCTATCCTGTCACTGGTGTTGTCACAATTAACGGCGGCATGCAAGTTCCGTTAGACAACTTCGAGATAGACGGGAATACGTTAAACCTCGGGCGCGCATTGTCTAAAGATGACGTGGTTTATTGCCTGTTCGACAAAATCCTTTCACCAGAAGATACTTCTAAAGGCATTCGAATATACAAATTTCAAGCCGTGGGTGGGGAAACTGAATTCACGCCTGACTTTACTTCTTATGGTGTACAGTCTCTTTATATCGGTGGCGAGTACAAAACCCCAGATATAGAATATTCATACAACAGTACGACTGGGAAAGTTTCCCTACAAACTGCTCTGACTGCAGGGGTGTGGGTTGTTGCGGAGATGTCTGTTAAACAACCGAATATCAGTCCGGCGTTCGATCGCAGTATCCAAGAAATTGCCCGTTCGGCTAACGTAAAAGACTCTGAAGTCATTGTCAGCACTGATACCATATCTTTACTCGACGACAAGAAAGTTGTTTATGATTCAGCAGCGCAGGTTATTTATGGTTTACCAACTATTCCTGATGGTTCAGTGATTTCTTCTGTATCTGATGGAAAATTGACTTATAATCCAGGTGATGTGCAGGTTGATCTGTTACCATTACCAGATTCTGCCCAGGCAGTTAAATTATTCTATTTGCAACCAAGTGGCGCAGAAAATATTAAAGTTTCCAGTGGCGACACAGTACAAGATATTCTGAATAATATCAATAAACACCGTGTTGTAAGCAGCATTTCAGAACTTTTGAATATATCTCCAACAGAAACGTCAGTTGTATTCGTGGCATCTTTCCATCCATCAACCAATTACGGGGGTGGATTCTTCCGTTGGGATCCGTCTGGAAACAAGGCAACCCACAATGGTGGTACGATTATTGATCCTGATAAAACGTTTCCGACTTGGGACAGCGCAGGTAAAACTTCTTGGTTTACCGCAAGCGGGACGGGTACTGGTGTTTGGCGTCGGCAAGACGTGATGGGTCATTACCGTGCTGAAGATTTCGGTGCACTCCCTTGGAACGTCGGGGACGCGCATGACAGTACCAAAGAATTCCAACAAGTGGCTAATGTGGCTTATCGGGGCGGTTGCTGGAGATGGACAGGTCGCCATCGCATTACGAGTTATATCGATATCCCCAATAAACAGACTTTTGGTTCATACGCCCAAATGACTTCTGTTTATTCTGAATTATTCCAGCCTAGCAATTTCCAGGGGGTGCACGTTATTTCTGATCCTTCTTTAGCGCGTTCTGTGCAAAATGCAGTCTTCTTTGATGCTGCGACCGGAGAAGCATTCCGTTGTGGGGAAGGTGCATCCCCGACCGATTTTTTGGTGTACGGAAGAGGGTTTACAACTACTGGGATGGATTTGGCAACATCATTACCTTCGGCGGCGTCGTATTGTGACACCCAAGCATTCCGTCATGGGAAGGCTATTAACGTGCGAAATGTTACTGTTGCGCTTATGAAGTACGCATTGGATTCTAATCCATGGGATGCCAGCAAAGGTGATTATTATTCCACAACGGATCATATGACGATTTTGTATTGTTATTGCATTAGTCGTGTACCAACTGGCCAGGATATAACATTTAACACCAAGCATATCAATATGCGTGCATATGTAAACCAGATTGGCGATTATGGATTGGCAGTCCGAAATGTGGTGTTTATCGGTGGATCCATAGAAGGATATAACACTTCAACATTCTTACGATCCAGTACTCAACTTTCTTTCAAAGGCACATATTTTGAAACGGGTGACACGTCATTCAATGGTACAGTATTCAGCCTTGTTGGTTGGTGTACTCTTAACTTTGAAGAATGTCTTGTTTATTTGAACAACACCACAAACTTCGTGTCTTCTGGTGGTTCTGGGCAATCTGCTGGCGTCTTGGGTCTAACGATTAAATCTCAAGGTAACGTGTGGCGTAAAACTGACGCGGGGACAACCACAGTGTTTGCAGTTGACCCAGTCACTAATAAACAAGCCTTAGTTGGATCCGAAATATTGAATGCTGCGAGTGGGGCAACTATCGCATATTGGGCTGGTGCCGTCCCACCTGGCACATACACGGCTCCAATCAGTGTTGCATTTTAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)