Phage RBP Database

Genbank accession

WRH07482.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,78

TF

Evidence RBPdetect2

Probability 0,98

Protein sequence

MAQMIKTNMRLCDMAEEIKIYGAKGGSQKQHQPVEQEDNLISLNKVKVLLAVADGEVDPNFSLKDLYLADVPVQNQDGSYNYEGVRAEFRAGTQYQDYIAGLDGANSEIQASREIKNDTPYIIAVNNTQLSAIRVKLFWPRLVKQESNGDLNGTTCEYAIDLSVNGGAYQEYTRGVANGKTTTGYDRSIRVNLPAEFDSALVRIRKITPDSTSSTLVNGMQITTYQEVIDAKFRYPLTALVYVEFGSDLFPNGIPTISIKKRWKLIQVPTNYNPETRTYSGTWNGLFKMAWSNNPAWVLYDLVTNRRYGLDQRELGVEIDKWGLYEAAQFCDQMVPDGKGGLEPRYLCDMVVQNKVEAYTLIRDICSIFRGLTFYDGEKIGIVVDKPRNPSYIFTNDNVVNGLFSRTFASDKSLYTTANVQFDDVENNYQQDVEPVFELEATRRFGFNPVDLTAIGCTRRSEANRRGRWLLKTNLRSETISFTTGLEGMIPMIGEVIAVNDAAWSSNYQLNLSGRIESVQGLQVFTPFKVDAAPGDRILLNKPDGSPEARTIASVSEDGRTINLNTAFSFVAQPDTVFAIDKDNLALQQYVVTGIQKADTDGSDSFQYTITAVEYDPNKYDEIDYGVNIVDRPTSVVEPDRLSPPENLTVSSYSKVVQGLSVETMVIGWDKAPYAKTYNVQWRKENGNWINVPRTASTEVDIEGIYAGIYDVRVRSVSDTENVSAWSGIVTVSLTGKIGRPSAPTVITASTDEVFGIRVKWGFPEGSGDTAYTELQQVPDNGDGTYNPDNASLLTLLPYPAYEYWHTPIQPGKVIWYRARLIDRIGNTSDWSNFARGMSTDDANIINDFIKVDIEGSEGFKYLEQNAIQKNQDIQNQAEAIIENALANDGDVRRMTKENGKRKAEYVQAVNLIADETQARVEALTALKAQIDDEVVASITEVQTALATETEARTTADTTLSARLGENEAALNQKLDAFSNATSTGVQYGISLGLKYNGQTYSSGMSMELVGTGDNVRSQFIFDANRFAISNGIGYGSGQWQLPFVVENGNVIIKSAVIGDGSISNAKIGNFIQSNDWGTNSGWRLDKDDGLTLRGSDRGKMRVLDRNGVVRVKLGYLG

Physico‐chemical properties

protein length:	1118 AA
molecular weight:	123920,98090 Da
isoelectric point:	4,80826
aromaticity:	0,09302
hydropathy:	-0,37934

Domain architecture

WRH07482.1

1 1118 aa

ATT 106–231 · ATT 356–502 · STR 641–738 · RBD 971–1097 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR053171
Unmapped

IPR053171 Coil IPR015406

IPR055385
ATT

IPR055385 IPR032876 IPR036116 Coil

IPR013783
STR

IPR013783

IPR003961
STR

IPR003961

WRH07482.1

11118 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0014
STR

DC_0014

WRH07482.1

11118 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR053171	Unmapped	-	19	899	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	106	231	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	356	502	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR036116	STR	IPR036116	641	732	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	643	735	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	644	738	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
Coil	Unmapped	-	864	884	Coils	Coil	-	-	-	-
Coil	Unmapped	-	914	934	Coils	Coil	-	-	-	-
IPR015406	RBD	DC_0135	971	1097	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

WRH07482.1

1 1118 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	522	522	0,9406
Central domain	523	1096	575	0,0516
C-terminal	1097	1118	21	0,6155

Note: Constraints were applied during segmentation.
Fixed 27 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Escherichia phage phiA2-1 [NCBI] · taxon 3110554

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Escherichia coli delta [NCBI] · taxon 998453

Arthropoda Insecta Hymenoptera Vespidae

Genbank protein accession

WRH07482.1 [NCBI]

Genbank nucleotide accession

OR861626.1 [NCBI]

CDS location

range 14805 -> 18161
strand +

CDS

ATGGCACAAATGATCAAAACAAACATGAGGCTTTGTGATATGGCTGAAGAGATTAAGATTTATGGTGCCAAGGGTGGTAGCCAAAAGCAGCATCAACCAGTGGAGCAGGAAGATAACCTAATTTCACTTAACAAGGTTAAGGTTCTTTTGGCGGTTGCTGACGGTGAGGTGGATCCTAACTTCTCATTGAAGGATTTATACCTTGCTGACGTTCCGGTACAAAATCAGGATGGTAGCTACAACTATGAAGGTGTTCGCGCTGAGTTCCGTGCTGGCACGCAGTATCAGGACTATATCGCCGGGCTTGACGGTGCTAACTCAGAGATTCAGGCATCCAGAGAAATCAAGAACGATACCCCGTACATCATTGCAGTTAACAATACTCAGCTTTCAGCAATTCGAGTTAAGCTATTCTGGCCTCGACTGGTTAAGCAAGAAAGCAATGGAGACCTGAACGGAACAACCTGCGAGTATGCAATTGACCTTTCTGTTAATGGTGGCGCTTACCAGGAATACACTCGCGGAGTTGCTAACGGAAAGACCACTACAGGTTACGACCGAAGCATTCGCGTAAACCTTCCGGCAGAATTTGATAGCGCGCTTGTTCGCATCCGTAAGATTACGCCGGATTCAACAAGTAGCACCCTGGTTAACGGTATGCAGATTACAACCTATCAGGAAGTAATTGACGCTAAATTCCGCTATCCGCTTACGGCTCTGGTTTACGTTGAGTTTGGTTCTGACTTGTTCCCTAACGGCATCCCAACAATCTCAATCAAGAAGAGATGGAAGTTGATTCAGGTTCCTACAAACTATAACCCTGAAACCAGAACTTATAGCGGCACATGGAATGGTCTATTCAAGATGGCATGGTCAAACAACCCAGCATGGGTTCTTTATGACCTAGTAACAAACCGCCGTTACGGACTTGACCAGCGAGAGCTGGGTGTAGAGATTGATAAGTGGGGCCTGTACGAAGCTGCACAATTCTGTGACCAGATGGTTCCAGATGGCAAGGGTGGCTTAGAGCCGCGTTACCTTTGCGATATGGTTGTACAGAACAAGGTTGAGGCTTACACGCTAATTCGTGATATCTGTTCAATCTTTCGCGGCCTGACTTTCTATGACGGCGAAAAGATTGGCATCGTGGTTGATAAGCCTCGCAACCCATCTTACATCTTCACCAATGATAACGTTGTAAACGGATTGTTCAGTCGCACATTTGCCAGCGATAAAAGTCTTTACACCACGGCAAACGTTCAGTTTGATGATGTAGAGAACAACTATCAGCAGGATGTTGAGCCAGTATTTGAGCTTGAGGCTACTCGCAGGTTCGGGTTTAATCCAGTCGACCTTACGGCAATTGGCTGCACTCGCAGAAGTGAAGCAAACAGACGCGGCAGATGGCTCCTAAAAACCAACCTGAGAAGCGAAACTATCAGCTTCACTACCGGGTTGGAAGGCATGATTCCGATGATTGGCGAGGTTATTGCAGTTAATGATGCGGCATGGTCGAGCAACTATCAGTTGAACCTTTCCGGCCGCATTGAATCAGTGCAGGGGCTACAGGTTTTTACACCGTTTAAAGTTGACGCAGCGCCGGGTGACAGAATTCTTCTTAACAAGCCAGACGGAAGCCCGGAGGCAAGAACTATTGCCAGTGTTTCGGAAGACGGCAGAACAATCAACCTTAACACTGCTTTCAGTTTTGTAGCTCAGCCAGACACTGTGTTCGCAATTGATAAGGATAACCTTGCGCTTCAGCAGTATGTTGTGACCGGGATTCAAAAGGCAGATACTGACGGCTCTGATTCATTTCAGTACACGATTACTGCGGTGGAGTATGACCCTAACAAGTATGACGAGATTGACTACGGCGTTAATATTGTTGACCGTCCAACTTCAGTCGTAGAGCCTGATAGATTGTCGCCACCTGAGAATTTAACAGTGTCAAGCTACAGCAAGGTTGTTCAAGGATTATCAGTTGAGACGATGGTTATCGGGTGGGATAAAGCGCCATACGCTAAAACCTACAATGTTCAGTGGAGAAAAGAGAATGGCAACTGGATTAACGTACCAAGAACAGCTAGCACAGAGGTTGATATCGAAGGTATTTACGCAGGAATTTATGACGTTAGGGTTCGCAGCGTATCAGATACTGAAAACGTGTCTGCCTGGTCTGGTATTGTAACGGTATCGCTAACTGGCAAGATTGGTCGCCCATCGGCACCTACGGTTATCACGGCGTCAACTGATGAAGTATTTGGTATCCGTGTTAAATGGGGATTCCCTGAAGGCTCTGGCGATACTGCTTACACTGAGCTTCAGCAGGTTCCAGATAATGGTGATGGTACTTACAATCCTGATAATGCAAGTTTGCTTACGTTACTTCCTTATCCTGCCTACGAATACTGGCATACGCCAATTCAGCCAGGTAAGGTGATTTGGTATCGCGCAAGATTGATTGACAGAATCGGAAATACCTCTGATTGGTCTAATTTCGCAAGAGGCATGAGTACTGACGACGCAAACATTATCAATGATTTCATCAAGGTTGATATTGAAGGTTCAGAAGGATTCAAATACCTCGAGCAGAATGCGATTCAAAAGAATCAGGACATTCAGAATCAAGCTGAGGCAATTATCGAGAACGCACTGGCTAATGATGGCGATGTTCGCAGAATGACAAAGGAGAACGGCAAGCGTAAGGCTGAATATGTTCAGGCTGTGAATCTCATAGCCGATGAAACTCAGGCGCGCGTAGAGGCTCTAACGGCCCTTAAGGCGCAGATAGATGATGAAGTTGTAGCATCGATTACAGAAGTTCAGACTGCATTAGCCACAGAGACAGAAGCAAGGACTACTGCAGACACGACTCTATCAGCAAGACTTGGTGAAAATGAGGCGGCTTTAAACCAGAAGCTGGACGCATTCTCTAATGCCACATCGACTGGTGTGCAGTACGGAATTAGTCTTGGCCTGAAATACAATGGACAGACTTATTCATCCGGTATGAGCATGGAGCTTGTCGGCACTGGTGACAATGTTCGTAGTCAATTCATTTTTGACGCAAACAGATTCGCTATCAGTAACGGCATTGGTTACGGCTCCGGTCAGTGGCAACTCCCCTTCGTTGTCGAGAATGGAAACGTAATCATCAAGAGTGCAGTTATCGGCGATGGCTCAATCAGTAACGCGAAGATTGGTAACTTTATTCAGTCTAATGACTGGGGTACAAATTCAGGCTGGAGGCTAGATAAGGATGATGGATTGACGCTTAGGGGTTCCGATCGTGGCAAGATGAGAGTCCTGGACCGGAATGGAGTGGTTAGGGTAAAATTAGGATACTTGGGTTAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)