Phage RBP Database

Genbank accession

AUZ95510.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,60

TF

Evidence RBPdetect2

Probability 0,93

Protein sequence

MPPAIIAAVIAVGASVAGTIGVISLTTAVVIGALATVAGSLLTKTSLPSLGNYTSQQERKQVLRSAAGSCTYIYGRVMTSGLLAFAEEQPGEQKTDDHEWVHLVIVLAAHAIDGVEEVYLGEDRIEVYGQNATWSLHSDPQTAPAFLLANCPQWKSDMIGKGLSYIRVSLKFDQELFPSGIPNVKALVRGKRVYDPRDGQTKWTDNAALVIRDFYAGDMLGVEDEDLDDAMFIEAANICDQSVLNADSSISRRYTINGQFDASEAISSILDDMHEACAGEPTYMAGRHGLLVGAYYGPATMVLDESMIVSDVEIVPETAYNQKVNVITGTFVDKGQDYTEADFPSIRIQEWIDEDGNEFVMDKKYRFVVDEWHAQRLGQIVLNRSRLGRTLKLTANYMAYAMRPGYYVKLTIEPLGIINQEFRITSWELSGTEGVVLSLRQETVSVWDDAIGKPLVRPDITVFPPRQVTPPWNLQYQVMEIGEVVQGTLTWNNTSDIAYNNVIVRKDGNIVYTVQVPGTLCRLNGLKRGEYTVAVVAVNMRGQRSAEATIDIVIRAPAKPTGCEIEQGYFAVTLKPRSADLSNVAVTYDFWTSYEQRLPNADTATVEAGANHEGQGTIWTKNHLLNGHTYWWYVRAVNAFGASDFLEVEALCFTDIGELLPMIDAEFQTTDAYKNLMKPIEMNYLAILEAARSVGANVDHQWANYGEVRADVITIKTTIANDKIAMAELENVVVAHGQYINELTGKSEDLSAAVSQKMTSIVTSEGTAKAAYTLNLGINRGGKYYSSGMAMSIEPDGSGSYKSTTLFKADRFGIYSANTPGNYKLVFAVVNGQTFIDDAMIRNASIDTAKIKVASITSALIAQQIQSDNWNGSNVGWMINKNGNANFSNVTVRGSIFANYGDLNNVIIRENCTILGTLSAANIRGNLSDLKVVQLIGSGVESQSNEGHWDTYATLLPDPDIERTLLVQIPMLAHGFYNVGNNHDTSGSASIWMRLYVNGTRVRTLDIDSGSSTVSSMLTYSMNVPRNTQVQLRFEFYRWMYGGSGAWARVEPVTLLSTARVNTKWQ

Physico‐chemical properties

protein length:	1066 AA
molecular weight:	117163,97820 Da
isoelectric point:	5,00754
aromaticity:	0,08912
hydropathy:	-0,11914

Domain architecture

AUZ95510.1

1 1066 aa

STR 473–557 · ATT 559–663 · RBD 753–900 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR055383
STR

IPR055383 IPR057587 IPR053171

IPR015406
RBD

IPR015406

AUZ95510.1

11066 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0187
STR

DC_0187

DC_1439
RBD

DC_1439

AUZ95510.1

11066 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR055383	STR	DC_0003	473	557	InterPro cluster	Tip attachment protein J, Fn3-1 domain	Central	High	Text match	998 proteins / 1603 hits
IPR057587	ATT	DC_0130	559	663	InterPro cluster	Tip attachment protein J, second Ig-like domain	Central	Medium	Text match	309 proteins / 309 hits
IPR053171	Unmapped	-	734	928	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR015406	RBD	DC_0135	753	900	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

AUZ95510.1

1 1066 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	192	192	0,6879
Central domain	193	399	208	0,1133
C-terminal	400	1066	666	0,2352

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Salmonella phage PMBT28 [NCBI] · taxon 2081904

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Salmonella enterica subsp. enterica serovar Senftenberg [NCBI] · taxon 28150

Pseudomonadota Gammaproteobacteria Enterobacterales Enterobacteriaceae Salmonella Salmonella enterica

Genbank protein accession

AUZ95510.1 [NCBI]

Genbank nucleotide accession

MG641885.1 [NCBI]

CDS location

range 13681 -> 16881
strand +

CDS

ATGCCACCAGCGATAATCGCGGCAGTCATTGCAGTGGGGGCGAGCGTCGCCGGGACCATCGGCGTTATCTCCCTAACCACTGCTGTCGTCATCGGGGCCCTTGCTACGGTGGCGGGGAGCCTCCTCACAAAGACATCCCTACCCAGCCTCGGCAACTACACCAGCCAACAGGAGCGTAAGCAGGTCCTCCGCTCCGCTGCTGGCTCATGCACCTATATCTACGGGCGCGTAATGACCTCCGGGCTGCTGGCATTCGCCGAAGAGCAGCCGGGCGAGCAGAAGACCGACGACCACGAGTGGGTCCATTTAGTCATCGTGCTGGCGGCGCATGCCATCGATGGGGTGGAGGAGGTGTACCTCGGCGAGGACCGAATCGAGGTATACGGCCAGAACGCCACATGGTCCCTGCACTCGGACCCGCAGACCGCCCCGGCGTTCCTGTTGGCTAACTGCCCACAGTGGAAGTCCGACATGATAGGCAAGGGCCTGTCGTATATCCGGGTGTCGCTCAAGTTCGACCAAGAGCTATTCCCATCGGGCATCCCCAACGTCAAGGCTCTGGTCCGTGGCAAACGCGTGTACGACCCACGTGACGGTCAGACCAAATGGACCGACAACGCCGCTCTGGTGATTCGTGACTTCTATGCGGGTGACATGCTCGGGGTGGAAGATGAAGACCTAGACGATGCCATGTTCATCGAGGCGGCCAACATCTGTGACCAGTCGGTGCTGAACGCGGATAGCTCCATCTCCCGCCGCTATACCATCAACGGCCAGTTCGATGCCAGCGAGGCCATATCCTCCATCCTCGACGACATGCACGAGGCGTGTGCTGGTGAACCGACCTACATGGCGGGGCGTCACGGTCTGCTAGTGGGTGCCTACTACGGCCCTGCTACTATGGTGCTAGATGAGTCCATGATTGTGTCGGACGTCGAGATAGTACCCGAGACCGCGTACAACCAGAAGGTGAACGTCATCACTGGGACCTTTGTGGATAAAGGTCAGGACTACACCGAAGCCGACTTCCCATCTATCCGCATACAGGAGTGGATAGACGAAGACGGCAACGAGTTCGTGATGGACAAGAAGTATCGCTTTGTCGTGGATGAATGGCACGCCCAGCGCCTCGGACAAATCGTGCTGAACCGCTCCCGCCTCGGTCGTACGCTCAAGTTGACGGCGAACTACATGGCCTATGCCATGCGCCCCGGCTATTACGTCAAGCTGACCATCGAGCCACTAGGTATCATCAATCAGGAGTTCCGCATCACATCGTGGGAGCTGTCCGGCACGGAGGGTGTGGTGCTGTCCCTGCGTCAAGAGACCGTGTCCGTGTGGGATGACGCCATCGGCAAGCCGCTGGTGCGCCCAGATATCACGGTATTCCCACCACGTCAGGTCACACCGCCGTGGAACCTGCAGTATCAGGTGATGGAAATCGGCGAGGTGGTACAGGGTACGCTGACGTGGAACAACACCTCCGACATCGCGTACAACAACGTCATCGTACGTAAAGATGGCAACATCGTGTACACCGTGCAGGTGCCCGGTACTCTGTGCCGTCTGAATGGGCTCAAACGTGGCGAATACACCGTGGCCGTGGTAGCCGTCAACATGCGCGGCCAACGGTCAGCCGAGGCCACCATCGACATCGTCATCCGCGCCCCGGCCAAGCCAACCGGGTGTGAGATTGAGCAGGGCTATTTCGCCGTCACGCTCAAGCCACGCTCCGCTGACCTGTCTAACGTGGCCGTGACCTACGATTTCTGGACCTCATACGAGCAACGCCTACCGAATGCTGATACCGCCACTGTGGAGGCTGGGGCGAACCACGAGGGTCAGGGCACTATCTGGACCAAGAACCACTTGCTGAACGGCCACACCTACTGGTGGTATGTCCGGGCGGTGAACGCGTTCGGGGCGTCCGACTTCCTCGAAGTAGAGGCCCTGTGTTTCACGGATATCGGCGAGCTGCTCCCGATGATAGATGCCGAATTCCAGACGACCGACGCATATAAGAACCTCATGAAGCCGATAGAGATGAACTATCTGGCCATCCTAGAGGCTGCCCGTTCTGTTGGTGCCAACGTTGACCACCAGTGGGCCAACTACGGCGAGGTCCGTGCGGATGTCATCACCATCAAGACCACCATAGCAAACGACAAGATTGCCATGGCCGAGCTTGAGAATGTGGTGGTCGCCCACGGTCAGTACATCAACGAACTGACCGGGAAGTCCGAAGACCTGAGCGCGGCGGTGTCGCAGAAGATGACCTCCATCGTGACCAGCGAGGGCACGGCTAAAGCTGCGTACACCCTGAACCTCGGGATTAACCGTGGCGGCAAATACTACTCGTCCGGTATGGCCATGTCTATCGAACCGGACGGCTCGGGCTCGTACAAGTCAACCACGCTCTTTAAGGCTGACCGCTTCGGCATCTATAGCGCCAACACGCCGGGCAACTATAAGCTGGTCTTCGCCGTGGTCAACGGGCAGACGTTTATCGACGACGCCATGATTCGCAACGCGTCTATCGATACGGCCAAAATCAAAGTGGCCTCCATCACCTCGGCCCTCATCGCCCAGCAAATCCAGTCAGACAACTGGAACGGGTCCAACGTAGGCTGGATGATTAACAAGAACGGGAACGCCAACTTCTCCAACGTGACGGTGCGTGGGTCCATCTTCGCCAACTACGGCGACCTCAACAACGTCATCATTCGTGAGAACTGCACCATCCTCGGGACCCTGTCAGCGGCCAACATCCGTGGCAACCTGTCGGACCTCAAGGTCGTACAGTTAATTGGCTCGGGTGTGGAAAGCCAGAGCAACGAGGGCCACTGGGACACCTATGCGACCCTGCTCCCGGACCCGGACATCGAGCGTACGCTCCTTGTCCAGATTCCGATGCTGGCGCATGGCTTCTATAACGTAGGTAACAACCACGACACCAGCGGCAGCGCTTCTATCTGGATGCGCCTCTACGTGAACGGCACGCGGGTCCGCACACTGGACATTGACTCGGGGAGCAGCACAGTGTCGTCCATGCTGACCTACTCTATGAACGTGCCGCGCAACACACAGGTGCAGCTACGCTTCGAGTTCTATCGTTGGATGTATGGGGGTAGCGGTGCATGGGCTCGTGTGGAGCCAGTCACCCTACTGAGTACGGCTCGCGTCAACACTAAATGGCAATGA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)