Phage RBP Database

Genbank accession

QYC96847.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,82

TF

Evidence RBPdetect2

Probability 0,97

Protein sequence

MNNIKARKGGSSKPRTPVEMPDNLISKDKIKLLLAVSDGEVVNDFSLKQLHFGGVPVQNEDGTFNYEGVIAEFRPGTQTQDYIQGFSESSAEFQVAREVTHNTPYTLTVSNKNLSAIRFRLLWPRVLKQKDNGDMVGSVVEYKIEMAVDGASYQTYLTGKIDGKNTTGGYDRSIRVNLPQNFTSQVLIRVSRVTPDADGVKVVDAFKVESYAEVIDAKFRYPLTAMLYVEFDSDLFQNQIPTISLKKKWKIIQVPSNYDPINRTYSGTWDGVFKWAWSNNPAWVLYDLIMNQRYGLDQRELGIPVDKWSLYEVAQYCDELVPDNRGGMEPRYLMDVVVQSQVEAFQLVRDICSAFRGMTFYNGESLSIIVDKPRDPVYLFTADNVVDGVFVRTFPSEKTMYTSCNVMFDDEENQYEQDIEPVFNPDAAMRFGHNPTSITAIGCTRRTEANRRGRWILQTNLSATTVSFSTGLEGMIPSCGDVIYVADPHWQSAFNLVLSGRVMEVSGVQVFLAYRCDAKAGDTLILNTDDGKPVRRTIASVSADGKTITLNVGYNFDVAPDSVFLIESDQLAAEQYVVTRIEKGSDDDEFTFAITATQYNPNKYDAIDNGVITDDRPTSVVDPDSLGAPKDLTISSFSRIVQGMSVETMVIGWSAVQYAKLYEVQWRKDGGNWNNVPRTATTQVDIEGIYAGEYQARVRCISGGNVASPWSALASATLTGKVGAPKGPINLFASDNEIFGIRVKWAMPEGAEDTAYIELYQSQSGTDQDASLLTLIPYPASEYWHSILPAGYVNFYKARSVDRIGNVSAWTDYARGMSSTDVNAITDTILDEILDSDAMKELQVSAQDSAAKLNDYANSIIQNALANDGDVRIMRKENGKRKAEIKRAEVLIANETEARVQQVNQISAEFNENLNSGLTQVNEALANETEARVTSEEALSARIGQNSAALDQKLDSWANVNGVGSMYTMKLGLTYNGQEYNSGMALQLTSQGGNVVSQVLFIADRFAIIRNAESGAYTLPFVVQNDQVFMNNALIQDGSITNAKIGNVIQSNNYIAGQQGWMINKNGGSEFQNTTVRGTIYATDGVFKGTVQAESFIGDIAVAKRYDSMTLRRNQTVQRNGHYQNRGYGMTVVLACTLVCETYGNGNSQLGYTVDVTFNIGGQQVVRRIYIDAGNIVYGTTAVELRFAADLAADNNNVSFFIKATGRDAVTDYTVTVDNITATAFRTNSNSFT

Physico‐chemical properties

protein length:	1233 AA
molecular weight:	136294,94990 Da
isoelectric point:	4,84009
aromaticity:	0,09570
hydropathy:	-0,28491

Domain architecture

QYC96847.1

1 1233 aa

ATT 90–217 · ATT 341–489 · STR 627–721 · RBD 950–1085 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR053171
Unmapped

IPR053171 Coil IPR015406

IPR055385
ATT

IPR055385 IPR032876 IPR013783

IPR036116
STR

IPR036116

QYC96847.1

11233 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0014
STR

DC_0014

QYC96847.1

11233 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR053171	Unmapped	-	3	875	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	90	217	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	341	489	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR013783	STR	IPR013783	627	721	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR036116	STR	IPR036116	629	715	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
Coil	Unmapped	-	893	913	Coils	Coil	-	-	-	-
IPR015406	RBD	DC_0135	950	1085	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

QYC96847.1

1 1233 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	504	504	0,8678
Central domain	505	1052	549	0,0566
C-terminal	1053	1233	180	0,7480

Note: Constraints were applied during segmentation.
Fixed 33 C-terminal predictions appearing before Central domain|Sequence started with non-N-terminal domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Klebsiella phage IME268 [NCBI] · taxon 2860375

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Klebsiella pneumoniae [NCBI] · taxon 573

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Enterobacterales

Genbank protein accession

QYC96847.1 [NCBI]

Genbank nucleotide accession

MZ398242.1 [NCBI]

CDS location

range 24541 -> 28242
strand +

CDS

ATGAATAATATCAAGGCCCGCAAGGGTGGCTCCAGCAAGCCGCGAACCCCGGTAGAAATGCCAGATAACCTGATCTCAAAAGATAAGATCAAGTTGTTGCTTGCTGTTTCAGATGGCGAGGTGGTTAACGACTTCAGCCTGAAGCAGTTGCATTTTGGCGGCGTCCCGGTTCAGAACGAGGATGGAACATTCAACTATGAGGGCGTGATTGCAGAGTTCCGCCCCGGCACGCAAACGCAGGACTACATCCAGGGCTTCAGCGAGTCAAGCGCTGAATTCCAGGTTGCTCGTGAAGTCACTCACAACACGCCTTATACGCTTACCGTATCGAACAAGAATCTTTCTGCCATTCGCTTTCGCCTGTTATGGCCCCGCGTTCTGAAGCAAAAAGATAACGGCGATATGGTCGGATCGGTTGTTGAGTACAAGATCGAGATGGCGGTAGACGGCGCAAGTTATCAGACCTACCTAACGGGCAAAATTGACGGCAAGAACACGACTGGCGGTTACGATCGGAGCATTCGCGTTAACCTGCCGCAAAACTTCACGTCGCAGGTGCTTATCCGCGTTAGTCGAGTAACGCCTGACGCTGACGGGGTGAAGGTTGTCGATGCTTTCAAGGTTGAATCATACGCTGAAGTTATTGATGCCAAATTCCGCTACCCGTTAACGGCCATGCTTTACGTTGAGTTCGATAGCGATCTGTTCCAGAACCAGATCCCCACTATCTCACTCAAAAAGAAATGGAAGATTATCCAGGTTCCGAGCAACTACGATCCGATTAATCGCACGTACTCCGGAACGTGGGACGGTGTTTTCAAGTGGGCGTGGAGCAATAACCCGGCTTGGGTTCTTTATGATCTGATCATGAATCAGCGCTATGGTTTAGACCAGCGTGAGTTAGGAATCCCGGTTGATAAGTGGTCGCTGTACGAGGTGGCGCAATACTGTGATGAGCTTGTGCCGGACAATCGCGGCGGGATGGAGCCGCGCTATTTGATGGATGTAGTTGTTCAGTCGCAGGTTGAGGCGTTCCAGTTGGTAAGGGATATTTGTTCCGCGTTCCGTGGAATGACGTTCTACAACGGGGAAAGCCTTTCGATTATCGTCGATAAGCCGCGCGATCCGGTGTACCTGTTTACGGCTGATAACGTCGTTGACGGCGTTTTCGTTCGGACGTTCCCAAGCGAAAAGACGATGTATACGTCGTGCAACGTCATGTTCGACGACGAAGAAAACCAGTACGAACAGGATATTGAACCAGTATTCAACCCGGATGCAGCCATGCGATTTGGCCATAACCCAACGAGCATTACAGCGATCGGGTGTACCAGAAGGACTGAGGCGAACCGCCGTGGGCGTTGGATTCTGCAAACGAACCTAAGCGCCACAACCGTTTCGTTTTCGACTGGCCTAGAAGGCATGATCCCTTCTTGCGGCGATGTGATTTACGTTGCAGATCCGCACTGGCAATCAGCCTTTAACCTGGTGCTATCAGGACGCGTTATGGAAGTATCAGGCGTGCAGGTCTTTCTGGCCTACCGTTGCGACGCGAAAGCTGGAGACACTCTGATCCTGAATACTGACGACGGCAAGCCAGTGCGTCGCACCATTGCCAGCGTTTCGGCAGATGGCAAAACCATCACGCTAAACGTCGGATATAACTTTGACGTTGCGCCTGACAGCGTGTTCCTGATCGAAAGTGATCAGCTTGCTGCGGAACAGTATGTAGTAACCAGGATCGAAAAGGGGAGCGATGACGACGAATTTACCTTCGCCATCACGGCCACCCAATACAACCCGAACAAGTACGACGCGATCGACAACGGCGTAATCACTGACGACCGCCCAACGTCGGTTGTTGACCCGGATTCATTGGGTGCTCCGAAAGACTTAACGATTAGCTCGTTTTCTCGCATTGTTCAGGGAATGAGCGTCGAAACGATGGTGATCGGATGGTCTGCCGTGCAGTATGCAAAACTGTACGAGGTGCAATGGCGTAAGGATGGCGGGAACTGGAATAACGTTCCGCGCACTGCGACAACGCAGGTTGATATCGAAGGCATCTATGCTGGCGAGTATCAGGCCCGCGTAAGGTGCATCAGCGGCGGGAATGTGGCGTCTCCGTGGTCTGCATTGGCAAGCGCTACGCTGACCGGAAAAGTCGGAGCGCCAAAAGGCCCGATTAACCTTTTTGCGTCGGACAATGAGATCTTCGGCATTCGCGTTAAGTGGGCCATGCCGGAAGGAGCGGAAGATACGGCATACATTGAACTTTACCAGTCACAAAGCGGAACCGATCAGGATGCAAGCCTGCTTACCCTGATTCCCTACCCGGCTTCTGAATACTGGCATTCAATTCTTCCCGCTGGCTACGTGAACTTCTACAAAGCCAGAAGCGTAGACCGTATCGGCAACGTTTCAGCGTGGACTGATTACGCTCGCGGCATGTCGTCGACTGACGTTAACGCCATCACGGATACGATCCTGGATGAGATCCTCGACAGCGACGCGATGAAAGAACTTCAGGTGAGTGCGCAGGATAGCGCGGCAAAACTCAATGACTACGCTAACAGCATCATCCAAAACGCATTAGCGAATGATGGTGATGTTAGAATCATGAGAAAGGAGAATGGAAAGAGGAAGGCTGAGATTAAACGCGCAGAAGTTCTCATAGCAAATGAGACGGAAGCCAGGGTGCAGCAGGTTAACCAGATATCGGCAGAGTTCAACGAAAACCTCAATTCTGGATTAACTCAAGTTAACGAGGCGTTGGCGAATGAAACTGAGGCTCGCGTTACGTCGGAGGAGGCGCTATCAGCAAGGATTGGCCAGAACTCCGCAGCGCTAGATCAGAAACTTGATTCGTGGGCAAACGTTAATGGAGTTGGTTCCATGTATACAATGAAGCTAGGGCTGACTTACAACGGCCAGGAATACAATTCCGGGATGGCCCTACAGCTTACATCACAGGGTGGAAACGTTGTTTCGCAAGTTCTGTTTATTGCTGATAGATTCGCCATCATCCGAAATGCGGAGTCTGGAGCGTACACGTTGCCTTTTGTTGTGCAGAATGACCAGGTTTTCATGAATAACGCGCTTATTCAGGACGGTTCGATTACCAACGCGAAGATCGGTAACGTCATTCAGTCAAACAACTACATCGCTGGGCAGCAAGGGTGGATGATTAATAAGAATGGCGGTTCTGAATTCCAGAACACTACTGTTCGAGGGACTATCTACGCTACCGATGGCGTATTTAAAGGTACTGTACAGGCGGAATCGTTTATAGGAGATATCGCCGTAGCAAAACGCTATGACAGCATGACGCTACGCCGAAACCAGACTGTTCAGCGTAACGGGCACTACCAAAACAGGGGCTATGGAATGACCGTAGTTCTTGCCTGTACGTTGGTATGTGAGACTTACGGAAACGGAAACTCGCAGCTTGGTTATACCGTTGATGTTACGTTTAATATCGGTGGTCAGCAGGTGGTACGCCGAATTTACATTGATGCTGGCAACATTGTTTATGGCACAACAGCGGTAGAACTTCGATTCGCTGCCGACCTTGCCGCTGACAACAACAATGTTAGCTTCTTCATCAAGGCTACCGGGCGCGATGCCGTCACCGACTATACCGTTACTGTCGACAACATCACAGCAACCGCATTCCGCACAAACTCAAATAGCTTTACATAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)