Phage RBP Database

Genbank accession

YP_009286983.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence RBPdetect2

Probability 0,48

Protein sequence

MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFLDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSVYDNHRTTFFVKADGTFRLGSRHVNGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVLVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYYIDTAEIEAKVKEMKDNARKSKDSLQKSIEELVKYIANEVNTNPITDANKLQISKLLDDIDNKKITLDGAAQTILLDPFLTDEQKVAVKKWFDKLNSDHTALKTTVMAAMQDGNLSAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITQLYNMVSIKVSSEQVTQQFLDLNMKIEKTQEETATALDDIQTQIDSTVKNLPYKVEVTSSNGLIFVNGGVNSTIAAKVTKGTEDVTSTIAVADFIWTRVSNNTAGDTAWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGVPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVSIRATQQWRMVWGTFPVTQLFLDTANDPNSTSKTVRVEPTSFTDIGAGGQLEVKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLTDITGESLSGAQDMKTSSQLDADAWGKGQFYAIRKQARDIAIDPVNDAAYKNLTTSYDALRTYLRALKTGAGRNTVYPWDTSSDTVMDVVRTAWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNAEIGKISKTGQHSTTDLRVPTTSISPKVTTIALPSFKGNTKNNLEVGGINLLDGTINPAEIVGDGTSNQTKNIYAFHGGNSTEMINSQTVVGFYWSITPNGNNPVAGKMYLQGSNPYPSLIPTITFTPDKLSGVELFTRSPIGGSTFTHVNMRVDGLSGTLRVWNMMIAKGVTEETIEYSPRLDDKDASGNTVYYNRNRAIAGVTLPTFYTAKNGTTDTARSSMTIQEVFHGDGTIRDEFYWTEDGQPTKVNRFADVLLDTGYSIAIQNQNVSLGGKRYIQVQLNNFADKPILNNGTVRMANGKGVELSRLVTGNFTQPDQFKVDYANANISFLVSADEMNVTSTYQVKGQDVAFFLRGWKLFQGEPVQQTAPSGATIFTFPPYNATSGVAPNFTPIGYTQKDLAIINRGEIAATDTYKRPVEIAPPIKSKQTGQQWQIVYALNSQYDSYCSFTGAIDLIGDPEGVSPTVIRYAYVDWTPTFFDKDGTFMYGNNLATAQEDTRYLIPVLERRIANAETKVETDSIKSVVFSSREYELGLQDKANVTDLQGKADKGDLTDLATKDELAQKDAEQKKALEDAMKNIDFTPYVLKSEIEQLDRSWTAAFYASGGMNIVKNSIGFDKSVSPILKKETFTFWDAVSNTAYNLPESIQTNALDALGFTSGFMFNAATNNTATVIGQVLNVIPNQPYTISYFLQKMTAGDSTYRFNIELQRPTVDNPTNDSHWVTISGGQLADNSSIKHSAFMPSYFEFTPTTSKVRLLLTASPKCTAQISGIMVNIGKKPIKWTMATGENYNTNVRMNLNGIRVSQVDKDGNEIGYTVITPEKFAGYYIKDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENANNAGWAFISNY

Physico‐chemical properties

protein length:	2001 AA
molecular weight:	221139,42820 Da
isoelectric point:	5,08200
aromaticity:	0,08846
hydropathy:	-0,47186

Domain architecture

YP_009286983.1

1 2001 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

Coil
Unmapped

Coil Coil Coil

YP_009286983.1

12001 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0209
STR

DC_0209

DC_0015
STR

DC_0015

YP_009286983.1

12001 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
Coil	Unmapped	-	375	395	Coils	Coil	-	-	-	-
Coil	Unmapped	-	552	572	Coils	Coil	-	-	-	-
Coil	Unmapped	-	1680	1700	Coils	Coil	-	-	-	-

Proteins with similar domain architecture

Phage

Bacillus phage Nemo [NCBI] · taxon 1805950

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host No host information

Genbank protein accession

YP_009286983.1 [NCBI]

Genbank nucleotide accession

NC_031070.1 [NCBI]

CDS location

range 55538 -> 61543
strand +

CDS

ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTACAAATATAATACAGTTGACGTTATCACGGTAAGAGAAAACAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTATTCAGCTATGCTTCCAACTCATATGTCTGGTCGTACAGCTAATGGTAACATCTACGGTTCTACTACGCTAGTAACTGTAGGTACGCGTGTACTAATCGGATTCCTTGATGGTCAGGTTGACACACCAATCGTAATCAACATCTACGGTAAGACGGATGACCAACAACAGTTAACACGTACAGATTTCACAGCAGCAGATGACTCAATCGAATCTATCCAACAAGAACTGTGGAACACTTTCAATCTATATCCATCAATGACTTATGAAAATGTAGATGGTAGAGGTAACCGTGAAGTAACGTTCTCGGGTAAGACATTCTTAATTTCGACAGACCGTGACCAAGAGAATATGTACGTACAGGATGCACATTTCGATTATATGGACCTTCCACATTCTCGCTATGCAAACGGAGAATTAATCGAACCAGAATCTCCTGATGCACCAACAGTACTGTATGTTCATCAAAGCGTATACGATAACCATCGCACAACGTTCTTCGTGAAAGCAGACGGTACGTTCCGATTAGGTTCTCGTCATGTTAATGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGTTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATATTAAAGGATGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGCGTACTTGTAAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATCTCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAGGTAGAGAAAGACACTTACTACATTGACACTGCTGAGATTGAAGCCAAAGTTAAAGAGATGAAAGACAACGCTCGTAAGAGCAAAGATAGCCTACAAAAGTCTATCGAGGAACTAGTAAAATACATTGCTAACGAAGTCAACACGAATCCTATAACCGATGCTAACAAACTGCAAATATCGAAGCTACTAGATGACATTGATAACAAGAAAATAACATTAGATGGTGCCGCACAAACGATTCTACTAGACCCATTCTTAACGGATGAGCAAAAAGTAGCTGTTAAAAAGTGGTTCGACAAACTTAACTCCGACCACACTGCATTGAAGACTACTGTCATGGCGGCTATGCAAGACGGAAACCTATCAGCACAAGACAAGAAAGATATCTCAACTGCCGCAGAGACATACCTAAACGACCTTACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATTGTTGATGCATTCGAGAACGCGGTAAACTACGCGAACAAGGAATCACTACATCAAAGCGCAGTAATTACTCAGCTATACAACATGGTCTCTATCAAGGTTAGCTCTGAGCAAGTAACGCAGCAGTTCCTTGATTTGAACATGAAGATTGAGAAGACACAAGAAGAGACAGCGACAGCATTAGACGATATCCAAACTCAGATTGATAGTACAGTTAAAAACTTACCATACAAGGTAGAAGTAACATCATCTAATGGTTTGATATTCGTAAATGGTGGAGTTAACTCTACCATTGCAGCTAAGGTTACTAAAGGTACAGAAGATGTAACAAGTACAATAGCTGTAGCAGATTTCATCTGGACTCGCGTTTCTAACAACACAGCAGGAGATACAGCTTGGAATAACGCTCATAAAAATGTTGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGATTACAAGAATCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATTACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCTTTATGGTACGACCGTGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTGGAGATTAATAGATTTGATGTTAACATTCGTAACTTATTAATCGGTTCTCGTGACTACGGCGCACAGAACTCTAACAATCCAACAGACCCTAACAACTCAACTCCTCAAGGCAACATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGAACACCACCTAAGACAGGGGTTAAACCTTCACCACAGAACGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAATCTAGTAAGCTTGCTAGCAGTGGTCTATTAGACGTTGGTGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGTGGAACTAGTCCTGATAAAGGCGTACCTATTAGATTGTATGTAACAGATAATAGGGATGGTGGTACTGGTACAATTGGTTTCGAAATGAAAGATAAAGAGACAGATGGCAAACCAGTCACTGGAGCACCTGTATCGATTAGAGCTACGCAGCAGTGGAGAATGGTATGGGGAACATTCCCTGTAACTCAACTGTTCTTAGATACAGCTAACGACCCTAACAGTACATCAAAAACTGTTCGTGTAGAACCGACAAGCTTTACAGACATTGGAGCCGGAGGACAACTAGAAGTTAAGTCTCACATGGTTGTTAAAGGTGTTATTCCTAGCGACTGGGTTCCTGCTCCAGAAGATACGAAACGTGACTCAGACAACACTAACTGGAACATGGATGCTCTTGGTAGTGACAACTACCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAATTAACAGACATTACAGGTGAATCTCTATCAGGCGCTCAGGATATGAAGACATCATCTCAGTTAGATGCAGATGCATGGGGTAAAGGTCAATTCTACGCTATCCGTAAACAGGCTAGGGACATCGCTATAGACCCTGTAAACGATGCGGCGTACAAAAACCTAACTACATCTTACGATGCACTTAGAACGTATCTGAGAGCCCTTAAAACAGGTGCTGGTAGAAATACGGTTTACCCATGGGATACTTCTTCTGATACAGTTATGGATGTAGTACGTACTGCATGGGATAAAGCGTGGGCGGATTATGAGAATGCATATGCATCATTAACTGTACTAGTTCAACAGAAACAGAAAACCTACACGGATGATAGAATCAAAGATGTTAATGCAGAAATTGGTAAGATTAGTAAAACAGGACAACACTCGACTACTGACTTACGAGTTCCGACCACTTCGATATCACCTAAAGTTACAACGATAGCTTTACCAAGTTTCAAAGGAAACACAAAGAATAACTTAGAAGTTGGTGGTATTAACCTTCTTGATGGCACTATAAATCCGGCAGAAATAGTTGGTGATGGTACTTCTAACCAAACTAAAAACATCTATGCGTTCCATGGAGGAAACTCTACAGAAATGATAAATAGCCAAACAGTAGTAGGGTTCTACTGGAGTATCACTCCAAACGGTAATAACCCAGTAGCGGGTAAAATGTATCTTCAAGGTAGCAACCCATACCCTTCGTTAATTCCTACCATCACGTTTACTCCAGATAAACTGAGTGGCGTAGAGCTATTTACAAGAAGCCCTATAGGAGGTAGCACATTCACCCATGTCAATATGAGGGTAGATGGTCTATCGGGAACACTAAGAGTCTGGAACATGATGATTGCAAAAGGTGTTACAGAGGAAACAATTGAGTACTCACCTCGTCTGGATGATAAAGATGCAAGCGGTAATACCGTGTACTATAACCGAAATAGAGCTATTGCAGGTGTAACATTACCCACATTCTACACAGCTAAGAATGGAACTACAGACACAGCACGTTCGTCAATGACAATACAGGAAGTATTCCATGGTGACGGTACTATTCGAGATGAGTTCTACTGGACAGAGGACGGGCAACCTACTAAGGTTAATAGATTCGCAGATGTATTGCTAGACACAGGTTACTCTATTGCCATCCAAAACCAAAACGTATCTCTTGGCGGAAAACGATACATTCAAGTACAGCTAAACAACTTTGCAGATAAACCTATACTAAATAACGGTACGGTTCGTATGGCTAATGGTAAAGGTGTAGAGCTTAGTCGTTTAGTTACAGGTAACTTTACGCAACCAGACCAGTTCAAAGTAGATTACGCTAACGCGAATATATCATTCTTGGTATCTGCTGATGAAATGAATGTCACTAGCACATATCAGGTAAAAGGTCAAGACGTAGCATTCTTCTTACGTGGATGGAAGTTATTCCAAGGGGAACCAGTTCAACAAACAGCACCTAGTGGAGCTACTATTTTCACCTTCCCACCTTATAACGCTACTAGTGGAGTTGCACCTAACTTCACTCCAATAGGGTATACTCAAAAGGACTTAGCGATTATAAACAGAGGAGAAATTGCTGCTACAGATACGTACAAGAGACCAGTTGAGATAGCACCTCCTATAAAGTCAAAGCAAACAGGACAGCAATGGCAAATCGTTTACGCGCTTAACTCACAGTACGATTCTTATTGCTCATTTACTGGAGCTATTGATTTAATAGGAGACCCAGAAGGCGTGTCACCTACAGTTATCCGTTACGCGTACGTAGACTGGACTCCTACGTTCTTTGATAAAGACGGTACATTTATGTATGGTAACAACCTAGCTACCGCTCAAGAGGACACTAGGTACCTTATACCTGTACTAGAACGTCGTATAGCTAATGCAGAAACGAAAGTAGAGACAGACTCTATCAAGAGTGTGGTATTTAGTTCCCGTGAATATGAGTTAGGCTTGCAAGATAAAGCCAATGTTACAGACCTTCAAGGTAAAGCGGATAAAGGTGACTTAACTGACTTAGCTACAAAAGACGAGTTAGCCCAAAAAGACGCTGAACAGAAGAAAGCGTTAGAGGATGCAATGAAGAATATCGATTTCACACCGTATGTTCTAAAGTCTGAGATTGAGCAGTTAGACCGTTCATGGACAGCAGCATTCTACGCATCGGGCGGTATGAACATTGTTAAGAACTCTATCGGTTTTGACAAGTCTGTTAGCCCTATATTAAAGAAGGAGACGTTCACATTTTGGGATGCAGTGTCTAACACAGCTTACAACTTACCAGAAAGTATCCAAACTAACGCTCTTGACGCATTAGGGTTTACAAGTGGATTCATGTTTAATGCAGCTACTAATAACACAGCTACAGTAATTGGTCAAGTACTAAATGTTATCCCGAACCAACCGTACACTATCAGCTACTTCTTACAGAAGATGACAGCGGGAGATAGTACGTACAGGTTCAACATCGAGCTTCAAAGACCTACTGTAGACAACCCAACTAATGACAGTCACTGGGTAACAATTAGCGGCGGTCAATTAGCGGATAATAGCAGTATTAAACATAGTGCATTCATGCCTTCTTACTTTGAGTTCACACCAACAACGAGCAAAGTTAGATTACTGTTAACAGCCTCTCCTAAGTGTACCGCACAGATTTCGGGTATAATGGTTAACATAGGGAAAAAGCCTATTAAGTGGACAATGGCTACTGGTGAGAACTATAACACAAACGTCCGCATGAACTTAAACGGTATCCGTGTATCTCAGGTTGACAAGGATGGTAACGAAATTGGGTATACCGTTATAACGCCGGAAAAATTTGCGGGTTATTACATTAAGGATGGTAAGCCGGAAGAGATATTCCGACTCGACGGTGATGAGACGTGGACTAAGAAGCTGAGAGCAGAAAATGAAATAAACATGGGACCAATCAAGATATTACGCGTAGAGAATGCAAACAACGCAGGTTGGGCGTTTATTTCGAATTACTAA

Protein

Domains

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)