Phage RBP Database

Genbank accession

QSJ04320.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

Protein sequence

MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLALADVVKVNYKYNTVDVITVRDNNSTTKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYDNIDGRGNREITFSGKTFLIMTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTMLYVHQSVYDNHRTTFFVKADGTFRLGSRHISGGGITYQELRPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVLVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKIKDMKDSARKSKDSLQASIEALVKYIANDVNTNPITDANKLQISKLIDDMDNKKLTLDGSAQTILLDPFLTDEQKVAVKKWYDKINSDHTALKTTVMAAMQDGNLTAQDKKDISDSAATYLNDLNSWLTEMDKAADASYEQRIVEAFENAVNYANKESLHQSAVITQLYNMISIKVSSEQVTQQFLDLNMKIEKTQEETSTALDDIQNQIDSTVKNLPYKVEVTSSNGLIFVNGGVNSTLAAKITKGTEDVTSTVAVADFVWTRVSNNSAADTAWNNAHKNSGRSFNINASDVIDRATFFCDYKKPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQGKWVEINRFDVNIRNLFVGSRDFGAQNSNNPTDPNNATPQGKTSGGWINKGGTSTIRPPDQTATNQDTWINTTAENWGGMDYKLSKLAASGVINVGDMLTYACYVRTVGGTNPAAGIPIKMYATDNRTPSTTPFVDPTTAIPVVDSTTAKMPNPPQVNATQQWKMVWGTFTFTQDMMNTVNDPNNVDKTLRLEPISFTAIGNGGQLEVKSHILVKGVVPADWVPAPEDTKRDADNTNWNMDALGNDNYLTRFERGLVKTKLADITGESLSGAQDMKTSTQLDADAWGKGKFYAIRKQARDIAIDPVNDATYKALTTAYDALRTYLRALKTNTGRNTVYPWDTSSDTVMDVARTAWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNTEIGKISKTGQHSTTDLRVPTTSISAPITTIALPSFKGNTRNNLDVGGVNHAYNTLAPVEVTGLKGTGGKPDNQTVQPYSINSYGLNLIASGKYLVGYQWSIVPYQNKPLEGSMYIQIVGEPWTQITPTISFSPNSPTSGVVMLQKNDPAFTANGITKLQIRFDNLVGVVTISNFMLTTGPTLETVEYSPNPTELRADGDYQYYNRNRAIAGVTLPTFYTAKNGTTDTARSSMTIQEVFHGDGASRDEFYWTEDGQPTKINRFADILLDAGYSIAIQNQNVALAGKRYIQVQLNNFADKPMLNNGTVRMANGKGIELSRLATGSFTQPDQFKVDYANANISFLVSAEEMNVTSAYQVKGQDVAFFLRGWKLFEGEPVQKTAPSGATVYSFPPYNATSGVAPNFTPIGYVQKDLAIINRGEIAATDTYKRPIEVAPPIKLKQTGQQWQIVYALSLPYESYCSFTGAIDLIGDPDKVSPTVIRYSYVDWTPTFFDKDGTFMYGNNLATAQEDTRYLIPVLERRIANAETKVETDSIKSVVFSSREYELGLQDKANVTDLQGKADKGDLTGLATKDELAQKDEAQKKALEDAMKNIDFTPYVLKSEIEQLDRSWTAAFFASGGMNIVKNSIGFDRSMSAKLNKETFTFWDDMVNPAYHQPVGIQTNALDALGFTSGFMFNESPNTSWTAIAQVLNVIPNQPYTISYFLQKMSAGDGNYRFNILVQESQLENPTTDGDWATISGGQLADNSSIKHSAFMPSYFEFTPTKSKIRLVLIAAPKCVAQISGIMVNIGKKPIKWTMSTGENYNTNVRMNLNGIRVSQVDKDGAEIGYTVITPEKFAGYYIRDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENTNNAGWAFISNY

Physico‐chemical properties

protein length:	2006 AA
molecular weight:	222019,04850 Da
isoelectric point:	5,07177
aromaticity:	0,09023
hydropathy:	-0,44935

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	552	572	Coils	None
Coil	1685	1705	Coils	None

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage BCPG3 [NCBI]	2812883	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QSJ04320.1 [NCBI]

Genbank nucleotide accession

MW584228.1 [NCBI]

CDS location

range 3559 -> 9579
strand -

CDS

ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTTCAATCACAACTCGGTAAAGAAATGAAACGTAAATACAAAGAGGGTAACAATCTTGTTACTCTCGCTCTTGCTGATGTCGTAAAAGTAAACTATAAATATAATACAGTCGACGTTATCACAGTAAGAGACAACAACTCTACAACGAAAAACCCTAACGATAACGGTAAATACTCAGCTATGCTTCCAACACATATGTCCGGTCGTACAGCTAATGGTAACATCTACGGTTCTACAACATTAGTAACTGTAGGCACACGAGTATTAATCGGGTTCATCGATGGTCAGGTAGACACACCAATCGTAATTAACATCTACGGTAAGACAGATGACCAGCAACAATTAACTCGTACAGATTTCACAGCAGCAGATGATTCAATTGAGTCAATCCAGCAGGAGCTATGGAACACATTTAATCTGTACCCATCTATGACTTACGATAACATAGATGGTCGTGGTAACCGCGAAATAACATTCTCTGGTAAAACATTCCTAATCATGACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCACATTTCGATTACATGGACCTTCCACATTCTCGTTATGCAAATGGTGAACTTATTGAACCAGAATCTCCAGATGCGCCAACAATGTTATACGTACACCAAAGCGTATACGATAATCATCGTACAACTTTCTTCGTGAAAGCAGATGGTACATTCCGATTAGGTTCTCGTCACATTAGTGGTGGAGGTATTACGTACCAAGAACTAAGACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAACCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCCTTAAGGATGGTAACGTTGTGTTACAGAACCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTACTTGTGAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATCTCCCCTGAGTTAGAGAATATCATAAAACAAATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAAGTAGAGAAGGACACATACTTCATCGATACTGCTGAGATTGAAGCGAAGATTAAGGACATGAAGGATAGCGCTCGTAAAAGTAAAGACTCACTACAAGCATCTATTGAGGCTCTAGTAAAGTATATTGCTAACGACGTTAACACGAACCCTATCACCGATGCTAACAAACTACAAATCTCTAAGTTAATCGATGATATGGACAACAAGAAATTAACGTTAGATGGTAGTGCGCAAACAATTTTACTAGACCCATTCTTAACAGATGAGCAAAAGGTAGCCGTTAAAAAATGGTACGACAAGATTAACTCTGACCATACTGCATTAAAGACTACTGTCATGGCAGCTATGCAAGATGGTAACTTGACAGCACAAGATAAGAAGGACATCTCTGACTCCGCAGCAACATACCTAAACGACCTTAACTCATGGTTAACTGAGATGGATAAAGCAGCGGATGCTAGTTACGAACAACGTATCGTCGAGGCATTTGAGAACGCAGTAAATTACGCTAACAAAGAGTCACTTCATCAAAGCGCGGTAATCACTCAGCTGTACAACATGATTTCTATCAAAGTTAGCTCAGAACAAGTAACGCAGCAGTTCCTTGATTTGAACATGAAGATAGAAAAGACACAAGAAGAGACGTCTACAGCATTAGATGATATCCAAAACCAGATTGATAGCACAGTTAAGAACTTACCGTACAAGGTAGAAGTGACATCATCTAATGGTTTGATTTTCGTTAATGGTGGAGTTAACTCTACGTTAGCAGCTAAGATTACAAAAGGAACTGAAGATGTAACAAGTACGGTAGCTGTTGCAGATTTCGTTTGGACTCGTGTATCCAATAACTCAGCAGCGGATACAGCTTGGAACAACGCTCATAAAAACTCTGGGCGTTCATTCAACATCAATGCTAGTGATGTAATTGATAGAGCGACATTCTTCTGTGACTACAAAAAACCTCCAGTTGCTACAGGTAGTGTTACAATTGCAAACATCCAAGATATCACAGTGGGTAACGTTGAGCCAACAAATCCTCGTGAAGGTGCATTATGGTACGACCGTGGGACAGGTATCGTGTGGATGTGGCAGCAAGGTAAGTGGGTTGAGATTAATAGATTTGATGTTAACATCCGTAACTTATTTGTCGGCTCTCGTGACTTCGGTGCGCAGAATTCCAATAATCCAACAGACCCTAACAACGCAACACCACAAGGAAAAACATCAGGAGGATGGATAAATAAAGGCGGTACCAGCACAATTAGACCACCGGACCAGACTGCAACAAATCAGGACACATGGATAAACACAACAGCAGAGAACTGGGGAGGGATGGATTACAAACTAAGCAAGCTAGCTGCCAGTGGAGTTATCAATGTAGGCGATATGTTAACTTATGCATGTTACGTTAGAACTGTAGGTGGAACAAACCCAGCAGCAGGTATACCTATAAAGATGTATGCAACAGATAACAGAACACCTAGTACAACTCCATTCGTGGACCCTACTACCGCGATTCCAGTAGTAGATAGCACAACAGCCAAAATGCCCAACCCACCACAAGTTAATGCTACACAACAATGGAAAATGGTTTGGGGTACATTTACATTTACACAGGACATGATGAACACAGTTAATGACCCAAACAACGTAGATAAGACGTTACGTTTAGAACCCATCAGTTTCACTGCGATAGGTAACGGAGGTCAATTAGAAGTAAAGTCACACATCTTGGTTAAAGGTGTAGTTCCTGCGGACTGGGTTCCGGCTCCAGAAGATACAAAACGTGATGCAGATAACACGAACTGGAACATGGATGCTCTTGGTAATGACAACTATCTAACTCGTTTCGAGCGTGGACTAGTTAAAACTAAGTTAGCAGACATCACAGGTGAATCGCTATCAGGTGCTCAGGATATGAAAACATCCACGCAGTTAGATGCAGACGCATGGGGTAAAGGTAAGTTCTACGCTATCCGTAAACAGGCTAGAGACATCGCTATAGACCCAGTAAACGATGCGACATACAAAGCGCTAACTACAGCTTACGATGCGCTTAGAACGTATCTGAGAGCCCTTAAAACGAATACTGGTAGAAACACAGTTTATCCATGGGACACTTCTTCTGATACAGTTATGGATGTTGCACGTACAGCGTGGGATAAAGCGTGGGCGGATTATGAGAATGCTTATGCGTCATTAACAGTGCTAGTCCAACAGAAACAAAAAACGTACACTGACGACCGTATTAAAGATGTAAATACAGAGATTGGTAAGATTAGTAAAACGGGACAACACTCAACTACTGACTTACGAGTTCCAACAACATCAATCTCGGCACCAATCACTACAATTGCTTTACCAAGTTTCAAAGGTAATACACGAAACAATCTAGATGTAGGTGGTGTCAACCACGCGTACAACACGCTAGCCCCTGTAGAAGTGACAGGTCTTAAAGGTACAGGAGGTAAACCTGATAACCAAACAGTTCAGCCATATAGCATTAATTCATATGGGTTAAACTTAATAGCTAGCGGTAAGTATCTCGTAGGATATCAATGGTCAATCGTCCCTTACCAGAATAAACCATTAGAAGGTTCTATGTACATCCAAATAGTAGGGGAACCGTGGACGCAGATAACACCGACAATATCATTTTCACCAAATAGCCCTACATCAGGCGTCGTTATGTTACAAAAGAATGACCCTGCATTCACTGCAAACGGTATAACGAAACTACAGATACGTTTTGATAACTTAGTAGGTGTAGTCACAATTAGTAACTTCATGTTGACTACGGGACCAACTTTAGAAACAGTAGAGTACTCACCGAACCCTACAGAACTAAGAGCCGATGGCGATTATCAATACTACAATCGTAATAGAGCTATAGCGGGTGTGACACTGCCTACGTTCTACACAGCTAAGAATGGAACTACAGATACGGCACGTTCTTCAATGACAATACAAGAAGTGTTTCACGGCGACGGTGCATCCCGTGATGAATTCTACTGGACAGAGGATGGACAACCAACGAAGATTAATAGATTTGCAGACATACTGCTAGACGCAGGGTACTCTATTGCTATCCAAAACCAGAATGTAGCTCTCGCAGGAAAGCGATATATCCAAGTTCAGCTAAACAACTTCGCAGATAAACCTATGCTAAACAATGGTACGGTTCGTATGGCGAATGGTAAAGGTATAGAGCTTAGTCGTTTAGCGACGGGTAGCTTCACACAACCAGACCAGTTCAAAGTAGATTACGCTAATGCAAATATATCATTCTTGGTATCTGCCGAGGAGATGAACGTTACTAGCGCGTATCAGGTAAAAGGTCAAGACGTAGCATTTTTCTTACGAGGATGGAAGTTGTTCGAAGGCGAACCAGTTCAAAAAACTGCACCTAGCGGGGCTACTGTTTACTCATTCCCTCCGTATAACGCGACTAGCGGAGTTGCTCCTAACTTCACTCCAATAGGTTATGTTCAAAAAGACCTAGCGATTATAAACCGAGGAGAGATTGCCGCTACAGACACGTACAAGAGACCAATTGAGGTCGCACCACCGATAAAACTAAAACAAACAGGGCAGCAATGGCAAATTGTTTATGCGCTTAGCTTACCATACGAATCTTATTGCTCATTCACTGGAGCTATTGACTTAATCGGAGACCCTGATAAAGTATCACCTACAGTCATCCGTTATTCGTACGTAGACTGGACTCCTACGTTCTTCGACAAAGATGGTACATTTATGTATGGGAACAACCTAGCAACTGCTCAAGAGGACACTAGGTACCTTATACCTGTACTGGAACGTCGTATAGCTAACGCAGAAACAAAAGTAGAGACAGATTCCATCAAGAGTGTTGTGTTTAGTTCACGTGAGTACGAGTTAGGTTTGCAAGATAAAGCCAATGTTACAGACCTGCAAGGTAAAGCAGACAAAGGGGACTTGACTGGTTTAGCTACAAAAGATGAATTAGCGCAAAAGGATGAAGCCCAGAAGAAAGCGTTAGAGGACGCAATGAAGAACATCGACTTCACACCGTATGTTCTAAAGTCTGAGATTGAACAGTTAGACCGTTCATGGACAGCAGCATTCTTCGCATCAGGTGGTATGAACATCGTTAAAAATTCCATCGGTTTTGACAGGTCGATGAGTGCTAAATTAAATAAAGAGACGTTCACTTTCTGGGATGACATGGTAAACCCAGCTTATCACCAACCAGTAGGAATTCAAACTAACGCGTTAGACGCATTAGGTTTCACTAGTGGATTCATGTTTAACGAATCACCTAACACTAGTTGGACTGCGATAGCTCAAGTTCTTAATGTTATCCCTAACCAACCATATACTATCAGTTACTTCCTACAAAAAATGAGTGCCGGAGATGGGAACTATAGGTTCAACATCTTAGTACAAGAATCACAACTAGAGAACCCAACAACAGATGGTGATTGGGCAACGATTAGTGGAGGTCAATTAGCAGATAATAGCAGCATTAAACACAGTGCGTTTATGCCATCTTACTTCGAGTTTACTCCAACAAAGAGTAAGATTCGACTAGTACTTATAGCCGCACCAAAATGCGTAGCTCAGATTTCTGGTATAATGGTTAACATAGGTAAAAAACCTATTAAGTGGACTATGTCTACTGGGGAGAACTACAATACCAACGTTCGTATGAACTTAAATGGTATCCGAGTATCTCAGGTAGATAAGGATGGCGCAGAAATCGGTTATACCGTTATAACGCCGGAGAAATTTGCAGGTTATTACATCAGGGACGGTAAGCCGGAAGAGATATTCCGACTGGATGGTGATGAGACTTGGACTAAAAAGTTAAGAGCAGAAAATGAGATAAATATGGGACCAATCAAGATACTACGCGTAGAGAATACGAACAACGCAGGTTGGGCATTTATTTCAAACTACTAG

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence