Phage RBP Database

Genbank accession

AMW62392.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

Protein sequence

MVEFEPLETMRFQSQLGKEVKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTSADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSIYDNHRTTFFVKADGTFRLGSRHLSGGGITYQELRPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVLVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYYIDTAEIEAKVKEMKDNARKSKDSLQKSIEELVKYIANDVNTNPITDANKLQISKLLDDIDNKKITLDGAAQTILLDPFLTDEQKVAVKKWFDKLNSDHTALKTTVMAAMQDGNLTAQDKKDISTAAETYLNDLASWLTAMDKAADASYEQRIVEAFENAVNYANKESLHQSAVITQLYNMVSIKVSSEQVTQQFLDLNMKIEKTQEETSTALDDIKNQIDSTVKNLPYKVEVTSSNGLIFVNGGVNSTITAKVTKGTEDVTSTVAVADFIWTRVSNNTAADTAWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQGKWIEINRFDVNIRNLLIGSRDFGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSVWGGVKYKSSKLAGSGLLSVGDMVTYVCYVRTVGGTSPDKGIPIRLYVTDNRDGGNGTIGFEMKDKETDGKPVTGTPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKTVRVEPTSFTDIGAGGQLEVKSHMVVKGVIPSDWVPAPEDTKRDTDNTNWNMDALGNDNYLTRFERGLVKTKLADITGESLSGSQDMKTSAQLDADTWGKGQFYAIRKQARDIAIDPVNDAAYKNLTAAYDALRTYLRALKTGSGRNTVYPWDTSSDVVMDVVRTTWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNAEIGKISKTGQHSTADLRVPTTSISPKVTTIALPSFKGNTKNNLQVGGINLLNGTINPFEVKGTGATNQTNNIYAFSGGNSIEMINNTTIIGFYWSVVPDGTKPITGKMWMQGNNPYPTLTPTIEFSDSNNNGVMLFTRTPVGGNTFTHVNMRVDGLSGTLKVWNMMIAKGVTEETIEYSPRPDDKDANGNDVYYNRNRAIAGVTLPTFYTAKNGTTDTTRSSMTIQEVFHGDGTIRDEFYWTEDGQPTKVNRFADILLDTGYSIAIQNQNVSIGGKRYIQVQLNNFADKPILNNGTVRMANGKGVELSRLVTGNFTQPDQFKVDYANANISFLVSADEMNVTSTYQVKGQDVAFFLRGWKLFQGEPVQQTAPSGATIYSFPPYNATSGVAPNFTPIGYTQKDLAIINRGEIAATDTYKRPVEIAPPIKSKQTGQQWQIVYALNSQYDSYCSFTGAIDLIGDPEGVSPTVIRYAYVDWTPPFFDKDGTFMYGNNLATAQEDTRYLIPVLERRIANAETKVETDSIKSVVFSSREYELGLQDKANVTDLQGKADKGDLTNLATKDELAQKDAEQKKALEDAMKNIDFTPYVQKSEIEQLDRSWTAAFFASGGMNIVKNSIGFDKSVSPILKKETFTFWDAVSNTAYNLPESIQTNALDALGFTSGFMFNAATNNTATVIGQVLNVIPNQPYTISYFLQKMTAGDSTYRFNIELQRPTVDNPTNDSHWVTISGGQLEDNSSIKHSAFMPSYFEFTPTTSKVRLLLTASPKCTAQISGIMVNIGKKPIKWTMATGENYNTNVRMNLNGIRVSQVDKDGNEIGYTVITPEKFAGYYIKDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENANNAGWAFISNY

Physico‐chemical properties

protein length:	2001 AA
molecular weight:	221365,84060 Da
isoelectric point:	5,12696
aromaticity:	0,08896
hydropathy:	-0,47941

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	375	395	Coils	None
Coil	552	572	Coils	None
Coil	1680	1700	Coils	None

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage Zuko [NCBI]	1805956	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AMW62392.1 [NCBI]

Genbank nucleotide accession

KU737348.1 [NCBI]

CDS location

range 56268 -> 62273
strand +

CDS

ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTTCAATCACAACTCGGTAAAGAAGTAAAACGTAAATATAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTCAACTATAAATATAATACAGTCGACGTTATCACAGTAAGAGAAAATAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTACTCAGCTATGCTACCAACACATATGTCTGGTCGTACAGCTAACGGTAACATCTATGGTTCTACAACATTAGTAACTGTAGGTACTCGTGTACTAATCGGATTTATCGATGGACAAGTTGATACGCCAATCGTAATTAACATCTACGGCAAGACAGATGACCAACAACAATTAACTCGTACGGACTTCACATCAGCTGACGATTCAATCGAGTCTATTCAACAAGAACTTTGGAACACTTTTAATCTATACCCATCTATGACTTATGAAAACGTTGATGGTCGTGGTAACCGCGAAGTAACATTCTCTGGTAAAACATTCTTAATTTCAACAGACCGTGACCAAGAGAACATGTACGTACAAGACGCGCATTTCGATTATATGGACCTTCCACATTCTCGTTATGCAAATGGAGAGCTTATCGAACCAGAATCTCCTGATGCACCAACAGTACTGTACGTTCACCAAAGCATATATGATAACCATCGTACAACTTTCTTTGTAAAAGCAGATGGTACATTCCGATTAGGTTCTCGTCATCTTAGTGGTGGAGGAATCACGTACCAAGAACTAAGACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAAGGTGTACTTGTAAACGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATCTCTCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGTGGTCTTGAAACAAAAGTAGAGAAAGACACTTACTACATCGACACTGCTGAGATTGAAGCCAAAGTTAAAGAGATGAAAGACAACGCGCGTAAGAGCAAAGATAGTCTACAGAAATCTATTGAGGAACTAGTAAAATATATTGCTAACGATGTCAACACGAATCCTATTACAGATGCTAACAAATTGCAAATATCGAAGTTGTTAGATGACATCGACAACAAAAAGATAACACTAGACGGTGCCGCACAAACGATTTTACTAGACCCGTTCTTAACTGATGAGCAGAAAGTAGCTGTTAAAAAGTGGTTCGATAAGCTTAACTCGGACCATACTGCATTGAAGACAACTGTTATGGCAGCTATGCAAGATGGTAACTTGACAGCACAAGACAAGAAAGACATCTCAACTGCCGCAGAAACATATCTAAATGACCTTGCTTCTTGGTTAACAGCGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATCGTTGAAGCATTTGAGAACGCAGTAAACTACGCAAACAAAGAATCACTGCACCAGAGTGCAGTAATCACTCAGCTGTACAACATGGTTTCTATCAAGGTTAGTTCTGAGCAAGTAACACAGCAGTTCCTTGACTTGAATATGAAGATTGAGAAGACACAAGAAGAGACATCAACAGCCTTAGACGACATCAAAAACCAGATTGACAGTACAGTTAAGAACTTACCGTACAAGGTAGAAGTTACATCGTCTAATGGTCTGATATTTGTCAACGGCGGAGTTAATTCTACGATTACAGCTAAGGTTACTAAAGGTACGGAAGATGTAACAAGTACAGTGGCTGTAGCAGATTTCATCTGGACTCGTGTTTCCAATAACACAGCAGCAGATACAGCGTGGAACAACGCTCATAAGAACGTAGGTCGCTCATTCAATATCAATGCTGCTGATGTAATCGATAGAGCTACATTCTTCTGTGACTACAAGAATCCACCAGTGGCTACAGGTAGTGTTACAATTGCGAACATACAAGATATCACAGTTGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCACTATGGTATGACCGTGGAACAGGTATCGTATGGATGTGGCAGCAAGGTAAATGGATTGAGATTAATAGATTTGACGTTAACATTCGTAACTTATTAATTGGTTCTCGTGACTTTGGTGCACAGAATTCTAACAACCCAACAGACCCTAATAACTCAACACCTCAAGGAAACATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGAACACCACCAAAAACAGGAGTTAAACCTTCACCACAAAACGCTACGAATCAGGATACATGGATATCGTATACGCAAAGCGTATGGGGCGGAGTTAAGTACAAATCTAGTAAACTTGCTGGAAGCGGTCTATTATCTGTTGGTGATATGGTAACTTACGTGTGTTACGTGAGAACCGTAGGCGGAACAAGTCCTGATAAAGGCATACCTATTAGACTATATGTGACAGATAACCGCGATGGTGGTAATGGAACAATTGGTTTCGAAATGAAAGACAAAGAGACTGACGGTAAACCAGTCACTGGAACCCCTGTACAAATGCGCGCGACACAACAATGGAAGATGGTGTGGGGTACATTCCCTGTAACACAATTATTCCTAGACACTGCAAACGACCCTAATAGTACATCTAAGACTGTTCGTGTAGAACCAACAAGTTTCACAGACATTGGAGCCGGAGGACAACTAGAAGTTAAGTCTCACATGGTTGTCAAAGGTGTTATTCCTTCTGACTGGGTTCCAGCCCCAGAAGATACAAAACGTGATACGGATAACACTAACTGGAACATGGATGCACTTGGTAATGATAACTATCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAGCTAGCAGACATTACAGGTGAATCTCTATCAGGTTCTCAAGATATGAAGACATCAGCTCAGTTAGACGCAGACACATGGGGTAAAGGTCAGTTCTACGCTATCCGTAAACAGGCTAGAGACATCGCTATAGACCCTGTAAACGACGCAGCGTACAAAAACCTAACCGCAGCTTACGACGCGCTTAGAACGTATCTGAGAGCTCTTAAAACAGGTTCTGGTAGAAATACAGTTTACCCGTGGGATACTTCTTCTGATGTAGTCATGGATGTAGTACGTACTACATGGGATAAAGCGTGGGCGGATTACGAGAATGCTTATGCATCGTTAACTGTTCTTGTGCAGCAGAAACAGAAGACATATACGGATGATAGAATCAAAGATGTTAACGCAGAGATTGGTAAGATTAGTAAAACGGGGCAACACTCGACTGCTGACTTACGAGTACCGACAACTTCTATTTCACCTAAAGTTACAACAATAGCTTTACCGAGTTTTAAGGGTAATACTAAGAACAACTTACAGGTTGGTGGGATTAACCTACTTAATGGGACGATTAATCCTTTTGAAGTGAAAGGTACTGGTGCTACAAACCAAACAAACAACATTTATGCGTTTAGTGGTGGAAACTCAATAGAGATGATAAACAACACTACAATCATAGGATTCTACTGGAGTGTTGTACCGGACGGTACTAAACCAATAACAGGTAAAATGTGGATGCAAGGAAACAATCCTTATCCGACATTAACCCCTACCATTGAATTTTCCGATTCCAACAACAACGGCGTAATGTTGTTCACTAGAACACCTGTAGGCGGCAACACATTTACTCACGTGAATATGCGAGTAGACGGTTTGTCAGGTACCTTAAAAGTATGGAATATGATGATTGCAAAAGGTGTTACAGAGGAGACAATTGAGTACTCCCCTCGTCCGGACGATAAGGATGCAAACGGTAATGACGTGTACTACAATCGAAATAGAGCTATCGCAGGTGTAACATTACCTACATTTTACACAGCTAAAAACGGAACTACAGATACAACACGTTCGTCAATGACGATACAGGAAGTGTTCCATGGTGACGGTACTATTCGAGATGAGTTCTACTGGACAGAAGACGGACAACCTACCAAGGTTAATAGATTCGCGGATATACTTCTAGACACAGGTTACTCTATTGCCATCCAAAACCAAAACGTGTCTATTGGTGGAAAACGATACATTCAAGTACAACTAAACAATTTTGCAGATAAACCTATACTAAATAACGGTACGGTTCGTATGGCTAATGGTAAAGGGGTAGAGCTTAGTCGTTTAGTTACAGGAAACTTTACGCAACCAGACCAGTTCAAAGTAGACTATGCTAACGCGAATATATCATTTTTAGTATCTGCGGATGAGATGAACGTTACTAGCACGTATCAAGTAAAAGGTCAAGACGTAGCATTCTTCTTACGTGGATGGAAGTTATTCCAAGGCGAACCAGTTCAACAAACAGCGCCTAGTGGAGCTACTATTTACTCATTCCCGCCTTATAACGCTACTAGCGGAGTTGCACCTAACTTCACTCCAATAGGGTACACTCAAAAGGACCTAGCGATTATAAACAGAGGAGAAATTGCCGCTACTGATACGTACAAGAGACCCGTTGAGATTGCGCCTCCTATAAAGTCAAAACAGACAGGACAGCAATGGCAAATCGTTTACGCGCTTAACTCACAGTACGATTCTTATTGCTCATTTACTGGAGCTATTGATTTAATCGGTGACCCAGAAGGTGTTTCACCTACAGTTATCCGTTATGCGTACGTAGATTGGACTCCTCCGTTTTTCGATAAAGACGGTACATTTATGTATGGTAATAACTTAGCAACCGCTCAAGAGGACACTAGGTACCTTATACCTGTACTTGAACGTCGTATAGCTAATGCAGAGACGAAAGTAGAGACAGATTCCATTAAGAGTGTTGTGTTTAGTTCACGTGAGTACGAGTTAGGGTTACAGGACAAAGCAAATGTTACAGACCTTCAAGGTAAAGCAGATAAAGGTGACTTGACTAACTTAGCTACAAAAGACGAGTTAGCTCAAAAAGATGCAGAACAGAAGAAAGCGTTAGAGGATGCCATGAAGAATATCGACTTCACACCATATGTGCAGAAGTCAGAAATCGAACAGTTAGACCGTTCATGGACAGCAGCATTCTTCGCATCAGGCGGTATGAACATCGTAAAGAATTCTATCGGTTTTGACAAGTCTGTTAGCCCTATATTAAAGAAGGAGACGTTTACATTCTGGGATGCAGTATCTAACACAGCTTACAACTTACCAGAAAGTATACAAACTAACGCTCTTGACGCATTAGGTTTCACAAGTGGGTTCATGTTTAACGCAGCTACAAATAACACAGCTACAGTAATCGGTCAAGTACTAAATGTTATCCCTAACCAACCGTACACTATCAGCTACTTCCTACAGAAGATGACCGCAGGAGATAGTACGTACAGATTCAACATCGAGCTCCAAAGACCTACTGTAGACAATCCAACTAATGACAGTCACTGGGTAACAATTAGTGGTGGTCAGTTAGAGGATAATAGTAGCATTAAGCATAGTGCGTTCATGCCTTCTTACTTTGAGTTTACACCAACAACGAGTAAGGTAAGACTTCTGTTAACAGCCTCTCCTAAGTGTACCGCACAGATTTCGGGTATAATGGTTAACATAGGTAAAAAACCTATCAAGTGGACAATGGCTACTGGTGAGAACTATAACACAAACGTCCGCATGAACTTAAATGGTATCCGTGTATCTCAGGTTGACAAGGATGGTAACGAGATTGGTTATACCGTTATAACGCCGGAGAAATTTGCAGGTTACTATATTAAGGATGGTAAACCAGAAGAAATTTTCCGACTGGATGGTGATGAAACTTGGACTAAGAAGTTGAGAGCAGAAAATGAGATAAACATGGGACCAATCAAGATACTACGCGTAGAGAATGCAAACAACGCAGGTTGGGCGTTTATCTCAAACTACTAG

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence