Phage RBP Database

Genbank accession

UNA01498.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MTEYSPLQGMRFQSQLSKEMKRAYKEGDNVVALSFAEVIKVNYKYNTVDVITTKDKNTTTKNPNDNGKFSARLPVAFGGRTPEGNVYGTNTLVTVGSKVLIGFVDGNKDNPIVINIYGAVDNQSMLTRTTMTSGDESDAGVQRELWQLFNLYPSMTYTNVDGRGNREVTFSGKSFLYVTDTDQNNEYVQDEAFDYMDLPSSRYANGELIEPESPKAPTVLYVHQGIYEKHRFTVFIKSDGTFRMGSRNLNGHGVTYQQMNTDGSFSIVKKNDTTNPEEESYDQSSMEILKNGNVLLQNPKHKFEITDDGILVDGKKLSEIGGGGSGTNPEYEEAIRQINETIETMSVTMKSIEGGLETKVEKNTYEIDLDEIKGAQDALLAEIKAIIATLKVALEDLRTFIGSGFPDGKVTDTRKIELNKKMQSIDASKTVLDGKYTEVMADPFLSDTLKNTLKISKDRVDGYHQALHNVIDASITDGTITAQEKTDINTAITNYVTSLNNIEPVFTSSIEASITERIKEAVENPVNYTNKEMKKQSAVFTQLFNAISMKVSTEELTSQVQDLEIKMATKEEQKELADELERVDNKVNGALSNLPYRVEVSSTNGTVFVNDFIDSVVSARFYKGTDDITSTVGIGDIIWLRVSDDQAGDTAWNNNHKGIGNSFRLSVNDVRDRATFFCSYKTPPVATGSLTVANLKDISVSKTEPVNPRQGTMWYNMTDGKLYVYMDGKWQFSADGLDFNIRNLLTNSRDCTGGGWAFQSASRTNSQYQGTYIIETAANWGSADYAVTDLFTRGVVANNEDVTFCVLARLTGATGVTRNLSFFCEQSPASGTVVGTVTTDWKPFYITFKMLTAMNTAGSKLRFEVGDLTAANLKLQVCSHILVKGTSQVNWVPAPEDTQRDIDNINKDVGDIRTNVDSLGDDKRLTRFERSLIRSYLADITGTYYNPTDVPIALTEIDKPTYGKGKLFSIRQQARNIGLDTTKSPYYKKLGDAYTALIAYLNGFTPKPWDVTSSAIIDLPDRTLWNQKWNDYYNFYALFEIEVQDRQKEFTEQETQKMSKDTIAAISTAGNYETVPFENPLTVTPPIATLGLPEFQGNHQDSWEWNGRNYILHSDVAYSWTGKMNDNGFSTKQMSPLSVAAFDKQRVTFLLSYKLTDVVYGTVNPWVGMQLTVEYTDGVKEYPTLMGGKADGSPTTSDFVRRATTYQFNAAKTLKSLSVMLGGRDLTGKVEIKDYKIEVGNKTVDQAVWTLAPEDAWGAAGNRIRPVTNPMFSSGTNLTILGKFYGDGTVNDKFSWDTSGTPVKTRYWVDTTLDTLPKWAYSSKGVNTNSVNKLLKSSGNNEYPILFDDTVGNRVGRATLGFFEDYVILTSTDASDSFYQLGDYNMSLHGFSVGETVTLSAEVNGDLAGAYMSTWISDGTNWIEARGDVGIAGTWQKLKHTFKIPSNAKGLFFRIYFPRGTAATNTKLRIKKVQVERGNFATMWTPASLQTFKRVRADGATYAAIIHASEVIVKHDGKLLVRDGNTQESDTMGANATNGTLYVAIADTDSGWGDAYTPTEEEIKAYFAGWRMCNGQFGGQYVSGGKVWYPHGDKNLDRAATGRSTAPTDNSPSFVDKTARPYQFLYRLVDPIQDEVSFDGILELLPKANVVTTYYPAWTPPILAGTIKYGINLATVNQDTRYIIPTMMKRVASAEQKITDEAITSTVVNSREYTLGMKSKADSSDLGNYATKDELDKVNKGVDDRIKGEIDKIDFKPFVEKSELEQTARDWNAKFSAANGMNIVKNSIGFSGTDFWEMFQVNTTVETISNSALDSLGLGSGFYFRKDGKNKGITQKVKVIPNQPYTLGFYLNKMTKGAKGDQTYRFWIQVQNSAGTVTHQIDDNSDMTTNGLEGAYLTFTPLEDTVTIRFVAYANVEAIVSGIMLNIGDIPLQWTLSTGELYNTNVRMNLNGLRVAQNDANGVEVGYTQITPSEFAGFYKNGNGGYEKVFYLNGDETVTKKLKATQEITLGNIKIIDVTSTDITGWAFVPTVK

Physico‐chemical properties

protein length:	2033 AA
molecular weight:	225428,82820 Da
isoelectric point:	5,21722
aromaticity:	0,10034
hydropathy:	-0,42110

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	553	586	Coils	None
G3DSA:2.60.120.260	1764	1923	Gene3D	None

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage vB_BcgM [NCBI]	2918264	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

UNA01498.1 [NCBI]

Genbank nucleotide accession

OM743306.1 [NCBI]

CDS location

range 50758 -> 56859
strand +

CDS

ATGACAGAATATAGTCCATTACAAGGAATGAGATTCCAATCACAATTAAGTAAAGAAATGAAACGAGCGTACAAGGAGGGTGACAATGTTGTTGCCCTTTCTTTTGCGGAAGTTATTAAAGTTAACTATAAATATAATACGGTAGATGTAATCACTACTAAAGATAAAAATACGACAACAAAGAACCCTAACGACAATGGTAAGTTCTCTGCACGTTTACCTGTAGCATTCGGTGGTAGAACACCAGAGGGAAATGTGTACGGTACGAACACACTTGTAACTGTAGGTTCTAAAGTTCTAATCGGATTCGTAGATGGTAACAAGGACAACCCAATCGTAATTAATATCTACGGTGCTGTCGATAACCAATCTATGCTTACTAGAACAACTATGACAAGCGGTGACGAATCTGATGCAGGTGTACAACGAGAGTTATGGCAATTATTTAACTTATATCCTTCTATGACATATACAAACGTAGATGGTCGCGGTAACCGTGAAGTTACTTTCTCTGGTAAGAGCTTCTTATACGTTACTGATACAGACCAAAACAATGAATACGTACAGGACGAAGCATTTGACTACATGGACTTACCAAGTTCTCGTTATGCAAATGGAGAGTTAATCGAGCCGGAATCACCAAAGGCTCCAACAGTATTATACGTTCATCAAGGTATCTACGAGAAACATAGATTCACAGTATTCATTAAGTCAGATGGTACGTTCCGTATGGGTAGTCGTAATCTAAATGGTCACGGCGTTACATACCAACAAATGAACACGGATGGTAGTTTCTCAATTGTCAAGAAAAATGACACGACAAACCCAGAGGAAGAATCATACGACCAATCTTCTATGGAAATCCTTAAGAACGGTAACGTCCTACTTCAAAACCCAAAACATAAGTTCGAGATTACAGATGATGGGATTTTAGTAGATGGCAAGAAGCTATCCGAGATTGGTGGCGGCGGTAGCGGAACAAACCCAGAGTACGAAGAAGCTATCCGTCAAATCAATGAAACTATCGAAACAATGTCCGTGACAATGAAATCTATTGAGGGCGGACTTGAAACAAAGGTAGAGAAGAATACATATGAGATTGACCTTGACGAAATCAAAGGCGCACAAGACGCGTTACTTGCAGAAATCAAAGCAATCATCGCAACATTAAAAGTCGCTTTAGAAGACTTACGCACATTTATCGGTTCTGGTTTCCCGGACGGTAAAGTAACAGATACACGTAAGATAGAATTGAATAAAAAGATGCAATCTATTGACGCATCTAAAACGGTTCTAGATGGTAAGTATACAGAGGTTATGGCTGACCCGTTCCTTTCTGATACACTTAAGAACACATTAAAAATCTCTAAAGACCGCGTAGATGGTTATCACCAAGCATTACACAACGTAATCGATGCATCTATTACAGACGGTACAATCACAGCACAAGAGAAAACAGACATCAACACAGCTATCACAAACTATGTAACTTCTTTAAATAACATCGAGCCTGTATTCACTTCTAGTATCGAGGCATCTATCACTGAACGAATTAAAGAGGCTGTAGAGAATCCAGTGAATTACACGAATAAAGAGATGAAGAAGCAGAGCGCTGTCTTCACCCAACTATTCAATGCTATCTCTATGAAAGTTAGTACAGAGGAATTAACATCTCAAGTACAAGACTTAGAGATTAAGATGGCTACGAAAGAAGAACAGAAAGAACTTGCTGATGAGTTAGAAAGAGTAGATAACAAAGTAAATGGCGCTCTATCTAATCTTCCATACCGAGTAGAAGTATCTTCTACAAATGGTACAGTGTTCGTCAATGACTTCATCGATTCTGTTGTATCTGCTAGATTCTACAAAGGTACGGACGACATCACATCTACAGTAGGTATCGGGGATATTATCTGGCTTCGTGTATCAGATGACCAAGCAGGAGATACAGCATGGAATAATAACCACAAAGGTATTGGTAACTCATTCCGACTAAGTGTAAATGATGTTAGAGACAGAGCTACATTCTTCTGCTCATACAAGACTCCTCCAGTGGCTACAGGTAGCTTAACAGTAGCAAACTTAAAGGATATCTCGGTATCGAAAACAGAACCAGTAAATCCACGTCAAGGCACAATGTGGTACAACATGACGGACGGTAAGTTATACGTTTACATGGATGGTAAATGGCAATTCTCAGCAGATGGTTTAGACTTCAATATTCGTAACCTACTTACAAACTCACGAGATTGTACAGGTGGCGGTTGGGCGTTCCAAAGTGCATCAAGAACAAACAGCCAATATCAAGGTACGTACATCATCGAAACAGCAGCTAACTGGGGTAGCGCAGACTACGCGGTTACTGACCTATTCACTCGTGGCGTAGTAGCGAATAATGAGGACGTTACATTCTGTGTACTTGCTAGATTAACAGGAGCTACAGGTGTTACAAGAAACTTATCATTCTTCTGTGAGCAGTCACCAGCTAGTGGCACAGTCGTAGGAACAGTAACTACAGATTGGAAACCTTTCTACATCACATTCAAAATGCTAACAGCAATGAACACAGCAGGTAGCAAGCTTCGTTTCGAAGTAGGTGACTTAACAGCAGCTAACTTAAAACTACAAGTATGTAGCCATATCTTAGTTAAAGGTACATCACAGGTGAACTGGGTACCAGCTCCAGAGGATACGCAACGTGATATCGACAATATCAATAAAGATGTTGGAGACATTCGAACAAACGTAGACTCATTAGGTGATGATAAAAGGTTAACTCGTTTCGAAAGAAGTTTAATTCGTTCGTACTTAGCGGACATCACAGGTACATACTACAACCCAACAGATGTTCCTATTGCGTTAACAGAGATTGACAAACCAACTTACGGTAAAGGTAAGTTGTTCTCAATCCGACAACAAGCTCGTAACATCGGTTTAGACACAACTAAGAGTCCATACTATAAGAAGCTAGGAGACGCTTATACAGCGCTTATAGCATACCTTAATGGTTTTACACCTAAACCGTGGGATGTAACTTCTAGCGCAATCATAGACCTACCAGACCGCACGTTATGGAACCAGAAGTGGAATGACTACTACAACTTCTATGCTCTTTTCGAAATCGAAGTACAAGATAGACAAAAAGAGTTCACGGAACAAGAAACACAGAAAATGTCAAAAGACACTATCGCAGCAATCAGTACAGCAGGTAACTATGAAACTGTGCCATTCGAAAACCCATTAACAGTTACACCACCTATCGCTACATTAGGTTTACCAGAATTTCAAGGTAACCATCAGGATAGCTGGGAATGGAATGGTCGAAATTACATCTTGCATTCTGATGTTGCATATTCTTGGACAGGTAAAATGAACGATAATGGTTTTTCCACTAAACAAATGAGTCCTTTATCTGTAGCCGCATTCGATAAACAGCGAGTAACATTTTTACTATCGTATAAGTTAACCGATGTTGTCTATGGTACTGTTAACCCGTGGGTGGGTATGCAGTTAACAGTAGAGTACACAGATGGTGTAAAAGAGTACCCTACACTTATGGGGGGTAAAGCTGATGGTTCACCTACTACTAGTGATTTCGTTCGACGTGCTACTACATACCAGTTCAACGCAGCTAAAACACTAAAATCGTTATCTGTTATGTTAGGTGGACGAGACTTAACCGGCAAAGTAGAGATAAAGGACTATAAAATCGAGGTAGGTAACAAAACTGTTGACCAAGCAGTTTGGACTCTTGCTCCAGAAGACGCTTGGGGAGCAGCAGGTAATCGTATTCGTCCTGTAACAAACCCTATGTTTAGTAGCGGGACAAACCTTACTATTCTAGGTAAGTTCTATGGTGATGGTACAGTTAACGATAAGTTCTCTTGGGATACAAGCGGTACACCAGTAAAAACTAGATACTGGGTTGACACGACTCTAGATACTCTACCAAAGTGGGCTTACTCATCTAAAGGTGTTAACACGAATAGTGTGAATAAGTTACTTAAGTCTAGCGGTAATAACGAGTATCCTATTCTCTTCGATGATACTGTAGGAAACCGTGTTGGTCGAGCTACACTAGGGTTCTTTGAAGACTACGTAATCCTAACGAGTACAGACGCTTCCGATTCATTCTACCAACTTGGAGATTACAACATGAGCCTTCATGGTTTTAGTGTAGGCGAGACAGTTACATTATCCGCAGAGGTTAATGGAGACTTAGCAGGGGCGTATATGTCTACATGGATTAGCGATGGTACGAACTGGATTGAGGCACGAGGCGATGTAGGTATAGCGGGTACATGGCAAAAACTAAAGCACACGTTCAAAATACCTAGTAACGCTAAAGGACTTTTCTTCCGTATATACTTCCCGCGAGGTACAGCCGCAACAAACACGAAGTTACGGATTAAAAAGGTTCAAGTAGAGCGAGGAAACTTTGCAACAATGTGGACACCTGCAAGCTTACAAACTTTTAAACGAGTTAGAGCGGATGGAGCAACTTACGCAGCTATTATTCATGCATCGGAAGTTATAGTGAAACACGATGGTAAGCTTTTAGTAAGAGACGGTAATACACAGGAATCTGATACTATGGGGGCAAACGCTACTAACGGTACATTATACGTAGCCATCGCGGATACTGACAGCGGTTGGGGAGACGCATACACACCTACAGAAGAAGAGATTAAAGCTTACTTTGCAGGTTGGAGAATGTGTAACGGACAGTTCGGCGGTCAATATGTGTCTGGTGGAAAGGTTTGGTATCCACATGGTGACAAGAACTTAGACCGAGCAGCAACAGGTCGTTCTACAGCACCTACGGATAACTCACCATCATTTGTAGATAAAACTGCTAGACCGTACCAGTTCCTTTACAGACTAGTAGACCCAATCCAAGATGAGGTTTCATTTGATGGAATACTAGAGTTACTTCCAAAGGCTAACGTTGTGACAACGTACTACCCGGCATGGACACCGCCAATACTTGCAGGTACTATCAAGTACGGTATAAATTTGGCAACAGTCAATCAGGATACTCGATATATAATCCCAACGATGATGAAAAGGGTTGCTAGTGCAGAGCAAAAGATAACTGATGAAGCTATCACAAGCACAGTAGTCAACTCTAGGGAATACACGCTAGGTATGAAGAGTAAAGCGGATTCTAGTGATTTAGGTAACTATGCTACGAAGGACGAGTTAGACAAGGTAAATAAAGGCGTAGATGACCGTATCAAAGGGGAAATCGATAAGATAGATTTCAAGCCGTTCGTAGAGAAATCCGAGCTAGAGCAAACAGCTAGAGACTGGAATGCTAAGTTCTCCGCAGCAAACGGTATGAATATCGTTAAGAACTCTATCGGTTTTAGCGGTACAGACTTCTGGGAAATGTTCCAAGTTAACACGACTGTCGAAACAATTTCTAACTCCGCATTAGATAGTCTAGGTTTAGGTAGTGGATTCTACTTTAGAAAGGATGGTAAGAATAAAGGAATCACTCAAAAAGTTAAAGTTATTCCGAACCAACCTTATACTTTAGGATTCTACTTAAACAAAATGACGAAAGGTGCAAAGGGCGACCAAACGTACCGATTCTGGATTCAAGTACAGAATAGTGCAGGAACAGTTACGCATCAGATAGACGATAACAGTGATATGACAACAAACGGTTTAGAGGGAGCATATTTAACATTTACGCCTTTAGAGGACACAGTTACAATCCGTTTCGTGGCATACGCGAACGTTGAAGCTATCGTTTCTGGTATAATGTTAAATATAGGGGATATTCCTTTACAGTGGACTTTAAGCACAGGCGAACTGTACAACACAAACGTTCGTATGAACCTAAACGGCTTACGAGTAGCCCAGAATGACGCGAACGGCGTAGAGGTCGGTTATACACAAATCACACCGTCAGAGTTTGCCGGGTTCTACAAAAACGGTAATGGTGGGTACGAAAAAGTGTTCTACTTAAATGGTGACGAAACTGTAACTAAGAAATTAAAAGCAACACAAGAAATAACACTGGGGAACATTAAAATCATCGATGTTACCAGCACAGACATAACAGGTTGGGCATTCGTACCAACTGTTAAATAG

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence