Phage RBP Database

UniProt accession

J9PVK4 [UniProt]

Protein name

Putative tail fiber

RBP type

TF

Evidence GenBank

Probability 1,00

TF

Evidence Phold

Probability 1,00

Protein sequence

MTEYQPLNGMRFQSQLSKELKRAYKEGDNIVTLSFAEVIKVNYKYNTVDVITTKYKNSTTKNPNDNGKYSARLPIQFGGRTPQGNVYGTNTLVTVGSKVLIGFVEGNKDNPIVLNIYGAVDNQSMLTRTTMTSGDESDEGVQRELWQLFNLYPSMTYTNVDGRGNREVTFSGKSFLYVTDTDQNNEYVQDEAFDYMDLPSSRYANGELIEPESPKAPTVLYVHQGIYEKHRFTVFIKSDGTFRMGTRNPNGHGITYQQMNPDGSFSIVKKNDTTNPEEESYDQSSMEILKNGNVLLQNPKHKFEITEEGIMVDGKPIGSGGGNGGGTNPEYDEAIRQINKTIETMKITMKAVEGGLQTKVEKNTYEIDLDEIKGAQDALLAEIKTILATLKTSLEDLRTFVGSAFPDGKVTDTRKIELNKKMQAIDSSKTVLDGKYAEVMADPFLSDTLKNTLKISKDRVDGYHQALHNVIDASITDGTITAQEKTDINTAITNYVTALTNIEPVFTSSIEASIVERIKEAVENPVNYTNKEMKKQSAVFTQLFNAISMKVSTEQLTSQVQDLELKMATKEEQIALTNELDKVNNKVDGALSNLPYRVEVTSTNGTVFVNDFIDSVVSARFYKGADDITSTVGIGDIIWTRVSEDQAGDLAWNNNHKGIGNSFRLSVNDVRDRATFFCSYKTPPVATGSITVANLKDISVSKTEPVNPRQGTMWYNMTDGKLYVYMDGKWQFSADGLDFNIRNLLTNSRDCTGGGWTLQSATRTNNQWQGTYIIETAANWGSADYACVDLFTRGVVAANDEVTFCVLARLTGATGVTRPLQFFCESSDKSGTTVGTVTTEWKPFHITFKMLAAMNTAGSKIRFEVADLTSANLKLQVNSHILVQGNSPVNWVPAPEDTQREIDGINNDVKDIRTSVDALGDDGKLTRFERSLIRSWIADITGTYYNPTDVPVPLTEIDKPAYGKGKLYSIRQQARNIGLDIATSPYYKKLGDAYTALIAYLNGFTPKPWDVSSSAIIPIADRVVWNQKWNDYYNFYALFEIEVQDRQKQYTEQKAQEMSDKTIAAISTPGNHDTVPFTNPVTVTPKIATLGLPEFEGNHQDSWYVNGRNLVAGTLTSKTLEGTNASNQTMNIYSFVAGNSIELMGSEFTISYDWSIEGANPSGTMYMQGSNPYPQVAPKITFSSTNIRGREKATLTMPSNIATFISINMRCDNMVGKLTISNLKIELGKNLNPVYTPAPTEGWGTIGNRIRPVTNPVFSSGTDLTILASFYGDGTVNDKFSWDTSGTPVKVKYWIDKSLDTQQQWSYSSKGLNTDSVNKFIKASGNNEYPILFDDNVTNRSGRTTLAFYEDYVIMNCTDSSDSFYQLGDYNMNLHGFSVGETITFSAEVNGDVAGAYMSTWISDGTNWIETRGDVGTAGTWQKLKHTFKIPANAKGLFFRIYFPRVAAANNTKLRFRKVQVERGTNATTWTNANKQTFKRVRGDGATYASIAYASEIVVKHDGKILPRDGNTPEADQMAVNATTGQLYLSLADVDTGWSDSYTPTVEEIKSYFLGWRMCNGQFGGQYVSGGKVWYPQGDKNLDRAVTGRATAPTEVSPSIKDNTIRPYQFVYRLVDPIQEEVSFDGILELLPKANVITTYYPLWTPPIRTGTIKYGTNLATVAQDTRYIVPTMMKRIANAEQKITDEAITNTVVNSREYTLGLKSKADASDLGNYATKDELDNVNKGVDDRIKGEIDKLDFSPFVEKSQLEQTARDWNAKFSAANGMNTIKNSIGFSGTDFWNMYAPNTTVETISNSALDSLGLGSGFYFRPDGKDKGIMQTVKVIPNQPYTLGFYLNKMTKGAVGDSTFRLWIQIRNSAGVTIKQVDNNSDKTTNGLEGGYLTFTPLEDTVTICFIAYSKVEAIVSGIMLNIGDIPLQWTLATGELYNTNVRMNLNGLRVAQLDANGAEVGYTQITPSEFAGFYKNGNGGYEKVFYLNGDETVTKKLKATKEITLGNIKIIDVTSTDITGWAFVPTVK

Physico‐chemical properties

protein length:	2019 AA
molecular weight:	223694,21720 Da
isoelectric point:	5,34584
aromaticity:	0,09757
hydropathy:	-0,41882

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	553	586	Coils	None
G3DSA:2.60.120.260	1763	1908	Gene3D	None

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage B4 [NCBI]	1141133	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus cereus [NCBI]	1396	Bacteria > Firmicutes > Bacilli > Bacillales > Bacillaceae > Bacillus

Coding sequence (CDS)

Genbank protein accession

AEZ66040.1 [NCBI]

Genbank nucleotide accession

JN790865 [NCBI]

CDS location

range 129151 -> 135210
strand -

CDS

ATGACAGAATATCAACCATTAAATGGAATGAGATTCCAATCACAATTAAGTAAAGAATTGAAACGAGCGTATAAGGAGGGTGACAATATTGTTACCCTTTCTTTTGCGGAAGTTATTAAAGTTAACTATAAATATAACACAGTAGATGTAATCACTACTAAATATAAAAATTCTACAACAAAGAATCCAAACGACAACGGTAAGTACTCTGCACGTTTACCTATACAATTCGGTGGTAGAACACCGCAAGGTAACGTATACGGTACAAACACACTTGTAACTGTAGGCTCGAAAGTCCTAATCGGATTCGTAGAAGGTAACAAAGACAACCCAATCGTATTAAATATTTATGGAGCAGTTGACAACCAATCTATGCTTACTAGAACAACTATGACTAGTGGCGATGAATCGGATGAAGGTGTACAACGTGAGCTATGGCAATTATTTAATTTATACCCATCTATGACATATACAAATGTGGATGGTCGCGGTAACCGTGAAGTTACTTTCTCTGGTAAGAGCTTCTTATATGTTACTGACACTGACCAAAACAATGAATACGTACAGGACGAGGCATTTGACTACATGGACTTACCGAGTTCTCGTTATGCAAATGGAGAGCTGATTGAACCAGAATCACCAAAGGCTCCAACAGTCCTTTATGTACATCAAGGCATCTACGAGAAACATAGATTTACAGTGTTCATCAAATCTGACGGTACATTCCGTATGGGTACTCGCAATCCAAATGGTCACGGTATTACATACCAACAAATGAACCCAGACGGTAGTTTCTCCATTGTCAAGAAAAATGATACGACAAATCCAGAAGAGGAATCATACGACCAATCTTCTATGGAAATCCTAAAGAATGGTAACGTACTTCTTCAAAATCCAAAGCATAAGTTCGAGATTACAGAAGAAGGTATCATGGTAGATGGTAAACCAATCGGTTCCGGTGGCGGCAACGGTGGCGGTACAAACCCGGAATACGATGAGGCTATCCGACAAATCAATAAAACTATCGAAACAATGAAGATTACTATGAAAGCTGTAGAAGGTGGACTACAAACAAAGGTAGAGAAAAATACATACGAGATTGACCTTGACGAAATCAAAGGCGCTCAAGATGCGTTACTTGCAGAGATTAAAACAATTCTAGCAACTCTAAAAACTTCTCTAGAAGACTTACGTACATTCGTTGGTTCTGCTTTCCCGGATGGTAAAGTAACGGATACACGTAAGATAGAGTTAAACAAAAAGATGCAAGCAATTGACTCATCTAAAACCGTTCTTGACGGTAAGTACGCAGAGGTTATGGCTGACCCGTTCTTATCGGATACACTTAAGAACACATTAAAAATCTCTAAAGACCGCGTAGATGGTTACCACCAAGCATTACATAACGTAATCGATGCATCTATCACAGATGGCACAATCACAGCACAAGAGAAGACAGATATCAACACAGCTATCACGAACTATGTAACTGCTTTAACTAACATAGAACCTGTGTTCACTTCTAGTATCGAAGCATCTATTGTCGAACGTATCAAAGAGGCTGTAGAGAATCCAGTAAACTACACGAATAAAGAGATGAAGAAACAAAGCGCTGTATTCACTCAATTATTCAATGCTATCTCCATGAAAGTTAGTACAGAGCAATTAACATCTCAAGTACAAGACTTAGAGCTTAAGATGGCTACAAAGGAAGAGCAGATAGCTCTTACAAATGAACTAGACAAAGTAAATAACAAAGTAGATGGAGCTTTATCAAATCTACCATATCGCGTAGAGGTTACGTCTACAAATGGTACTGTGTTCGTCAATGACTTTATCGATTCTGTAGTATCTGCTAGATTTTACAAAGGTGCAGACGATATCACGTCTACAGTAGGTATCGGAGATATTATCTGGACTCGTGTATCAGAAGACCAAGCCGGAGACTTAGCATGGAATAACAACCATAAAGGTATTGGTAACTCATTCCGATTAAGTGTAAATGATGTGCGAGATAGAGCTACATTCTTCTGCTCATACAAGACTCCTCCAGTAGCTACAGGAAGTATTACAGTAGCGAACTTAAAGGATATCTCTGTATCGAAAACAGAACCAGTAAACCCACGTCAAGGTACAATGTGGTACAACATGACGGATGGTAAGTTATACGTTTACATGGATGGAAAATGGCAATTCTCCGCAGATGGTCTTGACTTCAACATTCGTAACCTACTTACAAACTCACGAGATTGTACAGGTGGAGGTTGGACGCTTCAAAGTGCAACAAGAACAAACAACCAATGGCAAGGTACGTACATCATTGAAACAGCAGCTAACTGGGGTAGCGCGGACTACGCATGTGTAGACTTATTTACTCGTGGTGTAGTAGCTGCTAATGACGAAGTTACGTTCTGTGTACTTGCTAGACTAACAGGAGCGACAGGTGTTACAAGACCTTTACAATTCTTCTGTGAAAGTTCTGATAAGAGCGGTACAACAGTAGGTACAGTAACGACAGAGTGGAAGCCGTTTCACATCACGTTCAAAATGTTAGCAGCAATGAATACAGCAGGTTCTAAGATTCGATTCGAGGTTGCTGATTTAACATCAGCTAACTTAAAGCTACAAGTAAACAGTCATATCCTAGTACAAGGTAACTCTCCTGTAAACTGGGTTCCAGCCCCAGAGGATACACAACGAGAAATCGATGGCATTAACAACGACGTTAAAGACATCCGTACAAGTGTAGATGCCTTAGGGGATGACGGTAAACTAACTCGATTCGAAAGGAGTTTAATCCGTTCATGGATTGCAGATATCACAGGCACATATTACAACCCTACAGATGTCCCAGTACCATTAACAGAAATCGATAAACCTGCTTATGGGAAAGGTAAGTTATACTCCATCCGACAACAAGCGCGTAACATCGGTTTAGACATTGCAACAAGCCCTTACTATAAGAAGCTCGGAGACGCTTATACAGCGTTGATAGCATACCTTAATGGTTTTACACCTAAACCGTGGGATGTAAGCTCTAGCGCGATTATACCTATCGCAGACAGGGTGGTATGGAACCAGAAGTGGAATGACTATTACAATTTCTATGCTCTGTTCGAAATCGAAGTACAGGACAGACAGAAGCAGTACACAGAACAGAAAGCGCAAGAGATGTCGGATAAAACTATCGCTGCAATTAGCACACCGGGTAATCATGACACTGTGCCATTCACAAATCCAGTAACAGTCACACCAAAAATCGCAACACTTGGTTTACCGGAGTTCGAAGGTAATCACCAAGATAGCTGGTATGTAAATGGTCGTAACCTTGTAGCTGGTACATTAACATCTAAGACATTAGAAGGTACGAACGCATCTAACCAAACAATGAATATCTACAGCTTCGTTGCTGGTAACTCTATTGAACTGATGGGTTCGGAGTTCACGATTTCATATGACTGGAGCATAGAAGGAGCAAACCCTTCCGGAACAATGTATATGCAAGGTAGTAACCCATACCCGCAGGTTGCACCAAAAATAACATTCTCTAGTACGAACATAAGAGGTCGAGAAAAAGCTACGTTGACTATGCCATCAAACATAGCAACATTCATATCCATTAACATGCGTTGCGATAACATGGTAGGTAAGTTAACAATATCTAACTTGAAAATCGAGTTAGGTAAAAACCTAAACCCTGTTTATACTCCTGCACCTACAGAGGGTTGGGGTACAATCGGTAACCGTATTAGACCTGTTACAAATCCGGTATTCAGTAGTGGAACTGACTTAACTATCTTAGCTAGTTTCTATGGTGACGGGACAGTTAATGATAAGTTCTCTTGGGACACAAGTGGTACACCAGTTAAGGTTAAATACTGGATTGACAAGTCACTAGATACGCAACAACAGTGGTCTTACTCATCTAAAGGTTTGAATACTGATAGCGTGAATAAGTTCATTAAAGCTAGTGGTAACAACGAGTATCCGATACTATTTGATGATAATGTGACTAACCGTTCTGGACGTACAACATTAGCTTTCTACGAGGACTATGTAATAATGAACTGTACTGATAGTTCTGACTCGTTCTATCAGCTAGGCGATTACAACATGAACCTACACGGGTTTAGCGTAGGTGAGACTATCACATTCTCCGCAGAAGTTAACGGAGATGTAGCAGGGGCTTACATGTCTACGTGGATTAGTGATGGTACAAACTGGATTGAGACAAGAGGAGATGTTGGTACAGCAGGTACATGGCAAAAACTCAAGCACACTTTCAAAATCCCAGCTAACGCTAAAGGTCTTTTCTTCCGTATCTACTTCCCTCGTGTTGCAGCAGCAAATAATACAAAGCTAAGGTTTAGAAAGGTGCAGGTAGAGAGAGGAACTAACGCTACAACTTGGACTAACGCAAACAAACAAACGTTCAAACGTGTTAGAGGTGACGGAGCGACATATGCATCTATAGCTTACGCATCAGAGATTGTAGTAAAACATGATGGTAAGATACTACCTAGAGATGGTAACACACCAGAAGCCGACCAAATGGCGGTAAACGCTACGACAGGTCAATTGTATTTATCTCTAGCAGATGTCGATACTGGTTGGAGCGATTCTTACACACCAACAGTAGAGGAGATTAAATCTTACTTCTTAGGTTGGAGAATGTGTAACGGTCAGTTCGGAGGTCAATATGTTTCTGGTGGTAAGGTTTGGTATCCACAAGGTGACAAGAATTTAGACCGAGCAGTAACAGGTCGAGCTACTGCACCAACGGAAGTATCACCATCTATTAAAGACAACACGATTAGACCATACCAATTCGTTTATAGACTAGTAGACCCAATTCAAGAAGAAGTTTCATTCGATGGAATCTTAGAGTTACTTCCAAAAGCTAATGTCATCACAACGTACTACCCGTTATGGACACCACCAATCCGTACAGGTACTATCAAGTATGGTACAAACTTAGCTACAGTAGCGCAGGATACTCGTTATATCGTACCAACGATGATGAAACGTATCGCGAATGCGGAGCAAAAGATAACTGATGAAGCTATCACAAACACAGTTGTCAACTCTAGGGAGTACACGCTAGGTCTTAAGAGTAAAGCGGATGCTAGTGATTTAGGTAACTACGCTACGAAAGACGAGCTAGATAACGTTAATAAGGGTGTAGATGACCGTATCAAAGGTGAGATAGATAAGTTAGACTTCTCTCCATTCGTGGAAAAATCTCAGTTAGAACAAACAGCTAGAGACTGGAATGCGAAGTTCTCCGCAGCAAACGGTATGAACACTATCAAGAACTCCATCGGTTTTAGTGGTACGGACTTCTGGAATATGTACGCACCTAACACAACTGTAGAAACTATTTCAAACTCTGCTTTAGATAGTTTAGGTTTAGGTAGCGGATTCTACTTTAGACCAGATGGCAAGGACAAGGGTATTATGCAAACAGTCAAAGTTATACCGAACCAGCCGTACACTTTAGGATTCTATCTAAATAAAATGACGAAAGGAGCTGTAGGTGACTCTACATTTAGATTATGGATTCAAATACGTAATAGTGCAGGTGTAACGATAAAGCAAGTAGATAACAATAGCGATAAAACGACAAATGGTTTAGAGGGAGGATATTTAACATTTACGCCTTTAGAGGACACTGTAACAATCTGTTTCATAGCATACTCGAAGGTTGAAGCTATCGTTTCTGGTATAATGTTAAATATAGGGGATATTCCTTTACAGTGGACACTAGCAACAGGAGAGCTATACAACACAAACGTTCGTATGAACTTAAATGGTTTACGTGTAGCACAGCTCGACGCTAATGGTGCCGAAGTTGGTTATACACAAATCACACCGTCAGAGTTCGCCGGATTCTACAAAAACGGTAATGGCGGATACGAAAAAGTGTTCTACTTAAATGGTGACGAAACTGTAACTAAGAAGTTAAAAGCAACAAAAGAGATAACACTAGGTAACATCAAGATAATTGACGTCACTAGTACAGATATAACAGGTTGGGCATTCGTACCGACTGTTAAATAG

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence