Phage RBP Database

Genbank accession

CAL9954940.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MPRKQSTNRNVGNVQKFVGTSYDEMKALYDNLDALLALETGVQYTLRYLGPSAGDAPSTREDGSPIQDGDYFFDTDADALVYYDAVDDIWFAVDPSEVIQARDEAIAASIVAGQAKDNAELAANNARLSENTAKVYETNAEASKDAAGLSEMSAGLSATDAATYAAQSAIDASNTAADVMTTNADVVTTTDNAATTSTHAINAKNSETAAALSAQQAEQAFDSFDDRYLGTFSTPPTTDNDGDPLVKGATYYNSVELAVYYWNGAVWEAPDKSASDSADAAAASAATATTKAGEASNAATTALNAQTAAKSSENAAQSSQNAAEAAEVGAELAESNAATSEANAAESETVARASENNAANSAASAKENADRSEQHAAGGKGLTLAIRDALRAQRKREYTGSGFTEWGNQYDYNDGDPVQHGLWTYYGSTGSANELGLGADPSVDPNNLQGESRTDYPIANVDGVEMSLIGSTTSTPAYKNANKILFPTAPDGSKTLNESTGEVRKYHDLAGVGTPYEAHTVDFDGSTYIDLVASPYVMPVGSKVEFKFKLNDVSGYQYLFDTQNLTRVYIYKTTGTNNLLWGGFGSTIKVNGVDISTNTFAVEAGVEYHIEATTNATSNIDRIGAKSAGGVLSDFARGQIWDITLASSEDGVEPITYNTVTTQPKDDAAPVVSEIDAGDNPDMPTGYMPFYQDAGYVTIPEFPLADSMNISMVMRPDNDTELMVFGQNPEGQTMRLYWYNDTSSGLFRIAAGSGTSLTFDPLVAGRVYVTEVQIRKNVGASDYTVTAQVNGVIKTQSNVTFGHNTFDSFTLGSEEGVKNNNRWDGAIFGFGIEYPDAPDLNRTYGSVEVDDPAGRLTVEDDLGFGTEDWTPEFDGFNNVIVPPVMNFTGIARELEMTVVPDNVGSSWRIGQTFSKDGEVNRFYLRYDASGTITAGIGNATIQSVLNMTVGETYNFKFICDNSLNIELFVNGVSTITGTTSFRADFVLDNFYLGAAGTADSGPSEHLNGKLTNVRITDPNSVANSRHYPLVINQPTQPDTLIAEDAGYDKDTAPFYTPSYSNTDGWVEIPEITLGSGDAIKLKFQWEDEGKAYDGILDNASVPSLHLRIHNDGRLRWTNHGTLRVNGTVYTDGSFYPVSGEVYEVEIALDRNLTLARIGRLYNGNHWSGKIWDIEFTDNTDPTNSRYYPSVDYRVDGDTSGTVLDETHGLLSDSFSDGRWVESAAGTINGESLTITSSFGSGRVGTFPSPAINGVDVTVSFDVVSYSGTTNGGRVIVYRNGSQDGNLGTFDSSDVGTRVTLTANPTGNYGSDGNDVVFYVDASGISFEVANVEVSANNNGTLVNFPSGSEWTLAQVDGASDGTLENFTAGLEWNNDLPITDGTMVGFAQPWHHETGRYIGSIIGETTQAVWDVQDSQKAFHDVKYNADFHVITSRKDLVFLETWLEKVEGFVRPYGNVQFGGSSHDGVTLVPVTNFKAQGYSAFGEWDENTVGKVADWDAMTPTQKSVWASNPKNNLVFNPEDNEYYQDSYRIRTVEGLGDEWACVRPTIASTGTPTWLGYAQSGTNSRYIVQRGQREDTRDWYKDNTVSGTIFGGTNRSGFNDDEPTIFQNTEGANTSSANGKCFAMPIALVQRLNQGAYHPTYNPQGCDGFISSGGGSLARWYVSTLFRDATTTENCFRLRVGYPAIDGFRYGHGFIGSAGGSGRADQYKYYDAIYAGQVEDLRLNANKQDKQELLTDAVRRGVRGETRGKGKVPFTTVQTADQAATGSPTSAFDGIDTSHITVGDMCWAEDAAGDYQRRTITYAGSNGTISFNETIQGRKSDSKLIHERELSAEYDSLPWVDLIGDPERIAATFPDGVVGQWIPDLTTGNSDRDLNRKGIVLTGTLFTENDGASWTVESKAINSTTNTVNTFLDSSLLRLYLLTYEALSDFTESDDNLAVVGDLGDVYNAKFYTIERGNRIAPSLLGVILKDNRDPTHHQLRVNSYSIHPANGDLDGGSGYLPIHEPIRLPAPANDSDAVKALPHLVEKDGLLYVQWHGTQLFYDAAGTVGNEWGDTFAGTTFTNAYGKISIVDGEDTKPDENGNTVKVVTHTETIPIGIANHNQDI

Physico‐chemical properties

protein length:	2109 AA
molecular weight:	227468,22870 Da
isoelectric point:	4,42141
aromaticity:	0,09768
hydropathy:	-0,42632

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR013320	880	1017	InterPro	Concanavalin A-like lectin/glucanase domain superfamily

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage D502 [NCBI]	3105266	Viruses > unclassified bacterial viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAL9954940.1 [NCBI]

Genbank nucleotide accession

OZ195716.1 [NCBI]

CDS location

range 2364 -> 8693
strand +

CDS

ATGCCACGTAAACAGTCAACCAACAGAAATGTTGGTAATGTACAAAAATTCGTAGGGACATCCTACGATGAAATGAAAGCCCTTTACGATAATCTTGATGCGTTGTTGGCATTGGAAACAGGTGTCCAGTACACATTACGTTACTTAGGCCCATCTGCCGGAGATGCTCCGTCAACTCGTGAAGATGGTTCACCAATCCAAGATGGTGATTATTTCTTTGATACAGATGCGGATGCCTTGGTGTACTACGATGCAGTTGATGACATTTGGTTTGCAGTTGACCCAAGTGAAGTTATTCAAGCTCGTGATGAAGCTATTGCTGCATCTATCGTTGCAGGCCAAGCAAAAGACAATGCAGAATTAGCGGCAAACAATGCACGCTTATCTGAAAATACTGCAAAAGTGTACGAGACCAATGCTGAAGCATCAAAGGATGCAGCAGGGTTGTCTGAAATGTCTGCAGGCTTGAGCGCAACAGATGCCGCTACATATGCAGCACAATCAGCAATTGACGCGTCAAATACTGCCGCAGATGTCATGACAACAAATGCAGATGTGGTGACTACAACAGATAACGCTGCGACAACTTCTACCCATGCAATCAATGCAAAAAATTCTGAGACGGCTGCAGCTCTTTCAGCTCAACAAGCAGAACAGGCATTTGATAGTTTCGATGACCGTTACCTGGGTACGTTTTCTACCCCGCCTACAACAGACAATGATGGTGACCCTCTAGTAAAAGGCGCTACTTACTACAACTCTGTGGAATTAGCGGTGTACTACTGGAATGGTGCTGTATGGGAGGCACCTGATAAGTCTGCATCTGATTCGGCTGATGCGGCAGCAGCGAGTGCAGCCACAGCTACAACTAAAGCCGGTGAAGCGTCAAACGCAGCAACTACAGCTTTAAATGCACAGACAGCGGCAAAGTCTTCTGAAAATGCAGCGCAGTCTTCACAGAATGCAGCGGAAGCGGCAGAAGTGGGCGCAGAACTTGCTGAGAGTAACGCAGCAACAAGTGAAGCCAATGCTGCTGAATCAGAAACTGTTGCTCGTGCAAGCGAAAACAACGCGGCTAATTCGGCTGCTTCTGCCAAGGAAAATGCTGACCGTTCTGAACAACATGCTGCGGGTGGTAAAGGTTTGACTTTAGCCATACGTGACGCACTTCGTGCCCAACGTAAGCGTGAATACACAGGTTCAGGTTTCACGGAGTGGGGTAATCAGTACGATTACAACGATGGAGACCCTGTACAACACGGGCTATGGACGTACTACGGTAGTACGGGTTCAGCAAATGAACTGGGTTTAGGTGCAGACCCTTCAGTTGACCCTAATAACTTACAAGGGGAGTCTAGAACTGATTACCCTATTGCAAACGTTGATGGTGTGGAAATGAGCCTCATCGGTTCAACTACATCTACACCTGCGTATAAAAATGCAAATAAAATCTTATTCCCAACAGCACCAGACGGTTCTAAGACACTAAACGAAAGCACAGGTGAAGTACGTAAGTACCATGACCTAGCAGGTGTGGGTACTCCATACGAAGCTCATACGGTTGACTTCGACGGCTCTACTTACATTGACCTAGTAGCCTCGCCTTACGTGATGCCTGTAGGTTCTAAGGTTGAGTTTAAGTTTAAGTTAAATGATGTGAGTGGCTATCAATATCTATTTGATACGCAAAATTTAACGCGAGTTTACATCTACAAAACAACAGGAACTAATAATCTTTTATGGGGTGGTTTTGGTTCTACCATAAAGGTTAACGGCGTAGATATTTCAACTAATACATTTGCTGTAGAGGCTGGTGTTGAATACCATATTGAAGCAACTACAAACGCTACATCAAACATAGACCGTATTGGCGCTAAATCAGCAGGTGGCGTATTAAGTGATTTTGCGCGTGGTCAAATCTGGGATATCACTCTAGCTTCTAGCGAAGATGGTGTTGAACCGATTACGTACAACACAGTAACTACTCAACCTAAAGATGATGCAGCTCCTGTAGTGTCTGAGATTGATGCAGGTGACAATCCTGACATGCCGACTGGTTACATGCCTTTCTATCAGGACGCTGGTTACGTAACTATTCCAGAGTTCCCACTGGCTGATAGCATGAATATTAGTATGGTTATGCGACCTGATAACGACACTGAACTGATGGTATTCGGTCAGAACCCTGAAGGACAAACAATGCGTTTGTATTGGTACAACGATACATCATCAGGGTTATTCAGAATTGCAGCAGGTTCAGGGACAAGTTTAACTTTTGACCCTCTGGTGGCAGGTCGTGTTTACGTTACAGAGGTACAGATTCGTAAGAATGTAGGTGCAAGTGACTACACGGTTACAGCACAAGTAAATGGGGTTATTAAAACTCAGTCCAATGTTACGTTTGGTCATAACACATTTGATTCGTTTACCCTAGGTTCAGAAGAAGGTGTCAAGAACAATAACCGTTGGGACGGTGCTATCTTCGGATTTGGTATTGAATACCCTGATGCTCCAGACCTTAACCGTACCTACGGTTCAGTTGAAGTTGATGACCCTGCGGGACGATTGACTGTAGAAGATGACTTAGGTTTTGGTACGGAAGATTGGACACCTGAATTTGATGGTTTTAATAACGTAATTGTACCACCAGTAATGAACTTTACTGGTATAGCACGGGAACTTGAAATGACAGTAGTTCCCGATAATGTCGGTTCATCATGGCGTATAGGTCAAACGTTTTCTAAGGATGGTGAAGTTAACCGTTTTTATCTCCGTTATGACGCATCTGGAACGATTACAGCGGGTATTGGTAACGCAACAATACAGTCAGTTCTTAATATGACTGTTGGTGAAACATATAACTTTAAGTTCATATGCGATAATTCACTTAATATTGAACTGTTTGTTAATGGAGTTAGTACCATAACAGGTACTACATCATTCCGTGCAGACTTTGTTCTTGATAATTTCTATCTGGGTGCTGCGGGTACAGCAGATAGTGGTCCGTCAGAACACTTAAATGGTAAACTTACGAATGTACGTATTACTGACCCCAATTCAGTTGCTAACAGTCGTCACTATCCACTAGTAATCAATCAGCCTACACAGCCTGATACATTGATTGCAGAGGATGCGGGTTACGATAAAGACACAGCACCTTTCTATACCCCTTCTTATTCTAACACTGATGGTTGGGTAGAAATTCCAGAGATTACACTGGGTTCAGGCGATGCTATTAAACTGAAATTCCAATGGGAAGATGAAGGTAAGGCATATGATGGCATTTTAGATAATGCAAGCGTACCTTCATTGCACTTAAGAATACACAATGATGGTAGATTACGATGGACTAATCACGGCACGTTACGTGTTAATGGCACTGTGTATACAGATGGTTCATTTTATCCAGTATCTGGTGAAGTGTATGAAGTAGAAATTGCACTTGATAGAAACCTTACACTTGCAAGAATAGGAAGACTTTACAATGGTAATCATTGGTCTGGTAAAATCTGGGATATCGAGTTCACAGATAACACAGACCCTACGAACTCACGTTATTACCCATCAGTAGATTACCGTGTAGACGGTGATACTTCTGGTACTGTTTTGGATGAGACTCACGGTTTACTGTCTGATTCATTCTCAGACGGTCGTTGGGTAGAAAGTGCAGCAGGAACTATTAACGGTGAATCATTAACAATTACATCTTCTTTTGGTTCAGGTAGAGTGGGCACATTCCCATCCCCTGCGATAAATGGTGTTGATGTTACAGTCTCATTTGACGTAGTTAGTTACTCAGGCACTACGAACGGTGGACGTGTCATCGTGTACCGTAATGGTTCTCAAGATGGCAACCTAGGCACATTTGATAGTTCGGATGTAGGTACTCGCGTCACACTTACAGCGAACCCTACTGGTAACTATGGCTCTGATGGTAATGATGTTGTTTTCTATGTAGATGCTTCTGGTATTTCTTTTGAAGTAGCTAATGTAGAGGTATCAGCAAATAACAACGGTACTCTAGTTAACTTCCCAAGCGGTTCAGAATGGACACTTGCTCAAGTAGACGGTGCTTCAGATGGTACGTTAGAGAACTTCACAGCAGGTTTAGAGTGGAACAATGACCTACCTATTACTGACGGTACAATGGTTGGCTTTGCACAACCTTGGCATCACGAAACAGGTCGTTACATTGGCTCCATAATTGGTGAAACTACTCAAGCAGTATGGGACGTTCAAGACTCTCAGAAAGCTTTCCACGATGTGAAATACAATGCCGACTTCCACGTGATTACATCACGTAAGGACTTGGTGTTCTTGGAAACTTGGTTAGAGAAAGTAGAAGGGTTTGTTCGACCTTACGGTAACGTACAGTTCGGTGGCTCTAGTCATGATGGTGTTACCCTGGTTCCGGTTACTAACTTCAAAGCTCAAGGCTACTCAGCGTTTGGTGAGTGGGACGAGAACACAGTTGGTAAGGTTGCTGATTGGGATGCAATGACCCCAACACAGAAATCTGTATGGGCAAGCAACCCTAAGAACAACTTAGTGTTCAACCCAGAAGACAACGAGTACTATCAAGACTCATATCGTATTCGTACAGTAGAAGGTTTAGGTGATGAATGGGCTTGTGTTAGACCAACAATTGCATCAACAGGTACACCTACATGGCTTGGTTACGCCCAATCAGGTACAAATAGTCGATACATAGTTCAACGTGGACAACGTGAAGATACTCGTGATTGGTATAAGGACAATACAGTATCGGGTACTATTTTTGGGGGTACTAACCGTTCTGGATTTAATGATGATGAACCAACCATTTTCCAGAATACAGAGGGTGCAAACACTTCTTCTGCTAACGGTAAGTGTTTTGCTATGCCCATCGCACTAGTGCAGCGTTTGAACCAAGGTGCTTACCATCCAACGTATAACCCACAAGGCTGTGATGGGTTTATAAGTTCAGGGGGCGGTAGTTTAGCACGGTGGTACGTTAGTACTTTATTCAGAGATGCAACCACTACTGAAAACTGTTTTCGTTTACGTGTCGGCTACCCTGCAATAGATGGTTTCCGTTATGGGCATGGCTTCATCGGTTCAGCGGGTGGTTCAGGACGTGCAGACCAATACAAATACTACGATGCTATCTACGCAGGACAGGTTGAAGACTTACGTTTGAATGCTAACAAGCAGGATAAACAAGAGTTGTTAACTGATGCAGTACGTAGAGGTGTTAGAGGTGAAACTCGTGGTAAGGGTAAAGTTCCTTTTACTACTGTTCAGACAGCAGACCAAGCGGCAACGGGTAGCCCTACTTCGGCATTTGATGGTATAGACACCTCACATATAACTGTAGGTGATATGTGTTGGGCTGAAGATGCAGCAGGTGATTATCAAAGACGTACTATTACCTATGCAGGTTCTAACGGAACTATATCGTTTAACGAAACTATCCAAGGGCGCAAATCGGATTCTAAGTTAATCCATGAACGTGAACTATCAGCAGAATACGATTCGTTACCTTGGGTAGATTTGATTGGAGACCCTGAACGAATTGCTGCAACGTTCCCTGATGGTGTAGTTGGTCAGTGGATTCCTGATTTAACAACTGGTAACTCAGATAGAGACTTAAACAGAAAGGGTATTGTCCTTACTGGAACTCTATTCACTGAAAATGATGGTGCAAGTTGGACAGTAGAGAGTAAGGCTATAAATTCTACTACTAATACGGTAAATACTTTCTTAGATTCAAGTTTGTTAAGATTGTATCTTCTAACTTACGAAGCACTATCAGACTTCACAGAGTCAGATGATAACCTTGCAGTAGTCGGTGACTTGGGTGATGTTTACAATGCTAAGTTCTATACAATAGAACGTGGTAATCGTATTGCACCTTCTTTATTGGGTGTAATACTAAAAGATAACCGCGACCCAACGCATCATCAGTTGAGAGTTAACAGTTACTCTATACATCCTGCTAATGGTGATTTGGATGGCGGTTCTGGTTACTTACCAATACATGAGCCTATTAGATTACCAGCACCTGCCAATGACTCTGATGCAGTTAAAGCACTTCCTCACTTAGTTGAGAAAGATGGTTTACTGTACGTTCAGTGGCATGGTACTCAGTTGTTCTACGATGCAGCAGGTACAGTAGGTAATGAGTGGGGAGACACCTTCGCAGGTACAACCTTCACGAATGCTTACGGTAAAATCTCTATTGTAGATGGTGAAGACACCAAGCCTGATGAGAACGGGAACACTGTTAAAGTGGTAACACACACTGAGACAATTCCAATTGGTATCGCGAACCATAATCAAGATATCTAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence