Genbank accession
CAH1616317.1 [GenBank]
Protein name
tail fiber protein proximal subunit
RBP type
TF
Evidence RBPdetect
Probability 0,58
TF
Evidence RBPdetect2
Probability 0,82
Protein sequence
MADIKRKFRAEDGLDAGGDKIVNVALADRTVGTDGVNVDFLVQENTVQVYDSTRGYNKGFVVLYDNRLYQAINDIVSPSGAFNLLQWRAVRTDAQWITVASGTYQLSSGESISVNTGAGNDMVFTLPNAPVDGDTVVLADIGGRTGTVKVQINASVQSILNFRGEQVRTVLMTRPRSQLLFVFSNRLWQMYIIDYGKESITVTPATPYQAQANDFIVRRFTSAAPINITLPRNANNGDIITLVDLDKLNPLYHTIVKTFDDTTSIGEVGTHIAEGRNDSDAFFVFDASNSLWRIWEGDQKSRLRIIRADSNIRPNEEVLIFGTNNATSGTINLTLPTGILSGDTVKISMNYMRKGQTVKIKAAEGDTIASSVALLQFPKRSEYPPDAQWVSVTELEFNGTTSYVPVLELAYIEDTDSDTHYWVVQQNVPTVERVDAGTDATRARLGVIALATQAQANVDLENTPAKEVAITPETLANRTATEARRGIAKIATTAQVNQNSTATFVDDTIVTPKKLNERTATETRRGLAEIATQAETDAGLDDTTIITPKKLQARQGSETLSGIVKYVSTTSATPAETRGAAGTNVYNKTVNNLTISPKALDQYKATYAQQGAVILAVDSEVIAGQSQAGYSHAVVTPETLHKKTSTDGRIGLIEIATQAETNTGTDYTRAVTPKTLNDRKATEGISGIAELATQVEFDTGTDDTRISTPLKIKTHFDSSDRTSVNSDSGLIEEGTLWNHYTLDISKANETQRGTLRVATQAESNAGTLDDVLITPKKLLGTKSTETSEGVIKVATRAETVTGTSANTAVSPKNLKWIVQNEPTWAATTAIRGFVKTSSGSITFVGNDTVGSTQPLESYEKNSYAVSPYELNRVLANYLPLKAKAADANLLDGLDSSQFIRRDIAQTVNGSLTLTQQTNLSGPLVSSSTATFGGSVSANSTLTISNTGTATRLIFEKGPQTGTNPVQTMTIRVWGNQFGGGSDTTRSTVFEVGDETSNHFYSQRNKAGNITFSINGTVMPINVNASGSLNANGVATFGSSVTANGEFISKSANAFRAINGDYGFFIRNDAANTYFMLTASGDQTGGFNGLRPLAINNASGQVTIGESLIIAKGATINSGGLTVNSRIRSQGSKTADLYTRAPTADTVGFWSVDINDSATYNQFPGYFKMVEKTNEVSGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGALPSDNATIGNLTIRDFLRIGNVRIIPDPVNKSVKFEWIE
Physico‐chemical
properties
protein length:1291 AA
molecular weight: 139349,34280 Da
isoelectric point:5,34067
aromaticity:0,07359
hydropathy:-0,30914

Domains

View on InterPro
CAH1616317.1
1 1291 aa
ATT 981–1094 · ATT 1141–1239 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Taxonomy

Phage
Escherichia phage UGJNEcP2 [NCBI] · taxon 2912555
Host No host information

Coding sequence (CDS)

Genbank protein accession
CAH1616317.1 [NCBI]
Genbank nucleotide accession
OV877511 [NCBI]
CDS location
range 43504 -> 47379
strand +
CDS
ATGGCCGACATCAAACGTAAGTTCAGAGCCGAAGACGGTCTGGACGCCGGTGGCGACAAGATTGTTAACGTAGCATTAGCCGACCGTACAGTAGGTACAGATGGCGTAAACGTTGACTTCCTGGTACAAGAAAACACCGTTCAAGTATATGATTCTACGCGTGGATATAACAAAGGATTTGTTGTTCTTTATGACAACCGTTTATATCAAGCAATAAATGATATCGTGTCTCCTTCAGGGGCATTTAACCTTTTACAATGGCGTGCAGTTCGTACCGATGCACAATGGATAACTGTCGCTTCTGGGACTTATCAACTTTCTTCAGGTGAATCTATTTCGGTTAACACTGGTGCTGGCAATGATATGGTTTTCACATTGCCAAATGCGCCGGTTGATGGTGATACTGTTGTTTTGGCTGATATTGGTGGAAGAACCGGGACAGTTAAAGTACAGATTAACGCGTCTGTGCAGAGTATTTTAAACTTTAGAGGTGAACAAGTTCGTACAGTTTTAATGACGCGCCCACGTTCACAACTATTGTTTGTGTTTAGTAATCGCTTGTGGCAGATGTATATCATTGATTATGGTAAAGAATCAATCACTGTTACACCTGCGACACCATATCAAGCACAAGCAAATGATTTTATCGTTCGTCGTTTTACTAGTGCAGCACCAATCAACATTACACTTCCACGTAATGCTAACAATGGCGATATAATCACCCTAGTCGATTTAGATAAATTAAACCCACTGTATCATACAATTGTTAAAACATTTGATGATACAACGTCTATTGGTGAAGTCGGGACTCATATTGCCGAAGGCAGAAATGACTCTGACGCGTTTTTTGTTTTTGATGCTTCAAATAGTTTATGGCGTATATGGGAAGGCGACCAGAAATCGCGTCTTCGTATTATCCGTGCGGATTCAAATATTCGTCCAAATGAAGAAGTTCTTATTTTTGGCACAAATAACGCTACATCCGGAACTATTAATCTTACGCTGCCTACAGGAATTTTGAGTGGTGACACTGTTAAAATTTCAATGAACTACATGCGTAAAGGCCAAACAGTAAAAATTAAAGCTGCCGAAGGTGATACAATTGCTTCTTCTGTTGCATTGCTTCAGTTCCCTAAACGTTCTGAATATCCACCTGATGCTCAATGGGTCTCTGTTACTGAACTAGAATTCAATGGCACTACTTCGTATGTTCCTGTATTAGAATTAGCATATATTGAAGATACCGATTCCGACACTCATTATTGGGTTGTGCAACAGAATGTCCCTACGGTAGAACGTGTTGATGCTGGAACTGATGCTACACGAGCTCGTTTAGGTGTTATTGCTCTTGCTACTCAAGCGCAAGCAAATGTTGATTTAGAGAATACTCCAGCTAAAGAAGTGGCTATTACTCCTGAAACGTTGGCAAATCGTACAGCAACTGAAGCTCGACGTGGTATCGCTAAAATTGCTACAACAGCACAAGTTAACCAGAATTCCACAGCAACATTTGTGGACGATACTATTGTTACGCCTAAAAAACTAAATGAGCGTACAGCAACTGAAACTCGTCGTGGTCTTGCTGAAATTGCTACTCAGGCTGAAACCGATGCTGGTCTTGACGACACAACGATTATTACACCTAAGAAATTGCAGGCACGTCAGGGTTCTGAAACACTATCTGGTATAGTTAAATATGTATCAACTACTTCTGCTACTCCTGCTGAAACTCGTGGGGCAGCAGGCACTAACGTTTATAATAAAACCGTAAATAATTTAACTATTTCCCCTAAAGCCCTTGACCAATATAAAGCAACTTATGCTCAACAAGGTGCAGTAATTTTAGCTGTTGATAGTGAAGTAATTGCTGGACAATCTCAAGCAGGTTATTCTCACGCTGTAGTAACTCCTGAAACACTACATAAGAAAACTTCTACTGATGGACGTATTGGTTTAATTGAAATTGCTACGCAAGCAGAAACTAATACTGGGACTGATTATACACGTGCAGTAACGCCTAAGACGTTAAATGATAGGAAAGCTACGGAAGGAATATCCGGCATAGCCGAACTTGCTACGCAAGTTGAATTTGATACTGGAACTGATGATACTCGTATCTCGACTCCACTGAAAATTAAAACTCATTTTGATTCTTCTGACCGTACCAGTGTTAATTCTGATTCCGGACTTATTGAAGAAGGAACCTTGTGGAACCATTATACTCTTGATATTTCTAAAGCAAATGAAACACAACGTGGTACACTTCGCGTAGCGACCCAGGCAGAATCTAATGCAGGAACTTTAGATGATGTTCTTATTACTCCTAAAAAGCTTTTAGGGACTAAGTCCACTGAAACGTCTGAAGGCGTAATTAAGGTTGCTACTCGGGCTGAAACTGTAACAGGAACTTCTGCTAATACTGCTGTATCTCCTAAGAATTTAAAATGGATTGTCCAGAACGAACCAACATGGGCTGCTACTACGGCAATTCGCGGATTCGTTAAAACTTCATCCGGTTCTATTACATTTGTTGGTAATGATACAGTTGGTTCAACACAACCTTTAGAATCATATGAGAAAAATAGCTATGCAGTATCACCATATGAATTAAACCGTGTACTTGCTAACTATTTACCATTAAAAGCAAAAGCTGCTGACGCAAATTTATTAGATGGCCTAGATTCATCTCAGTTCATTCGTAGGGACATTGCACAGACGGTTAATGGTTCACTAACCTTAACCCAACAAACGAATCTGAGTGGCCCTCTTGTATCATCTAGTACCGCTACGTTTGGTGGATCAGTTTCGGCAAATAGTACATTAACTATTTCTAATACTGGAACGGCAACTCGTCTGATTTTTGAAAAAGGACCTCAGACTGGAACTAACCCAGTACAGACGATGACTATCAGAGTTTGGGGAAATCAGTTTGGTGGTGGTTCAGATACAACACGTTCTACCGTATTTGAAGTTGGCGATGAAACGTCTAATCACTTTTATTCTCAACGTAATAAAGCTGGTAATATAACGTTTAGCATTAATGGTACTGTAATGCCAATAAATGTTAACGCTTCGGGTTCATTGAATGCGAATGGCGTAGCAACATTTGGTAGTTCAGTTACTGCTAATGGCGAATTCATCAGCAAGTCTGCAAATGCTTTCAGAGCAATAAACGGTGATTACGGATTCTTTATTCGTAATGATGCTGCTAATACCTATTTTATGCTCACTGCATCTGGTGATCAGACTGGCGGATTTAATGGATTACGTCCTTTGGCTATTAATAATGCATCTGGTCAAGTAACGATTGGTGAAAGCTTAATCATTGCCAAAGGTGCTACTATAAATTCAGGTGGTTTAACTGTTAACTCGAGAATTCGTTCTCAGGGTTCTAAAACTGCTGATTTATACACTCGTGCTCCTACTGCTGATACAGTCGGGTTCTGGTCAGTTGACATTAACGATTCAGCCACTTATAACCAATTCCCGGGTTATTTTAAAATGGTTGAAAAAACTAATGAAGTGTCTGGACTTCCGTACTTAGAACGTGGTGAAGAAGTTAAATCCCCTGGTACTTTGACTCAGTTTGGTAATACGCTTGATTCTCTTTACCAAGATTGGATTACTTATCCAACGACACCGGAAGCGCGTACCACTCGCTGGACTCGTACATGGCAGAAAACTAAAAATTCTTGGTCAAGTTTTGTTCAGGTATTTGATGGTGGAAACCCTCCTCAACCTTCTGATATTGGTGCTTTACCTTCTGATAATGCAACAATCGGAAACTTGACAATAAGGGATTTCTTAAGGATTGGTAACGTCCGCATTATTCCAGACCCTGTGAATAAATCTGTTAAATTCGAGTGGATTGAATAA

Genome Context

Tertiary structure

CAH1616317.1
ESMFold structure
Source ESMFold
pLDDT 55.6
Oligomeric state monomer