Genbank accession
XVC02418.1 [GenBank]
Protein name
tail protein
RBP type
TF
Evidence RBPdetect2
Probability 0,56
Protein sequence
MYPIPLFMSTTSASVVTATSITTSSIGIAIVGSKKQLTYTVSPEDGALFDIAFSSSDNTKMVIDNSGMMEFVAEGGFDAIMTAKNNLGAVLTDQSGGYASELSVYTESLSAMDVGTTQQLVATISPEGAKDLPDMVITYTTTDPEVATVSPTGLITALKDGNCRIGCTATYQGTVVASDSSYLGVNAIPVISNVTAVANSYGDVRVAWDVVDPLDGDTYTVEVLDLNNNSVQWTTTTTNTYAYFDISDSIPLYGFAPTYLKISVKSTKAAAVIFNNSIATDDSFIKEVIVFAGQDNVNAHFTELSGANKAAMSSTTARNAYATQRGLANAEVLPLNTASGSSAADKYADDKAGTGTPDNYWYDLDNTADGPCLTNFITKVTPYASKVKAIIWGQGENDAVSASSTVAGRYSNTTRYHDATIAIFDKMRTIVPASQAKIVWQILGRSYLYGVEVNGVDWQKYRNVQRAISTARDDVIIGSWVDGAERYSGYVYEEGIDGRIHYISSVYQTAATKLAKSAADGTDLTSTSPVWVDMAVPTGATATSQSNQDTILAWDAQGYSKHYFRNINVLTASVLTEQTLNTNSYTFTYADQVEQYGFAAGTTVFDVAYYDEANDVLSPLVRFNVNVTAMDYDLTQETLPADVRVNRSNHYARASGDILVPTEVSAPVAPLEYIGTTPQGRRVVAANRTYIFVNNNLTTASPWLKTNLTVTASTINSPVGTTANTYKLTPSTTSGQHILSAVNTASDITAGRQWAASVFLKPDGITKVKLKLTSGNEVNEGTYDLEAGTFTGTDANMIDMGNGWYRVILHKVTVAKQASMTYEIIALNASGSDTFAGDGTGGLIAWVPQLEMGDMTNPVWAGTPFVCTYARDTDSAATFTIPKNGHTGVDIYHTDGTVQREIFTGTATTWMLSFNAASADWGSKFISGLKYYD
Physico‐chemical
properties
protein length:933 AA
molecular weight: 99924,89200 Da
isoelectric point:4,60012
aromaticity:0,09646
hydropathy:-0,10182

Taxonomy

Phage
Escherichia phage 92CQ [NCBI] · taxon 3433635

Coding sequence (CDS)

Genbank protein accession
XVC02418.1 [NCBI]
Genbank nucleotide accession
PV682554 [NCBI]
CDS location
range 74692 -> 77493
strand +
CDS
ATGTATCCTATTCCTTTATTTATGTCAACAACATCAGCTTCAGTAGTAACAGCTACATCTATAACCACTTCCTCTATTGGTATTGCAATAGTTGGTAGTAAAAAGCAACTGACATACACAGTTTCACCGGAAGATGGTGCGTTATTTGATATAGCTTTTTCATCTTCAGATAATACCAAAATGGTTATAGATAATAGTGGTATGATGGAGTTTGTTGCTGAAGGTGGTTTTGATGCAATAATGACAGCTAAAAATAATTTAGGTGCTGTCTTAACTGATCAATCTGGTGGTTATGCTTCAGAATTAAGTGTGTACACTGAAAGTCTATCTGCTATGGATGTAGGCACTACTCAACAGTTGGTTGCTACAATCAGTCCAGAAGGTGCTAAAGACCTTCCAGATATGGTAATTACGTATACCACAACAGATCCAGAAGTAGCTACTGTAAGCCCTACAGGATTAATAACTGCTCTTAAAGATGGTAATTGCCGTATAGGTTGTACTGCAACGTATCAAGGAACAGTTGTGGCCTCTGATAGTTCTTATTTAGGTGTTAATGCTATTCCTGTTATTTCTAATGTAACAGCCGTGGCAAACAGCTATGGAGACGTTCGTGTTGCTTGGGATGTAGTTGATCCGCTAGATGGTGATACTTATACTGTAGAAGTATTAGATTTAAATAATAACAGTGTCCAGTGGACTACAACAACCACGAATACTTACGCCTACTTTGATATCTCTGACTCTATTCCTCTTTATGGGTTTGCTCCAACATACCTTAAAATTAGCGTTAAGAGCACCAAAGCAGCAGCCGTTATCTTTAATAACTCAATAGCTACAGATGATTCGTTCATTAAAGAAGTTATTGTCTTTGCTGGACAAGATAACGTAAATGCGCACTTTACAGAATTGTCTGGTGCAAATAAAGCAGCAATGAGTAGCACAACAGCCCGTAATGCATATGCTACGCAACGTGGTTTAGCAAATGCTGAAGTTCTTCCGTTAAATACAGCTTCTGGATCATCAGCAGCAGATAAATATGCTGACGATAAAGCAGGAACAGGTACACCAGACAACTACTGGTATGATCTGGATAACACAGCAGATGGGCCATGCTTAACTAACTTTATCACTAAAGTCACACCTTATGCAAGTAAGGTTAAAGCAATTATTTGGGGACAAGGTGAAAATGATGCTGTATCCGCATCTTCAACTGTTGCAGGTAGATACAGTAACACTACACGTTACCATGATGCTACGATAGCTATCTTTGATAAGATGCGTACAATAGTTCCTGCTTCTCAAGCAAAAATTGTTTGGCAGATCCTAGGACGTTCTTATTTATATGGTGTAGAAGTTAATGGTGTGGATTGGCAGAAATACAGAAATGTACAAAGAGCCATCTCTACAGCACGTGATGATGTTATCATTGGTTCTTGGGTGGATGGTGCTGAACGCTACAGTGGTTATGTTTATGAAGAAGGTATTGATGGTCGTATCCATTATATTTCTTCTGTATACCAAACAGCAGCTACAAAACTTGCTAAATCAGCAGCAGACGGTACAGACTTAACATCAACATCACCTGTTTGGGTTGATATGGCTGTTCCAACTGGAGCAACAGCTACTTCCCAATCTAATCAAGATACAATTTTAGCATGGGATGCTCAAGGTTATAGTAAACACTACTTCCGTAATATTAACGTCTTAACAGCATCTGTATTAACTGAACAAACGCTTAATACGAACAGTTATACGTTTACCTATGCAGATCAAGTGGAACAATATGGTTTTGCAGCAGGAACTACTGTATTTGATGTTGCATATTATGACGAAGCAAATGATGTGTTATCTCCTTTAGTACGTTTTAATGTTAACGTTACCGCGATGGACTATGATTTGACACAAGAAACTCTTCCAGCAGATGTGCGCGTAAACAGGAGCAACCATTATGCTAGGGCTTCTGGAGATATCCTTGTACCGACAGAGGTTTCTGCTCCTGTAGCACCTTTAGAATATATTGGTACAACGCCACAAGGTAGACGTGTTGTAGCAGCCAACCGTACATATATCTTTGTCAACAATAACTTGACAACAGCTTCCCCGTGGTTGAAGACGAACTTGACAGTTACAGCATCAACAATCAACTCTCCGGTTGGAACTACAGCTAACACTTACAAGTTAACACCTTCTACAACTTCAGGACAACATATTTTATCAGCAGTGAATACAGCTTCTGATATTACAGCAGGTAGGCAATGGGCTGCATCTGTATTCTTGAAGCCAGACGGGATCACTAAAGTGAAGCTCAAATTGACTTCAGGAAATGAGGTTAACGAAGGGACTTATGATCTTGAAGCTGGAACATTTACAGGCACAGATGCAAATATGATCGACATGGGGAATGGTTGGTATCGTGTAATCTTACATAAAGTAACGGTTGCTAAACAAGCCTCTATGACTTATGAGATTATAGCTTTGAATGCCAGTGGATCAGACACTTTTGCAGGAGATGGCACTGGAGGTCTTATTGCTTGGGTTCCACAACTTGAAATGGGCGATATGACAAACCCAGTTTGGGCGGGGACACCATTTGTTTGTACTTATGCACGAGACACAGATAGTGCTGCCACCTTCACTATTCCTAAGAACGGACACACTGGCGTGGATATTTACCACACAGATGGAACTGTGCAAAGAGAGATTTTCACTGGCACAGCTACTACTTGGATGTTATCATTCAACGCCGCAAGTGCAGATTGGGGATCGAAATTCATCTCTGGTTTGAAATATTACGACTAA

Genome Context

Tertiary structure

XVC02418.1
ESMFold structure
Source ESMFold
pLDDT 75.4
Oligomeric state monomer