Protein

View in Explore

Genbank accession

AIZ01468.1 [GenBank]

Protein name

outer capsid protein

RBP type

Evidence RBPdetect2

Probability 0,61

Protein sequence

MAVYIQGQEVLNIVAHVPNSAPTDLGEFRMAEQLAAKQPQITAQPVGGSIYDSQTLGLSIAANVFGSTAAYQWLVDGAPIQGANSTSFTFVPSGLGTFDVTCEIKAFGPMVTSEVASVTVEQTPVDLTWQVLPAGYGLPSNVSGLVGLHAIGSDGSLVVGATGMEGMRSTDKGLTWSYIGNGFGTGRTAGTIFAVCVVGNVVVVGGVISDGTGVAGRSTNGGVSWTKLPDFLNSGATGSSINKILHAGGNKLIALLGNGYAAVSNDLGATWSALPRWLNSGGSDNSASFFDGVVTATGAIIAVGQNGFASISRNGGVTWSALPRYLGMPTNTSIVAIGVSNTAIVVGGSNGNCAVSRNDGVTWSALPLNFGVPIGSGILDRSIAGASNGTFLVGLKGNPASGNSGYLALSYDDGVTWQQPPRYLGIPNAGYYASVSAIRNIDISTFLVGFTDKRGVRAVR

Physico‐chemical properties

protein length:	460 AA
molecular weight:	46757,02600 Da
isoelectric point:	5,61162
aromaticity:	0,08043
hydropathy:	0,24609

Taxonomy

Phage

Vibrio phage H1 [NCBI] · taxon 1558464

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Vibrio cholerae [NCBI] · taxon 666

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Vibrionales

Coding sequence (CDS)

Genbank protein accession

AIZ01468.1 [NCBI]

Genbank nucleotide accession

KM612261 [NCBI]

CDS location

range 20442 -> 21824
strand +

CDS

ATGGCGGTATATATTCAAGGTCAAGAGGTGCTGAACATTGTTGCCCATGTGCCTAATTCTGCTCCGACCGATTTGGGTGAGTTTCGCATGGCGGAACAACTAGCAGCGAAGCAACCCCAAATCACAGCGCAGCCTGTGGGCGGTTCTATTTACGATTCGCAGACTTTGGGTTTGTCCATAGCGGCCAATGTGTTTGGCTCAACGGCTGCGTACCAGTGGTTGGTCGACGGCGCTCCAATCCAAGGGGCTAACTCTACGTCCTTTACCTTCGTTCCGTCAGGGTTGGGTACTTTTGATGTGACGTGTGAGATAAAAGCTTTCGGCCCAATGGTCACGAGCGAAGTAGCCTCGGTTACAGTCGAGCAAACTCCTGTTGATTTGACTTGGCAAGTCTTGCCTGCAGGATATGGTCTACCAAGCAATGTCAGTGGACTCGTTGGGCTGCACGCCATTGGTTCTGATGGCTCTTTAGTAGTAGGAGCCACGGGCATGGAAGGCATGCGCAGCACGGACAAAGGATTGACGTGGTCGTATATTGGCAACGGGTTTGGCACTGGACGAACAGCAGGCACTATCTTTGCCGTTTGCGTGGTAGGGAATGTTGTGGTGGTGGGCGGAGTTATAAGCGACGGTACTGGAGTAGCGGGTCGGTCAACCAACGGAGGTGTTAGTTGGACCAAACTTCCCGATTTCCTGAACAGCGGAGCCACGGGTAGTTCCATCAACAAGATTTTGCACGCGGGTGGCAACAAGTTGATAGCGCTATTGGGGAATGGATACGCAGCCGTGAGCAACGATTTGGGAGCCACTTGGTCTGCGCTGCCTCGTTGGCTGAACAGCGGCGGCTCGGACAACAGCGCGTCATTTTTTGATGGAGTAGTTACGGCAACAGGAGCCATAATTGCAGTAGGCCAAAATGGCTTTGCGTCAATAAGTCGGAACGGAGGTGTTACTTGGTCCGCACTTCCTCGATACTTAGGCATGCCGACCAACACTTCCATCGTCGCTATTGGTGTGAGCAACACTGCCATCGTAGTAGGAGGCAGCAACGGTAACTGCGCTGTCAGCAGGAATGACGGCGTTACTTGGTCTGCTCTGCCTCTGAATTTTGGTGTGCCGATAGGGTCAGGTATCCTCGACCGTTCAATTGCAGGAGCTAGCAACGGCACATTCTTAGTGGGGCTGAAGGGAAACCCGGCATCCGGCAACAGCGGATATTTGGCGTTGAGCTATGATGATGGCGTCACTTGGCAACAACCACCGAGGTATTTGGGTATCCCAAATGCAGGGTATTACGCTTCGGTCAGTGCCATCAGAAATATTGATATCTCAACTTTCTTGGTGGGCTTTACTGACAAGAGAGGAGTGAGAGCGGTGAGATAG

Genome Context

Tertiary structure

AIZ01468.1

ESMFold structure

Source ESMFold

pLDDT 83.0

Oligomeric state monomer

Download structure

Protein

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)