Protein

View in Explore

Genbank accession

QQO90299.1 [GenBank]

Protein name

short tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MSNQIQTIATATAANWSTSLSIDGASGDIVFHTVGGTFSDGNTQKTVSPVNGQYTVAVTGSPPTDQGTTQIVSVYYEFDNEWQISQQASRILVLPQSREIDYRIQRKGFGELPKESYISSSYNGLVLVGETKVPTGEEFKKAIDAGHILSLNLMPSSLFDTTKSPFIAHDRYNGKVFFLNAAPTLDKVTVGAVLADTDDQTIVQVFERLNGQAREFTVFYASGLVEVYDKGMNFLSQADTGITNTARVVYRRKNVGSNGSADTYVVLDNLGQAHTLNASYSQTSVLNDQFYTDASDTYNVLCTRSGRLVGSGTSNQPAGFAFYQFVPGTLIAVGVNAATGAVCQFNIRDNALYAPSRNLVQDNRVVYNAAADWTADGTGLVGGLDTDGTDSLIRFADGTTATFTDPGFSYLGIYGTSYTDDSSSRRFYAVARPTRNLMHLNQRDYSATIPDFDQIGSANVQFSLTVKTADKDIPLEIRFPDGVVWTAKVNGQPVKYVQDGDVVQFTASHPTITRHSFAFTIGRSSGLFELKPDTLPDAFHFESVSGIDEGEVYSTEEITITGINTKVPVSVTVNGQPATDNVQIFIDGVEATEPFMIANNGKLRLEVLHEGTRSRVVVTVGTGSTNFGIYTVAEPILNSIRNWAYQATGIEVVSDALTNPGPQQLNLTLTDDTTALFSNGTKQVTLDQGQSATIKFTPQENKQYHVTFNTDQTEYDWQVWADNVWLDPQPATQRAERYVLGDSGDIKFDAIPPNFYTHLRVPAGILLQIDGSYVNLPLDVRGVYNAQTEIRNVACTSVLRMEGLPSHDQPHTILLGDAKLKWLYDFTVDPTYQAIADKAVATAVPQFVARTPNTIATNMPQFVATSVSARTDHDQDFDAQTGDKADTVYARQFVVSDAYADSEFLSRFVPHRDAVVTDSFGTQPVAGDDQLGTLYDNNRFVSAEAEAPVWQGFNVFDTAVDYDSLLLDLPTVRLVAWSKVSGVDSTSRARYATSPITAQIDNAARAEWIQSSPALGQSNDRAQKASGTHNWIDALVPQVILPTARIDVDAAQALQRQYTSLPVDGALSDISASPVTYHVDSWEPRWTHVPRITFRYDMYVGIVTKPKSYPISMHGRTVGKTLTYKLNIRVRHVYDLLHRLATGKIKYAPATKVGKVVNAKSAFVVTKAAYGQKTSVGRVLPVVLSASINVDAKFVAVPASNPVDTAQADRKTNTVIAVTQARPTRPVVKVINVPRPVTEMPPIAVDYGEQDPLKQGYFATELDALRNATEVWGHDPTAVYGIKQPNGYWTWAQVVVCENVCGSYGCDTRGYLSGG

Physico‐chemical properties

protein length:	1315 AA
molecular weight:	143467,31670 Da
isoelectric point:	5,17635
aromaticity:	0,09582
hydropathy:	-0,22099

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Erwinia phage pEa_SNUABM_5 [NCBI]	2797313	Uroviricota > Caudoviricetes > Rivsvirus >
Host	Erwinia amylovora [NCBI]	552	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QQO90299.1 [NCBI]

Genbank nucleotide accession

MW366843.1 [NCBI]

CDS location

range 115209 -> 119156
strand -

CDS

ATGTCCAATCAGATTCAAACAATAGCGACAGCTACTGCGGCCAATTGGAGTACCTCACTATCCATCGATGGCGCAAGTGGTGATATTGTCTTTCATACGGTTGGCGGCACGTTCTCTGATGGCAACACCCAAAAGACCGTAAGTCCGGTCAATGGACAATACACTGTTGCAGTCACAGGCAGCCCTCCTACCGATCAAGGTACCACGCAGATCGTCAGCGTGTACTATGAGTTCGACAACGAGTGGCAGATTTCTCAACAGGCGTCGCGCATCCTTGTGTTGCCTCAGTCTCGCGAGATCGATTATCGCATCCAGCGTAAAGGCTTTGGTGAGCTGCCTAAAGAGTCTTATATCAGTTCGTCCTACAATGGCCTTGTGCTGGTGGGCGAAACAAAGGTTCCGACAGGCGAAGAGTTTAAGAAGGCAATTGATGCAGGCCATATTCTCAGCCTGAATCTCATGCCGAGCAGTTTGTTTGACACAACCAAAAGCCCATTCATTGCCCACGACCGTTACAATGGAAAAGTATTCTTTTTGAATGCTGCTCCAACGCTTGATAAGGTCACTGTTGGTGCTGTGCTTGCGGACACAGATGATCAAACGATCGTCCAAGTGTTTGAACGACTAAACGGGCAAGCCCGTGAGTTCACCGTGTTTTATGCAAGCGGTTTGGTTGAAGTGTATGACAAGGGAATGAACTTCCTTAGTCAGGCTGATACGGGTATTACTAACACAGCTCGCGTTGTATATCGCCGTAAGAATGTTGGTTCAAACGGCAGTGCTGACACTTATGTCGTGCTGGATAATCTGGGTCAGGCGCACACACTCAACGCCAGCTATTCTCAGACAAGTGTACTCAACGATCAGTTTTACACGGATGCGTCAGACACTTACAACGTGTTGTGTACGCGTTCAGGCCGTCTTGTTGGTTCAGGTACAAGCAACCAGCCAGCTGGCTTTGCGTTTTATCAGTTTGTTCCTGGGACACTTATCGCTGTAGGCGTCAACGCTGCGACAGGTGCCGTGTGTCAGTTCAACATTCGGGATAACGCCTTATATGCACCGTCTCGCAATCTTGTGCAAGACAATCGTGTTGTTTATAACGCTGCGGCCGACTGGACTGCTGACGGTACTGGTCTTGTTGGTGGTCTGGATACTGACGGTACTGATAGCCTTATCCGATTTGCTGATGGTACAACTGCGACATTCACCGATCCGGGTTTCTCTTATCTCGGAATTTATGGCACATCATACACAGACGATTCATCTAGTCGTCGCTTTTATGCCGTAGCCCGACCGACTCGCAACCTGATGCATCTTAATCAGCGTGACTACTCAGCCACGATTCCTGATTTTGATCAAATCGGCTCTGCTAATGTTCAGTTCTCTTTAACCGTAAAAACAGCGGATAAAGATATCCCTCTGGAGATTCGTTTTCCTGACGGAGTTGTGTGGACTGCTAAGGTTAATGGGCAGCCTGTTAAGTACGTTCAAGACGGTGATGTGGTGCAGTTTACTGCAAGCCACCCGACTATCACTCGTCACAGCTTTGCTTTCACCATTGGCCGTTCGAGTGGATTGTTTGAACTCAAGCCCGATACCTTGCCTGATGCTTTCCATTTTGAAAGCGTAAGCGGTATCGATGAAGGCGAAGTATACAGTACAGAAGAAATAACAATCACTGGCATCAACACCAAAGTGCCTGTGAGTGTAACCGTTAACGGCCAGCCGGCAACGGACAACGTGCAGATCTTTATCGATGGCGTAGAAGCCACGGAACCATTCATGATTGCCAACAATGGCAAACTACGTTTAGAGGTTCTGCATGAAGGCACTCGTAGCCGTGTTGTTGTTACCGTCGGTACCGGCAGCACTAACTTTGGTATTTATACTGTTGCAGAGCCAATCCTCAACTCAATCCGAAACTGGGCTTACCAGGCAACAGGAATTGAAGTTGTTAGTGACGCGCTCACCAACCCCGGACCTCAGCAACTCAATCTCACGCTGACTGATGATACAACAGCCCTGTTCAGCAACGGCACCAAGCAGGTTACACTTGACCAAGGCCAGTCTGCTACGATCAAGTTTACCCCACAAGAGAACAAGCAATACCATGTCACGTTCAACACTGACCAGACTGAATACGACTGGCAGGTGTGGGCGGACAACGTGTGGCTTGACCCTCAGCCCGCAACGCAACGAGCAGAGCGCTATGTATTGGGCGACAGCGGTGATATAAAGTTTGATGCCATACCTCCAAACTTCTATACGCACCTGCGTGTGCCTGCAGGCATCCTGTTACAGATTGATGGCTCTTATGTCAATCTACCTCTTGATGTGCGTGGCGTATACAATGCACAAACAGAGATCAGAAACGTTGCCTGTACCTCTGTGCTGCGTATGGAAGGCCTGCCTAGTCATGATCAACCACACACTATCCTGTTAGGTGATGCTAAGCTCAAGTGGTTGTATGACTTTACTGTGGACCCTACGTATCAGGCTATTGCAGACAAGGCAGTTGCTACGGCAGTTCCTCAGTTTGTTGCACGCACTCCAAACACAATCGCCACAAACATGCCTCAGTTTGTTGCTACATCCGTGTCTGCGCGAACTGACCACGATCAGGACTTTGATGCACAGACGGGAGACAAGGCCGACACTGTGTACGCTAGGCAGTTTGTTGTATCGGATGCCTATGCAGATAGTGAGTTCCTGTCGCGCTTTGTTCCTCACCGTGACGCCGTTGTGACCGATAGTTTTGGCACACAGCCTGTTGCGGGTGATGACCAACTTGGCACCTTGTACGACAACAATCGCTTTGTTTCTGCTGAGGCAGAGGCACCAGTGTGGCAAGGGTTCAACGTGTTTGATACGGCTGTTGATTATGACAGTCTGCTGTTGGACCTTCCTACTGTACGCCTTGTTGCTTGGTCTAAGGTATCTGGCGTTGACTCTACAAGTCGGGCGCGTTATGCCACCAGCCCTATCACGGCACAGATAGACAACGCGGCTCGTGCTGAATGGATTCAATCTAGTCCTGCGCTGGGTCAATCAAACGACCGAGCACAAAAAGCTAGTGGCACGCACAATTGGATTGATGCCCTTGTCCCTCAGGTCATCTTACCAACAGCACGCATTGATGTTGATGCAGCGCAGGCACTACAACGCCAATACACGTCACTGCCTGTAGACGGTGCCTTGTCTGATATATCCGCAAGCCCTGTGACGTATCACGTTGATAGTTGGGAACCTCGCTGGACTCACGTACCTCGTATAACATTCCGTTATGATATGTATGTGGGAATCGTGACCAAACCCAAGTCATATCCTATCTCGATGCATGGACGCACTGTGGGCAAGACCCTTACCTACAAGCTGAACATCCGTGTTAGGCATGTATATGACCTGTTGCACAGACTGGCCACTGGTAAGATCAAGTATGCACCAGCGACTAAAGTAGGTAAGGTTGTTAATGCCAAATCTGCTTTTGTTGTGACCAAAGCTGCTTACGGACAAAAGACAAGTGTTGGACGTGTGCTGCCTGTTGTGCTATCTGCCAGTATTAATGTGGATGCTAAGTTTGTTGCTGTTCCTGCGTCTAACCCTGTTGATACGGCACAGGCTGATCGCAAGACAAATACTGTGATTGCTGTGACTCAGGCTCGTCCTACTCGTCCTGTGGTTAAAGTGATCAACGTGCCTCGTCCTGTGACTGAAATGCCGCCTATCGCTGTTGACTATGGTGAGCAGGACCCACTGAAACAGGGTTACTTTGCAACAGAGCTGGATGCATTGAGAAACGCTACAGAGGTCTGGGGCCATGACCCGACTGCTGTGTACGGCATCAAACAACCAAATGGATATTGGACGTGGGCACAGGTTGTTGTCTGCGAAAATGTCTGTGGTTCATATGGCTGCGACACCAGAGGCTATCTCAGCGGGGGGTAA

Genome Context

Tertiary structure

PDB ID

8f9d1e03e96623c30c58cb116e450c6a43654eb8f2197d5dcbc35378c460337c

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,3680

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Complete genome sequence of Erwinia phage pEa_SNUABM_5	Kim,S.G., Lee,S.B., Kwon,J. and Park,S.C.	2021-01-07	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature