Genbank accession
QOI72245.1 [GenBank]
Protein name
putative long tail fiber proximal subunit
RBP type
TF
Evidence RBPdetect2
Probability 0,96
TF
Evidence Phold
Probability 1,00
Protein sequence
MYSIKTDLDVSGNQTISKDLLVKGSAVITNNLTVGGTINFANATFTQITVTGTANLADVNSTGTAALNNVQVSGNTTLGDSDADSVTVNGTSTFNAPITAKSNVSIEGNTVVGNASTDTLTVNATSTFAAPATFNNNVTVGDAAADALTVNSTSTFKNNVTVGEDATDTLTINSTTNLKNNVTVGEDATDNLVVNSTSDFKNNVTLGDASTDVLTVNATSNFNNNVVIGSDSADNLTIKSTTQITGDVQITGETELEGLTVNGASNFLSNLSMPTGTTATFQDVVINGTLSGDYTIANGNFTTLTVTGQSNLNSVILSGNVTGTTRSATFQTYNVAGASGVVQFTYNDPARPSDIKSSIEPYKVSSNEFQGQKATVGHVIFGDVTYADYGLTALGKASIDYLDIKGNSTTGTTRAQLTVAGKSVLNDVEFTGSVTGLTVDVTGQDITPNSVVADAMVQGAQVKSTGQLTGESLQINGISTFQGDGSFNETLQVKDLVVTGTTTGVTAEANVDGLDIAPKSVNATTSIKGATVESTGSLTVNGTITSTNTNVAIGKNTVISGTLNSGSISSTGDVSATGNFLGAGASLTGPNTALAVTNNAVIGGRLTVDGNTSFGGSTGTTTIHDLVVTGTTTGVAVVANVDGLDIAPNKVTVTTTLGVTGQSTLGSVSASTLSTSGLATLASATVTGVATAGSLVTSSIGNSTNAVNFTSPVTTSGNLTVGGTLILAGGLDLSDVDIEAKSIHTTEQATFDGDVIVGGQISLSSASVAALTFTATDNVNTNTLPVLQSVTATINTADITTLNATGTSTLATASIGTLTGTGTATFAAATVTGAATFNGNITSTNATVAIAKNTAITGNLSVSGTLTPGAVDLSTADVTVKSLTSSGNAHVVGDLTVDGAFDLSATNLVAATLESTGKTTVGADLILTTGVITGAPKISGNTTIAGTLGVTGNTSVSTLSTSGVATLNSAAVTTTLGVSGATTLSTLTTNGLATLNSATVSGALIANGNITLGNASSDTLTVNATSTFAGDVTVNGSFTPAGGLNLGSAALNVASVTTTGAISVGTTLGVTGITTLAAVNSGNHAITGTLSTSGLATLNSASITTTLGVTGNSTMTGTLTVNGSGTSKIQALQVGTGTADTDKVLNVFGDTIITGDLDVTGIINAQIDLTSRDISPRNVTASGNISSAGSLTAATSLTAATAIIGAPSSTNNNLQVNGNVVTNGDFTVTGVINGTLNQTNSDVTFKSVTTSAGVTVGTTLGVTGLSTLAGLNAGNTAITGTLSTSGLATLNSASITTTLGVTGATTLAATSATTLSTSGLATLNSATITGALTANGNTVIGDAAADTLTVNATSNFIGDTTVKNITITGTLTADLSNLTTTSFKTGTYFVAQHAAETVSTATWTPDGTSNVYNVNVTANTSIQPITGVNGAGSWFIYVTQDATGGHTVTWDTAYAIIGGEVNTDPNAVSICQVVYCGIGSKYDVFIAQRP
Physico‐chemical
properties
protein length:1490 AA
molecular weight: 147063,72140 Da
isoelectric point:4,10852
aromaticity:0,03557
hydropathy:0,20685

Domains

Domains [InterPro]
QOI72245.1
1 1490
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Erwinia phage pEa_SNUABM_50
[NCBI]
2768775 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QOI72245.1 [NCBI]
Genbank nucleotide accession
MT939488 [NCBI]
CDS location
range 133500 -> 137972
strand -
CDS
ATGTATTCTATAAAAACGGATCTTGACGTATCTGGTAATCAAACGATTTCTAAAGATCTTTTGGTTAAAGGTAGTGCAGTCATTACAAATAATCTTACTGTAGGTGGTACGATTAATTTTGCTAATGCTACATTTACACAGATTACAGTCACAGGTACTGCTAATCTAGCTGATGTTAACTCTACTGGTACTGCTGCATTGAACAATGTTCAAGTTTCTGGTAACACAACTCTTGGTGATTCCGACGCCGATTCTGTTACTGTAAATGGAACATCAACATTTAATGCTCCAATTACTGCAAAAAGTAATGTATCAATTGAAGGAAACACAGTAGTAGGTAATGCTAGTACTGACACATTAACTGTCAATGCAACTTCAACATTTGCTGCACCAGCTACATTCAATAATAATGTAACTGTGGGTGACGCTGCTGCTGACGCATTAACCGTTAACTCTACTTCTACATTTAAAAATAATGTAACAGTTGGTGAAGATGCTACTGATACACTAACAATTAATTCAACAACTAACTTAAAAAATAACGTTACAGTTGGTGAAGATGCTACTGATAATCTAGTTGTTAATTCAACTTCAGATTTCAAAAATAACGTTACTTTAGGTGACGCTAGTACTGATGTTCTAACTGTAAATGCTACATCCAATTTTAATAACAATGTAGTAATTGGGTCAGACAGTGCTGATAATTTAACAATAAAGTCAACGACTCAAATTACTGGAGATGTTCAAATAACGGGCGAAACTGAACTTGAAGGTTTAACTGTTAATGGAGCTTCTAATTTCCTTAGTAATCTTTCAATGCCTACTGGTACAACTGCAACTTTCCAAGATGTAGTTATTAATGGTACTTTAAGTGGTGATTATACTATCGCAAATGGCAATTTTACAACCTTAACAGTAACTGGTCAAAGTAATCTAAACAGTGTTATTCTCAGTGGTAACGTAACTGGTACAACTCGTTCTGCTACTTTCCAAACTTATAATGTTGCAGGTGCTTCTGGTGTTGTTCAATTTACATACAATGACCCAGCACGTCCATCAGATATTAAATCAAGTATTGAACCTTATAAAGTAAGTTCTAACGAATTCCAAGGTCAAAAAGCCACTGTAGGTCACGTAATTTTTGGTGATGTTACATATGCTGACTATGGTCTAACTGCACTTGGTAAAGCAAGTATTGATTATCTTGATATTAAAGGTAACAGCACTACTGGTACAACTCGTGCACAACTTACTGTTGCAGGAAAATCAGTACTTAATGATGTTGAGTTTACTGGTTCAGTGACTGGTTTAACAGTTGATGTAACTGGTCAAGATATTACACCAAACTCTGTAGTTGCCGATGCAATGGTGCAAGGTGCACAAGTAAAATCAACTGGTCAACTTACTGGTGAAAGTTTACAAATTAATGGAATTTCAACATTCCAAGGTGATGGTAGTTTCAACGAAACTTTACAAGTAAAAGATTTAGTAGTAACTGGTACAACAACTGGTGTAACGGCTGAAGCAAATGTTGATGGTTTAGATATTGCTCCAAAATCTGTAAATGCAACAACATCAATTAAGGGTGCTACCGTAGAAAGTACTGGTTCTCTAACTGTAAACGGAACTATCACTTCTACTAACACAAATGTTGCAATTGGTAAAAATACCGTAATTAGTGGAACACTAAACTCTGGTTCTATATCTTCTACTGGTGATGTTAGTGCGACAGGTAATTTCTTAGGTGCTGGAGCATCATTAACTGGTCCAAATACTGCATTAGCAGTAACAAATAACGCAGTTATTGGTGGACGATTAACAGTTGATGGTAATACTTCATTCGGTGGAAGCACAGGAACAACAACTATTCACGATCTTGTAGTAACTGGTACAACAACGGGCGTTGCTGTAGTTGCTAATGTGGATGGTTTAGATATTGCTCCTAATAAAGTTACAGTTACAACCACTTTAGGCGTAACTGGTCAAAGTACATTAGGTTCTGTTTCCGCTTCTACATTAAGTACTTCTGGATTAGCAACATTAGCATCTGCAACCGTAACTGGTGTAGCTACTGCGGGTTCTTTAGTAACTTCAAGTATCGGAAATAGTACTAATGCAGTAAACTTTACTTCTCCAGTAACTACCTCTGGTAATTTAACAGTTGGTGGAACATTAATTCTTGCTGGTGGTTTAGATCTATCAGATGTAGATATTGAAGCTAAATCTATTCATACTACGGAACAAGCAACTTTTGATGGTGACGTAATTGTTGGTGGACAAATTAGTTTAAGTTCAGCTAGTGTTGCGGCTCTTACATTCACAGCTACTGATAATGTTAATACAAACACATTACCAGTATTGCAAAGTGTTACTGCAACAATCAATACTGCTGATATAACTACATTAAATGCTACTGGTACAAGTACTCTTGCAACCGCTAGTATCGGTACACTAACTGGAACAGGTACAGCGACTTTCGCTGCTGCAACAGTAACTGGTGCTGCAACATTTAACGGAAATATTACTTCAACGAATGCAACTGTAGCAATCGCAAAGAATACTGCAATTACTGGTAACTTATCAGTATCTGGTACTCTAACCCCTGGTGCTGTAGATTTAAGTACTGCTGATGTAACTGTTAAATCATTAACATCTTCTGGTAATGCTCATGTTGTTGGTGACCTAACCGTTGATGGTGCATTTGATTTAAGTGCAACAAATCTAGTAGCTGCAACATTAGAAAGTACTGGTAAAACTACCGTTGGTGCAGATTTAATTCTAACTACTGGTGTTATCACAGGTGCTCCAAAAATCTCTGGAAATACAACAATTGCCGGAACATTAGGTGTAACTGGAAATACTTCTGTAAGTACTCTAAGTACTTCTGGTGTAGCTACTTTAAATAGTGCTGCGGTAACTACCACTTTAGGTGTATCTGGTGCAACAACTCTAAGTACTTTAACTACTAATGGGTTAGCTACTTTAAATAGTGCTACTGTATCTGGTGCATTAATTGCAAATGGTAATATTACTCTAGGTAATGCAAGCTCTGATACTTTAACTGTTAATGCTACAAGTACTTTTGCTGGAGATGTAACTGTTAATGGTTCATTCACCCCTGCTGGTGGATTAAACTTAGGTTCTGCTGCGTTGAATGTTGCTTCAGTAACCACAACTGGTGCAATTTCTGTAGGAACTACTTTAGGTGTAACTGGTATTACAACACTTGCTGCTGTAAATTCTGGTAACCATGCAATCACTGGTACTCTAAGTACTTCTGGTCTAGCTACATTGAATAGTGCCTCTATTACAACTACTTTAGGTGTAACTGGTAATAGTACAATGACTGGTACTCTAACTGTTAATGGATCTGGTACTTCTAAGATTCAAGCATTACAAGTTGGTACTGGTACTGCTGATACTGATAAAGTTCTAAATGTATTTGGTGATACAATCATCACTGGTGATTTAGATGTAACTGGTATTATAAACGCACAGATTGACTTAACATCACGTGATATTTCACCACGTAACGTAACTGCTTCAGGAAATATTAGTTCTGCTGGTTCATTGACCGCTGCAACTTCTCTAACTGCTGCAACAGCAATCATTGGTGCACCATCAAGTACAAATAACAACCTACAAGTTAACGGTAACGTAGTAACTAATGGTGACTTTACAGTAACTGGTGTAATTAATGGTACATTGAATCAAACCAACTCTGATGTAACTTTCAAATCTGTAACTACATCTGCTGGTGTAACAGTAGGAACTACATTAGGTGTAACTGGTTTAAGTACATTAGCTGGATTGAATGCTGGAAATACTGCAATCACTGGTACTCTAAGTACTTCAGGATTAGCAACACTAAACAGTGCTTCAATCACCACTACATTAGGTGTAACTGGTGCAACCACATTAGCTGCAACATCTGCAACCACTTTGAGTACTTCTGGTCTAGCTACATTGAATAGTGCTACAATTACTGGTGCATTAACCGCTAATGGTAACACTGTTATTGGTGATGCTGCGGCAGATACATTAACTGTTAATGCTACAAGTAACTTTATTGGTGATACTACTGTTAAGAATATTACAATCACTGGTACTTTAACTGCTGATTTATCTAACTTAACAACAACATCATTCAAAACTGGAACATACTTTGTTGCTCAACATGCTGCTGAAACAGTAAGTACTGCAACTTGGACTCCAGATGGTACTTCAAACGTTTATAACGTAAACGTAACTGCAAATACCTCAATTCAACCAATTACTGGTGTGAATGGTGCAGGTTCATGGTTCATCTATGTAACACAAGATGCTACTGGTGGACATACTGTAACATGGGATACTGCTTATGCAATCATTGGTGGTGAAGTTAATACTGATCCAAACGCTGTAAGCATCTGTCAAGTAGTGTACTGTGGTATTGGTTCTAAATATGATGTGTTCATTGCACAACGTCCATAA

Tertiary structure

PDB ID
ac4b103040a9aea1e840c5021223000aa010ca7784ffac925eadc0b89c1f54f0
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6202
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
Complete genome sequence of Erwinia phage pEa_SNUABM_50 Kim,S.G., Lee,S.B. and Park,S.C. 2021-01-07 GenBank