Genbank accession
CAH1093988.1 [GenBank]
Protein name
hemagglutinin/invasin
RBP type
TSP
Evidence DepoScope
Probability 1,00
TF
Evidence RBPdetect
Probability 0,84
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MNKIYRLIWNDVLGIWVTASELSKARGKRSSGNNIKNKNIGNSSSKVKYNQYINIWVGGIFLSALISTGVFAAGSADIGTPIVTAAIGPSNNCVSQAATNLTSVVPWTCLGQTATGGFTLINGVQANAQNVGQANLDARASGQEAIAIGFIDTTASGTNSVAIGETANALGKNSVAIGKNIIADNSNINEDLSNNVAIGSNSIASTKGSQYTVGSGGAVAIGYGEHANGVGAVAIGSSNTAEGDGAVAVGRINNAIGDGTIALGDSCIANGDRAVAVGSVAHAIGTAAVAVGDSSTADGWSAISIGRVANADADFSIAMGDFAQALSYSALALGRNSYIDANSNESIAQGYGSSVTTARNAVAIGSDATVSNRNSGIAIGDNAQVIVGSHINDVNGLPGSIAIGLNARSVGGSEVIIGSYAAQNAQRYDDGAKNTYGSDSVMLGNQAGRNSQYLYATFIGDQAGQNSIGQHNSYVGQNAARYRTGSYNTALGSNALTGISNTTNSTGNSNTAIGTASGVSLEGDGNTLTGVYTGQRIIGNNNSAFGNNAGANIKGNENIAIGYLSGVSSQGNNNVLLGSNSNIGVNTNNVVSIGTNTRATKENSIALGANANTVTDATLESEANLNGLTYGNFAGQVTNTGMQLSVGSAGAERQIKNVGSGSISETSTDAINGSQLYATNNILGNVANSTIDILGGDASLNSNGTLSMSNIGGTGQNTIDSAIAASRTKVAAGTNVADVVKTTGSNGQDIYTVNAKGSTASAGSSAVTVTAGTADANNVTDYAVDLSQSTKDSLVKADTALQSVVTQIDGVDVKTVNKDDNKVNFVTGDNVELTANADGSITVGTAADVTFNTVNTTNLTATGETKLGDSFTVNNGGSYYTGPITEGNHITNKTYVDQATAASRTEVAAGTNVADVVKTTGSNGQNIYTVNAKGSTASAGSSAITVTAGSPDANNVTDYAVDLSQSTKDSLVKADTALQSVVTQIDGVDVKTVNKDDNKVNFVTGDNVELTANADGSITVGTAADVTFNTVNTTNLTATGETKLGDSFTVNNGGSYYTGPITEGNHITNKTYVDQATAASRTEVEQGKNITVTSSTGVDGQNIYTVATADEVDFNKVTVGDTTITTDGIVIANGPSITKDGISAGDKKVTDVADGLISADSKDAINGSQLFGLGNNLTQLFGGNALYTNNQITWSNIGGTGQNTIDDAIKHVNDQAANANQGWNVSTDSGSNATSTVKPGQTVNINGDSDNGVLVTNSGNDIKVGLADQIKIGAGDNAVSIDGNSGTIQAGDVLIDGSKGNISAGKVTVNGEAGTVNGLTNTTWNPNNIFSGQAATEDQLQQVAQNATAAATAAKTTVSAGENITVSSSKNADGSTNYQVATSKDVKFDTVTSGSITTDKVSVGNITIDQTGINAGASKVTNVADGTINSTSKDAINGSQLHASNTNIYNYLGGGANYETNTGPTYNVGGGSYNNVGDALNSLDQQVTNVSNQLEQAFYTTNKRIDDLEDHANGGIAQAMATAGLPQAYIPGKSMMAISGGTYRGESGYAIGMSSISDNGKWVFKMSGSGNSRGDFGGTVGAGIQW
Physico‐chemical
properties
protein length:1586 AA
molecular weight: 159783,24250 Da
isoelectric point:4,49292
aromaticity:0,04729
hydropathy:-0,20845

Domains

Taxonomy

  Name Taxonomy ID Lineage
Phage Acinetobacter phage MD-2021a
[NCBI]
2899278 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAH1093988.1 [NCBI]
Genbank nucleotide accession
CAKLQH020000029 [NCBI]
CDS location
range 3211 -> 7971
strand -
CDS
ATGAATAAGATATATCGGTTAATTTGGAATGATGTTCTAGGTATTTGGGTTACTGCTTCAGAACTCTCTAAGGCCAGAGGGAAGCGTAGTTCAGGTAATAATATTAAAAATAAAAATATTGGTAATTCATCTAGTAAAGTTAAATATAATCAATATATTAACATTTGGGTGGGTGGTATCTTTTTAAGTGCTTTAATATCAACTGGTGTGTTTGCAGCAGGTAGCGCAGATATAGGAACACCAATAGTAACTGCGGCTATTGGACCGAGCAATAATTGTGTGAGTCAAGCGGCAACCAATCTTACTAGTGTCGTTCCATGGACATGTCTTGGCCAAACAGCAACTGGCGGTTTTACTCTCATTAACGGCGTGCAAGCCAACGCACAAAATGTAGGTCAGGCTAATTTAGATGCAAGAGCTTCTGGACAAGAAGCAATTGCAATTGGTTTTATTGATACAACTGCTTCGGGTACTAATAGTGTGGCAATTGGAGAAACTGCTAATGCGTTAGGTAAAAACTCAGTTGCTATTGGTAAAAATATTATCGCAGATAACTCTAATATAAATGAAGACCTATCTAATAATGTAGCGATTGGATCTAACAGTATAGCTAGTACAAAAGGTAGTCAATATACTGTAGGTTCTGGAGGTGCTGTAGCTATTGGTTATGGTGAGCATGCTAATGGTGTCGGGGCTGTAGCGATAGGTTCATCAAATACAGCTGAAGGTGATGGGGCAGTTGCAGTAGGTCGAATAAATAATGCAATTGGAGATGGAACTATTGCGCTAGGAGACAGTTGTATTGCAAATGGAGATCGGGCAGTCGCAGTAGGTTCTGTTGCCCATGCTATTGGGACTGCTGCTGTGGCTGTTGGTGATAGCTCTACGGCAGATGGATGGAGTGCAATCAGTATTGGTCGTGTTGCAAATGCCGATGCCGATTTCTCAATAGCTATGGGTGATTTTGCTCAAGCATTATCTTATAGTGCGTTAGCTTTGGGGCGTAACAGTTATATTGATGCTAATTCTAATGAATCAATTGCTCAAGGTTATGGAAGTTCAGTGACAACTGCACGAAATGCTGTAGCAATTGGAAGTGATGCAACCGTAAGTAATCGTAATAGTGGTATTGCTATTGGTGATAATGCACAAGTAATTGTGGGAAGTCACATTAATGATGTGAATGGCCTACCTGGTTCTATAGCAATAGGTCTAAATGCTCGTTCAGTAGGTGGTAGCGAAGTTATTATTGGATCTTATGCCGCTCAGAATGCGCAACGCTATGATGACGGTGCTAAAAATACCTATGGTTCAGATAGTGTTATGTTAGGCAATCAAGCTGGGCGTAATTCTCAATATCTATATGCGACATTTATTGGTGATCAAGCAGGTCAAAATAGCATTGGTCAACACAATAGTTATGTAGGGCAAAATGCAGCAAGATACCGAACTGGGAGCTATAATACCGCTCTAGGTAGTAATGCATTAACAGGAATTAGTAATACTACAAACTCTACTGGTAATTCTAATACGGCTATCGGTACGGCTTCAGGTGTCTCTCTAGAAGGAGATGGCAATACATTGACAGGTGTATATACAGGTCAACGCATTATTGGAAATAATAATTCGGCATTCGGAAATAATGCTGGTGCAAATATAAAAGGAAATGAGAATATTGCTATAGGGTACCTTTCTGGGGTTTCTTCTCAAGGCAACAACAATGTTCTTTTAGGCTCAAATTCTAATATAGGTGTAAATACTAATAATGTTGTAAGTATTGGAACGAATACTCGAGCTACTAAAGAGAATTCAATTGCTTTAGGTGCAAATGCAAATACTGTTACTGATGCAACACTAGAGTCAGAGGCAAATTTAAATGGTTTGACCTATGGTAATTTTGCGGGACAAGTTACAAATACAGGGATGCAATTGTCAGTTGGTTCAGCGGGAGCAGAACGTCAAATTAAAAATGTAGGATCTGGTTCTATTTCCGAGACTAGTACAGATGCTATCAATGGTAGTCAGTTATATGCAACGAATAATATATTAGGTAATGTTGCTAATAGCACAATAGATATTTTAGGAGGTGATGCTAGTTTAAATAGTAATGGCACACTTTCAATGAGTAACATTGGTGGTACTGGACAAAATACAATTGATTCAGCAATAGCAGCATCAAGAACGAAGGTTGCAGCGGGCACCAATGTTGCCGATGTAGTTAAAACTACAGGCAGCAATGGACAGGATATTTATACGGTAAATGCCAAAGGTAGCACTGCGTCAGCAGGATCAAGTGCAGTTACGGTAACGGCAGGTACAGCTGATGCCAACAATGTTACGGACTATGCAGTTGATTTGAGTCAAAGTACCAAAGACAGTCTGGTTAAGGCGGATACAGCCTTGCAAAGTGTGGTGACACAGATTGACGGAGTTGATGTTAAGACAGTCAATAAAGATGACAACAAGGTTAACTTTGTGACAGGAGACAATGTTGAGTTAACAGCGAATGCGGATGGCAGTATCACGGTGGGTACGGCAGCAGATGTGACATTCAATACAGTGAACACGACGAACCTGACTGCGACAGGAGAAACCAAGCTAGGCGATAGCTTCACGGTGAATAATGGAGGCAGTTACTATACAGGTCCAATTACCGAAGGCAATCACATTACCAATAAAACCTATGTAGACCAGGCAACAGCAGCATCAAGAACGGAGGTTGCAGCGGGAACGAATGTTGCCGATGTAGTTAAAACTACAGGTAGCAATGGACAGAATATTTATACGGTAAATGCCAAAGGTAGCACTGCGTCAGCAGGATCAAGTGCAATTACGGTAACGGCAGGTAGTCCTGATGCCAACAATGTTACGGACTATGCAGTTGATTTGAGTCAAAGTACCAAAGACAGTCTGGTTAAGGCGGATACAGCCTTGCAAAGTGTGGTGACGCAGATTGACGGAGTTGATGTTAAGACAGTCAATAAAGATGACAACAAGGTTAACTTTGTGACAGGAGACAATGTTGAGTTAACAGCGAATGCGGATGGCAGTATCACGGTGGGTACGGCAGCAGATGTGACATTCAATACAGTGAACACGACGAACCTGACTGCGACAGGAGAAACCAAGCTAGGCGATAGCTTCACGGTGAATAATGGAGGCAGCTACTACACAGGCCCAATTACCGAAGGAAACCATATTACCAATAAAACCTATGTAGACCAGGCAACAGCAGCATCAAGAACGGAGGTTGAACAAGGGAAAAATATTACTGTTACTTCAAGCACTGGTGTGGATGGGCAAAATATATACACTGTTGCTACAGCAGATGAGGTTGATTTTAATAAGGTCACAGTTGGCGATACCACAATTACAACAGACGGTATTGTTATCGCTAATGGCCCAAGCATAACAAAAGATGGTATTAGTGCAGGTGATAAAAAAGTAACTGATGTTGCAGATGGTCTTATTAGTGCAGATTCTAAAGATGCCATCAATGGTAGTCAGCTTTTTGGCTTAGGTAATAACTTGACTCAACTGTTTGGTGGTAATGCTCTTTATACTAATAATCAGATTACTTGGAGCAATATTGGTGGCACTGGGCAAAACACCATCGATGATGCAATTAAACATGTAAATGATCAGGCTGCAAATGCAAACCAAGGTTGGAATGTAAGTACTGATTCAGGTTCGAATGCGACAAGCACAGTAAAACCAGGTCAAACTGTAAATATTAATGGTGACTCTGATAATGGTGTACTAGTAACGAATTCTGGTAATGACATTAAAGTGGGCTTAGCTGATCAAATTAAAATTGGCGCAGGAGATAATGCAGTATCAATTGATGGTAATTCTGGAACAATTCAAGCTGGAGATGTTTTGATTGATGGATCAAAAGGCAATATCTCTGCTGGAAAAGTTACTGTTAATGGTGAGGCTGGTACAGTTAATGGATTAACAAATACGACTTGGAATCCTAACAATATTTTTTCAGGACAAGCTGCTACTGAAGATCAACTACAACAGGTTGCTCAAAATGCAACTGCGGCTGCGACAGCTGCTAAAACAACAGTATCGGCTGGTGAGAATATTACGGTTTCAAGTAGTAAAAATGCCGATGGTAGTACGAACTATCAAGTGGCAACCAGTAAAGATGTGAAGTTTGATACAGTTACTTCTGGTTCGATTACTACAGATAAAGTTTCTGTAGGAAATATCACAATTGATCAAACAGGTATAAATGCTGGTGCAAGTAAAGTTACAAATGTAGCGGACGGCACAATTAACTCTACATCGAAAGATGCGATTAATGGATCTCAGTTACATGCGAGCAACACCAATATTTATAACTACTTAGGTGGTGGTGCCAATTATGAAACCAATACAGGCCCTACTTATAATGTGGGTGGAGGCTCTTACAATAATGTTGGAGATGCACTGAATTCCTTAGATCAACAAGTCACTAATGTAAGTAATCAATTAGAACAAGCATTCTATACAACGAATAAACGTATCGATGATTTAGAAGATCATGCCAATGGAGGTATTGCTCAAGCAATGGCAACCGCGGGATTACCACAAGCTTACATTCCAGGTAAAAGTATGATGGCAATCAGCGGTGGTACGTACCGAGGTGAATCTGGTTATGCAATAGGTATGTCATCGATTTCAGATAATGGAAAATGGGTCTTTAAAATGTCTGGAAGTGGTAATTCCCGTGGTGATTTTGGAGGAACTGTAGGTGCCGGTATCCAATGGTAA

Tertiary structure

PDB ID
bb7bcbc0dfb9693e721716fdd7660f607ff1e98b9469bc1cf3e11c523661fe76
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6400
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50