Genbank accession
CAH1093988.1 [GenBank]
Protein name
hemagglutinin/invasin
RBP type
TSP
Evidence DepoScope
Probability 1,00
TF
Evidence RBPdetect
Probability 0,84
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MNKIYRLIWNDVLGIWVTASELSKARGKRSSGNNIKNKNIGNSSSKVKYNQYINIWVGGIFLSALISTGVFAAGSADIGTPIVTAAIGPSNNCVSQAATNLTSVVPWTCLGQTATGGFTLINGVQANAQNVGQANLDARASGQEAIAIGFIDTTASGTNSVAIGETANALGKNSVAIGKNIIADNSNINEDLSNNVAIGSNSIASTKGSQYTVGSGGAVAIGYGEHANGVGAVAIGSSNTAEGDGAVAVGRINNAIGDGTIALGDSCIANGDRAVAVGSVAHAIGTAAVAVGDSSTADGWSAISIGRVANADADFSIAMGDFAQALSYSALALGRNSYIDANSNESIAQGYGSSVTTARNAVAIGSDATVSNRNSGIAIGDNAQVIVGSHINDVNGLPGSIAIGLNARSVGGSEVIIGSYAAQNAQRYDDGAKNTYGSDSVMLGNQAGRNSQYLYATFIGDQAGQNSIGQHNSYVGQNAARYRTGSYNTALGSNALTGISNTTNSTGNSNTAIGTASGVSLEGDGNTLTGVYTGQRIIGNNNSAFGNNAGANIKGNENIAIGYLSGVSSQGNNNVLLGSNSNIGVNTNNVVSIGTNTRATKENSIALGANANTVTDATLESEANLNGLTYGNFAGQVTNTGMQLSVGSAGAERQIKNVGSGSISETSTDAINGSQLYATNNILGNVANSTIDILGGDASLNSNGTLSMSNIGGTGQNTIDSAIAASRTKVAAGTNVADVVKTTGSNGQDIYTVNAKGSTASAGSSAVTVTAGTADANNVTDYAVDLSQSTKDSLVKADTALQSVVTQIDGVDVKTVNKDDNKVNFVTGDNVELTANADGSITVGTAADVTFNTVNTTNLTATGETKLGDSFTVNNGGSYYTGPITEGNHITNKTYVDQATAASRTEVAAGTNVADVVKTTGSNGQNIYTVNAKGSTASAGSSAITVTAGSPDANNVTDYAVDLSQSTKDSLVKADTALQSVVTQIDGVDVKTVNKDDNKVNFVTGDNVELTANADGSITVGTAADVTFNTVNTTNLTATGETKLGDSFTVNNGGSYYTGPITEGNHITNKTYVDQATAASRTEVEQGKNITVTSSTGVDGQNIYTVATADEVDFNKVTVGDTTITTDGIVIANGPSITKDGISAGDKKVTDVADGLISADSKDAINGSQLFGLGNNLTQLFGGNALYTNNQITWSNIGGTGQNTIDDAIKHVNDQAANANQGWNVSTDSGSNATSTVKPGQTVNINGDSDNGVLVTNSGNDIKVGLADQIKIGAGDNAVSIDGNSGTIQAGDVLIDGSKGNISAGKVTVNGEAGTVNGLTNTTWNPNNIFSGQAATEDQLQQVAQNATAAATAAKTTVSAGENITVSSSKNADGSTNYQVATSKDVKFDTVTSGSITTDKVSVGNITIDQTGINAGASKVTNVADGTINSTSKDAINGSQLHASNTNIYNYLGGGANYETNTGPTYNVGGGSYNNVGDALNSLDQQVTNVSNQLEQAFYTTNKRIDDLEDHANGGIAQAMATAGLPQAYIPGKSMMAISGGTYRGESGYAIGMSSISDNGKWVFKMSGSGNSRGDFGGTVGAGIQW
Physico‐chemical
properties
protein length:1586 AA
molecular weight: 159783,24250 Da
isoelectric point:4,49292
aromaticity:0,04729
hydropathy:-0,20845

Domains

Domains [InterPro]
IPR008640
Unmapped
155–180
IPR008640
Unmapped
227–250
IPR008640
Unmapped
255–279
CAH1093988.1
1 1586
Architecture
STR
STR
STR
RBD
STR
RBD
STR
RBD
ATT
STR 1-34 | STR 114-695 | STR 1005-1174 | RBD 1175-1190 | STR 1287-1447 | RBD 1448-1461 | STR 1463-1511 | RBD 1512-1525 | ATT 1526-1586
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout
N-terminal
Central
C-terminal
CAH1093988.1
1 1586
Domain Start End Length (AA) Confidence
N-terminal 1 113 113 0,4015
Central domain 114 1504 1392 0,4060
C-terminal 1505 1586 81 0,3786
Legend: N-terminal Central domain C-terminal
3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring
N-terminal
1-113
Central
114-1504
C-terminal
1505-1586

Taxonomy

  Name Taxonomy ID Lineage
Phage Acinetobacter phage MD-2021a
[NCBI]
2899278 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAH1093988.1 [NCBI]
Genbank nucleotide accession
CAKLQH020000029 [NCBI]
CDS location
range 3211 -> 7971
strand -
CDS
ATGAATAAGATATATCGGTTAATTTGGAATGATGTTCTAGGTATTTGGGTTACTGCTTCAGAACTCTCTAAGGCCAGAGGGAAGCGTAGTTCAGGTAATAATATTAAAAATAAAAATATTGGTAATTCATCTAGTAAAGTTAAATATAATCAATATATTAACATTTGGGTGGGTGGTATCTTTTTAAGTGCTTTAATATCAACTGGTGTGTTTGCAGCAGGTAGCGCAGATATAGGAACACCAATAGTAACTGCGGCTATTGGACCGAGCAATAATTGTGTGAGTCAAGCGGCAACCAATCTTACTAGTGTCGTTCCATGGACATGTCTTGGCCAAACAGCAACTGGCGGTTTTACTCTCATTAACGGCGTGCAAGCCAACGCACAAAATGTAGGTCAGGCTAATTTAGATGCAAGAGCTTCTGGACAAGAAGCAATTGCAATTGGTTTTATTGATACAACTGCTTCGGGTACTAATAGTGTGGCAATTGGAGAAACTGCTAATGCGTTAGGTAAAAACTCAGTTGCTATTGGTAAAAATATTATCGCAGATAACTCTAATATAAATGAAGACCTATCTAATAATGTAGCGATTGGATCTAACAGTATAGCTAGTACAAAAGGTAGTCAATATACTGTAGGTTCTGGAGGTGCTGTAGCTATTGGTTATGGTGAGCATGCTAATGGTGTCGGGGCTGTAGCGATAGGTTCATCAAATACAGCTGAAGGTGATGGGGCAGTTGCAGTAGGTCGAATAAATAATGCAATTGGAGATGGAACTATTGCGCTAGGAGACAGTTGTATTGCAAATGGAGATCGGGCAGTCGCAGTAGGTTCTGTTGCCCATGCTATTGGGACTGCTGCTGTGGCTGTTGGTGATAGCTCTACGGCAGATGGATGGAGTGCAATCAGTATTGGTCGTGTTGCAAATGCCGATGCCGATTTCTCAATAGCTATGGGTGATTTTGCTCAAGCATTATCTTATAGTGCGTTAGCTTTGGGGCGTAACAGTTATATTGATGCTAATTCTAATGAATCAATTGCTCAAGGTTATGGAAGTTCAGTGACAACTGCACGAAATGCTGTAGCAATTGGAAGTGATGCAACCGTAAGTAATCGTAATAGTGGTATTGCTATTGGTGATAATGCACAAGTAATTGTGGGAAGTCACATTAATGATGTGAATGGCCTACCTGGTTCTATAGCAATAGGTCTAAATGCTCGTTCAGTAGGTGGTAGCGAAGTTATTATTGGATCTTATGCCGCTCAGAATGCGCAACGCTATGATGACGGTGCTAAAAATACCTATGGTTCAGATAGTGTTATGTTAGGCAATCAAGCTGGGCGTAATTCTCAATATCTATATGCGACATTTATTGGTGATCAAGCAGGTCAAAATAGCATTGGTCAACACAATAGTTATGTAGGGCAAAATGCAGCAAGATACCGAACTGGGAGCTATAATACCGCTCTAGGTAGTAATGCATTAACAGGAATTAGTAATACTACAAACTCTACTGGTAATTCTAATACGGCTATCGGTACGGCTTCAGGTGTCTCTCTAGAAGGAGATGGCAATACATTGACAGGTGTATATACAGGTCAACGCATTATTGGAAATAATAATTCGGCATTCGGAAATAATGCTGGTGCAAATATAAAAGGAAATGAGAATATTGCTATAGGGTACCTTTCTGGGGTTTCTTCTCAAGGCAACAACAATGTTCTTTTAGGCTCAAATTCTAATATAGGTGTAAATACTAATAATGTTGTAAGTATTGGAACGAATACTCGAGCTACTAAAGAGAATTCAATTGCTTTAGGTGCAAATGCAAATACTGTTACTGATGCAACACTAGAGTCAGAGGCAAATTTAAATGGTTTGACCTATGGTAATTTTGCGGGACAAGTTACAAATACAGGGATGCAATTGTCAGTTGGTTCAGCGGGAGCAGAACGTCAAATTAAAAATGTAGGATCTGGTTCTATTTCCGAGACTAGTACAGATGCTATCAATGGTAGTCAGTTATATGCAACGAATAATATATTAGGTAATGTTGCTAATAGCACAATAGATATTTTAGGAGGTGATGCTAGTTTAAATAGTAATGGCACACTTTCAATGAGTAACATTGGTGGTACTGGACAAAATACAATTGATTCAGCAATAGCAGCATCAAGAACGAAGGTTGCAGCGGGCACCAATGTTGCCGATGTAGTTAAAACTACAGGCAGCAATGGACAGGATATTTATACGGTAAATGCCAAAGGTAGCACTGCGTCAGCAGGATCAAGTGCAGTTACGGTAACGGCAGGTACAGCTGATGCCAACAATGTTACGGACTATGCAGTTGATTTGAGTCAAAGTACCAAAGACAGTCTGGTTAAGGCGGATACAGCCTTGCAAAGTGTGGTGACACAGATTGACGGAGTTGATGTTAAGACAGTCAATAAAGATGACAACAAGGTTAACTTTGTGACAGGAGACAATGTTGAGTTAACAGCGAATGCGGATGGCAGTATCACGGTGGGTACGGCAGCAGATGTGACATTCAATACAGTGAACACGACGAACCTGACTGCGACAGGAGAAACCAAGCTAGGCGATAGCTTCACGGTGAATAATGGAGGCAGTTACTATACAGGTCCAATTACCGAAGGCAATCACATTACCAATAAAACCTATGTAGACCAGGCAACAGCAGCATCAAGAACGGAGGTTGCAGCGGGAACGAATGTTGCCGATGTAGTTAAAACTACAGGTAGCAATGGACAGAATATTTATACGGTAAATGCCAAAGGTAGCACTGCGTCAGCAGGATCAAGTGCAATTACGGTAACGGCAGGTAGTCCTGATGCCAACAATGTTACGGACTATGCAGTTGATTTGAGTCAAAGTACCAAAGACAGTCTGGTTAAGGCGGATACAGCCTTGCAAAGTGTGGTGACGCAGATTGACGGAGTTGATGTTAAGACAGTCAATAAAGATGACAACAAGGTTAACTTTGTGACAGGAGACAATGTTGAGTTAACAGCGAATGCGGATGGCAGTATCACGGTGGGTACGGCAGCAGATGTGACATTCAATACAGTGAACACGACGAACCTGACTGCGACAGGAGAAACCAAGCTAGGCGATAGCTTCACGGTGAATAATGGAGGCAGCTACTACACAGGCCCAATTACCGAAGGAAACCATATTACCAATAAAACCTATGTAGACCAGGCAACAGCAGCATCAAGAACGGAGGTTGAACAAGGGAAAAATATTACTGTTACTTCAAGCACTGGTGTGGATGGGCAAAATATATACACTGTTGCTACAGCAGATGAGGTTGATTTTAATAAGGTCACAGTTGGCGATACCACAATTACAACAGACGGTATTGTTATCGCTAATGGCCCAAGCATAACAAAAGATGGTATTAGTGCAGGTGATAAAAAAGTAACTGATGTTGCAGATGGTCTTATTAGTGCAGATTCTAAAGATGCCATCAATGGTAGTCAGCTTTTTGGCTTAGGTAATAACTTGACTCAACTGTTTGGTGGTAATGCTCTTTATACTAATAATCAGATTACTTGGAGCAATATTGGTGGCACTGGGCAAAACACCATCGATGATGCAATTAAACATGTAAATGATCAGGCTGCAAATGCAAACCAAGGTTGGAATGTAAGTACTGATTCAGGTTCGAATGCGACAAGCACAGTAAAACCAGGTCAAACTGTAAATATTAATGGTGACTCTGATAATGGTGTACTAGTAACGAATTCTGGTAATGACATTAAAGTGGGCTTAGCTGATCAAATTAAAATTGGCGCAGGAGATAATGCAGTATCAATTGATGGTAATTCTGGAACAATTCAAGCTGGAGATGTTTTGATTGATGGATCAAAAGGCAATATCTCTGCTGGAAAAGTTACTGTTAATGGTGAGGCTGGTACAGTTAATGGATTAACAAATACGACTTGGAATCCTAACAATATTTTTTCAGGACAAGCTGCTACTGAAGATCAACTACAACAGGTTGCTCAAAATGCAACTGCGGCTGCGACAGCTGCTAAAACAACAGTATCGGCTGGTGAGAATATTACGGTTTCAAGTAGTAAAAATGCCGATGGTAGTACGAACTATCAAGTGGCAACCAGTAAAGATGTGAAGTTTGATACAGTTACTTCTGGTTCGATTACTACAGATAAAGTTTCTGTAGGAAATATCACAATTGATCAAACAGGTATAAATGCTGGTGCAAGTAAAGTTACAAATGTAGCGGACGGCACAATTAACTCTACATCGAAAGATGCGATTAATGGATCTCAGTTACATGCGAGCAACACCAATATTTATAACTACTTAGGTGGTGGTGCCAATTATGAAACCAATACAGGCCCTACTTATAATGTGGGTGGAGGCTCTTACAATAATGTTGGAGATGCACTGAATTCCTTAGATCAACAAGTCACTAATGTAAGTAATCAATTAGAACAAGCATTCTATACAACGAATAAACGTATCGATGATTTAGAAGATCATGCCAATGGAGGTATTGCTCAAGCAATGGCAACCGCGGGATTACCACAAGCTTACATTCCAGGTAAAAGTATGATGGCAATCAGCGGTGGTACGTACCGAGGTGAATCTGGTTATGCAATAGGTATGTCATCGATTTCAGATAATGGAAAATGGGTCTTTAAAATGTCTGGAAGTGGTAATTCCCGTGGTGATTTTGGAGGAACTGTAGGTGCCGGTATCCAATGGTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
bb7bcbc0dfb9693e721716fdd7660f607ff1e98b9469bc1cf3e11c523661fe76
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6385
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50