Protein

View in Explore

Genbank accession

WVW37266.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect

Probability 0,56

Evidence RBPdetect2

Probability 0,59

Protein sequence

MSDLIKQHFRATNGLDAGGNKVINVAKADRTVMSDGVNVEYLIQENTIQPWASDRGYPEGFAVTMEKRIWVARADIAAPIPPAVNTFKQGEWISMRVDPKWEQYSSGTTELLPGTYANIDTRVNPVTLVLPKNKVEQGDTIVIRDIGGKPGINQALIKVQDSAPAMIFQGSILRELQLTRPYSMLLLTFTSAGWYVTLSDLSSLARTIDSTTLDAATDVGAQVQSSEYIVRYYTSNKKLTVRLPRYANHGDMITFAEPEGKTPLYHFTIKTYDANSSIGTEGTTSWTSKIKGGGVLIYDGPRKVWRINSIDMQQRIKVVTDDVVMQPNEAITIFGANNSTVKTISVTLPTQVAPGDTVRIGMNYMRKGQTVNIVTPPAPAGGTKDKIASTVGLLQFPKRSEYPPDAAWTQVDSLSFNGTSDYPPVLELAYVEATPNNYWIVSENISSIERVDSTNDTTKARVGVIALATTAQAQATSGHNDDRAITPLTLSQRTATETRTGIAEIATQAEANSTTEDTRIITAKKLNDRLATETMRGVAEIATQAETNGSTVDDRIVTPKKLNARKATATLDGIIQLVNTGGTPGTSRSDSGTSNGTGVYDHTDFSKAVTPKTLREYKATELASGCVWLATQAEVRNGTPASNNIPTVVTPATLHAKTSTTKDIGLIRIATQAEANAMSNALGNVAITPATLNGRSASYTQTGITRYAVQDEFDGGSLENVAVNPRKIKDYFSRPGRMTTRPEAGLAQSGNLWDGWTLNIQVPTETQRGTPKIATQTLVNAGTDDVDYLTSKKLQAKKGTESAYGIVKYATQADTNTGTANDVAVSPVHLKYVIQTSADWRAQDNVRGTVRVANGAVAWTGNSTTGSDNVAKEVNGYAVSPNGLKQALANYLPLNAKADNSGLLNGLTSDQFIRRDIDQTVNGKLTLTKSTDFNSDVNVKGLGNFTGGEVKVFATSSTANSHVRFLNSDGNERGIIYARPVAAGNSQQLTLRVKGSAPDTGKEFSFGNNGEFVAPDKITSNGTIHSASDVNSNTVYRVKNASVIQLQDSDSVASFGNLAKKGRILTNDASQTQVTDNSGNYVILTTKNKDAILDTRYVKLAGDTMTGNLTLNGSALVINGSEGWYDHTTTANTEKYARGGSWTVEIKNSAKLATLPGYVVPIREENPLVPGSMIVTGYEEKTGAGGLLAQISVSSDYTYQTWTPYPANAEQSAKARTHTMWTRVYNPYIKKFDSWMRVYTSATPPTAADIGAPSSVSTSVKTLEVQEWIKIGPVKIYPDRTSQTVKFEWVGD

Physico‐chemical properties

protein length:	1292 AA
molecular weight:	139279,12680 Da
isoelectric point:	8,41153
aromaticity:	0,06889
hydropathy:	-0,37407

Domains

Domains [InterPro]

DC_1986
ATT
7–130

DC_1986 DC_1209

IPR048391
ATT
1140–1239

IPR048391

WVW37266.1

1 1292

Architecture

ATT

STR

ATT

STR

ATT 7-130 | STR 356-1139 | ATT 1140-1239 | STR 1240-1285 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1986	ATT	DC_1986	7	130	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits
DC_1209	STR	DC_1209	356	1285	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
IPR048391	ATT	DC_0875	1140	1239	InterPro cluster	Long-tail fiber proximal subunit domain	C-terminal	Medium	Text match	795 proteins / 796 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage MY02 [NCBI]	3114920	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WVW37266.1 [NCBI]

Genbank nucleotide accession

PP146563 [NCBI]

CDS location

range 73910 -> 77788
strand -

CDS

ATGAGCGACTTAATCAAACAGCATTTTAGAGCAACCAACGGGCTTGATGCTGGTGGAAACAAAGTAATCAACGTCGCTAAAGCCGATCGTACTGTGATGAGCGATGGGGTCAACGTTGAGTATCTTATCCAAGAAAATACCATCCAGCCTTGGGCCAGTGATCGTGGGTATCCTGAAGGCTTTGCGGTTACCATGGAAAAACGTATCTGGGTAGCACGTGCAGATATCGCGGCTCCTATCCCGCCGGCAGTAAACACCTTTAAACAAGGTGAGTGGATTTCCATGCGTGTTGACCCGAAGTGGGAGCAGTATAGTTCAGGGACCACAGAACTTTTACCAGGGACCTATGCAAACATCGATACTCGTGTTAACCCGGTTACACTGGTTCTTCCTAAAAATAAAGTAGAACAAGGTGATACGATTGTTATCCGGGACATCGGTGGTAAACCAGGTATCAACCAGGCATTAATTAAAGTACAAGACTCTGCGCCAGCAATGATCTTCCAAGGAAGTATCCTTCGTGAACTGCAGCTGACTCGTCCTTATAGTATGCTTCTGCTGACGTTTACATCGGCCGGGTGGTACGTAACTCTTTCAGATCTGAGTTCTTTGGCTCGTACCATTGATTCTACCACACTGGATGCTGCTACCGATGTTGGCGCTCAAGTACAGAGTTCTGAGTACATTGTACGTTATTATACTTCTAATAAAAAATTAACAGTTCGTCTTCCTCGTTATGCTAACCATGGTGATATGATTACCTTTGCTGAACCGGAAGGCAAAACACCATTATACCATTTTACCATTAAGACTTATGATGCAAATAGTTCTATTGGAACTGAAGGGACTACATCCTGGACATCTAAGATTAAAGGCGGCGGTGTTCTGATTTATGATGGTCCACGTAAGGTATGGCGCATCAATTCTATCGACATGCAGCAACGTATCAAAGTCGTTACTGACGATGTAGTGATGCAACCTAACGAAGCTATTACCATATTTGGTGCTAACAACTCGACCGTAAAAACTATTTCTGTTACTTTGCCTACTCAAGTTGCTCCAGGCGATACTGTTAGAATCGGTATGAACTATATGCGCAAAGGGCAAACGGTCAACATTGTTACTCCCCCTGCTCCGGCCGGTGGCACTAAAGATAAGATAGCATCTACGGTTGGCTTACTTCAGTTCCCTAAACGCTCTGAGTATCCGCCTGATGCCGCGTGGACTCAAGTTGATAGTTTATCATTCAATGGAACTTCGGACTATCCTCCGGTCTTAGAATTGGCCTATGTAGAAGCTACTCCTAATAACTATTGGATCGTTTCAGAAAACATCTCTAGTATAGAGCGGGTTGATTCTACCAACGATACTACTAAAGCCCGTGTGGGTGTTATTGCATTAGCAACTACCGCACAAGCTCAAGCAACCAGTGGCCATAATGATGATAGGGCTATTACACCCTTAACTTTGTCCCAGCGTACTGCTACTGAGACACGTACTGGTATTGCTGAAATTGCTACTCAGGCTGAAGCTAATTCAACTACTGAAGACACCCGTATTATTACGGCCAAGAAGTTGAACGATCGCTTAGCTACTGAAACAATGCGTGGTGTTGCTGAAATTGCTACCCAAGCTGAAACGAATGGCTCTACTGTAGATGATAGGATCGTTACTCCTAAAAAGCTTAATGCGCGTAAAGCTACTGCTACTCTTGATGGCATCATCCAGCTAGTTAACACAGGTGGTACCCCAGGAACAAGTAGATCAGATTCTGGTACTTCTAATGGTACTGGCGTATACGACCACACTGATTTCTCTAAGGCGGTAACTCCTAAAACTTTACGCGAATATAAAGCTACGGAACTTGCCTCCGGATGCGTATGGCTTGCTACCCAAGCAGAAGTTCGTAATGGTACCCCGGCATCTAATAATATTCCGACCGTTGTTACGCCGGCAACATTACATGCTAAAACTTCTACTACAAAAGATATTGGTTTAATCCGTATCGCTACTCAAGCTGAAGCTAATGCAATGTCCAATGCTTTGGGTAATGTGGCTATTACTCCGGCGACACTAAACGGCAGATCAGCAAGTTATACACAAACTGGTATTACCCGGTATGCGGTTCAAGATGAATTTGACGGTGGATCTCTAGAAAACGTTGCAGTGAACCCTAGAAAAATTAAAGACTATTTTTCTAGACCAGGCCGTATGACAACAAGACCAGAAGCTGGGTTGGCCCAATCCGGAAACTTGTGGGACGGATGGACCCTTAATATCCAGGTTCCAACAGAAACTCAACGTGGTACGCCTAAGATTGCAACTCAGACGCTTGTCAATGCAGGAACCGATGATGTTGATTATCTGACGTCTAAAAAGCTTCAAGCTAAAAAAGGTACCGAATCAGCTTACGGTATTGTTAAATATGCCACTCAGGCTGATACCAATACTGGCACTGCTAATGATGTGGCTGTTTCTCCTGTTCACCTGAAGTATGTTATTCAGACTTCTGCTGATTGGCGTGCACAAGATAACGTTCGTGGTACAGTTCGTGTAGCTAATGGAGCCGTTGCTTGGACCGGTAACAGTACTACAGGTTCTGATAACGTAGCAAAAGAAGTTAACGGTTATGCAGTTTCTCCTAATGGACTGAAACAAGCATTAGCTAATTATCTTCCTTTGAATGCTAAAGCTGATAACTCTGGTTTATTAAATGGCCTTACTTCAGACCAATTTATTAGACGTGACATAGATCAAACCGTTAACGGTAAATTGACTCTTACCAAATCTACAGACTTTAATTCAGACGTCAATGTTAAGGGCCTTGGTAATTTTACCGGTGGCGAGGTTAAGGTATTTGCTACTTCGTCTACAGCCAATTCTCACGTCAGATTTTTAAACTCAGATGGAAATGAACGTGGAATAATTTACGCTAGACCGGTAGCTGCAGGAAATTCTCAGCAGCTTACGCTACGTGTTAAAGGTTCAGCCCCTGATACAGGTAAAGAATTTTCTTTTGGTAATAATGGTGAGTTTGTTGCACCTGATAAAATAACCTCTAACGGGACAATTCATTCTGCTTCAGATGTTAACTCAAACACCGTATACCGTGTTAAAAATGCTTCAGTAATCCAACTCCAGGATTCTGATAGTGTAGCATCTTTTGGTAATCTTGCTAAGAAAGGAAGAATCTTAACAAACGATGCTAGCCAAACACAAGTTACCGACAACTCCGGAAATTATGTTATTTTAACCACTAAAAATAAGGACGCCATTTTAGATACTAGGTATGTTAAGTTAGCTGGCGATACAATGACCGGTAACTTAACTCTGAATGGATCTGCTCTTGTTATTAATGGTTCTGAAGGTTGGTACGACCACACTACCACAGCAAACACTGAGAAATATGCAAGAGGTGGTTCTTGGACCGTAGAAATTAAAAACTCTGCTAAGCTGGCCACGCTGCCAGGTTATGTTGTTCCGATCAGAGAAGAGAATCCTTTAGTTCCAGGTTCTATGATCGTAACAGGTTACGAAGAAAAAACAGGCGCCGGTGGTCTTTTAGCTCAGATAAGTGTTTCCTCTGATTATACCTATCAGACATGGACTCCTTATCCAGCTAATGCTGAACAGTCAGCTAAAGCAAGAACTCATACTATGTGGACCAGGGTATATAACCCGTATATTAAGAAGTTTGATAGCTGGATGCGTGTATACACTAGCGCCACTCCTCCTACAGCTGCAGATATCGGTGCTCCGAGTTCAGTAAGTACTTCTGTTAAAACCTTGGAAGTTCAAGAATGGATTAAGATTGGCCCTGTCAAGATTTATCCTGATCGTACTTCTCAGACCGTTAAGTTTGAATGGGTAGGTGATTAA

Genome Context

Tertiary structure

PDB ID

b803194247a9a7f7c955d0e414eddcd56ab21742cd37dc1531ba87491a6c2d45

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7516

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence