Protein

View in Explore

Genbank accession

ANW46771.1 [GenBank]

Protein name

hypothetical protein

RBP type

Evidence RBPdetect2

Probability 0,52

Protein sequence

MPVIHVQKMPGTPKETGIVPAGTNLWKWLNKSNLPASISISVNGRVLGEDDELSFCLRDGDVVNVYCQPSGAIGDLIGAILKPVTKIFSFLTPKVSTPKTDTSSKTSPNTSLKAQTNIARNGEARPDNFGQIRAFPDLLQESLFEYINNIKYVTEFMNFGLGKYDVSSVRYSESNLGSLAGASYTIYQPGEVIPVVYEPYAFDDVDGQELYGPNELDTDPPPVVIETATTTTVTETEFAGGQIAVKIPKNSAFDYFVDLTMPHDVVFKLNITYAQGGGASVTENVTLSGRLVSATETDDGGLPPVNYWYTFIINSINYSGAPISSLNGVTINNTYFNLTDNQPIVSGPYFSPIDGDQLWVHLQHQTNDGNDFSVLIEWWKIDDDNVQIPGTYQSMNYYQDVDRNDTFYYTIKLTPAAGTGRYAIQMRRTNNSSDTSILQLEEIHSIVTRTNVSYPDDTVVKVVVRATENATGSRDRKYNALVTRHTIGYNRDTGTVRYTLAPSRSFADAVLHNWLITAGNPENTIDIVRLYEIADSLPDERLGYFDYTFDDEDKSIGERLQTICDAARVTAFWDDGVMSFSRDEKREYPATVFNTRNTQSDGYKLSYDISLPGTYDGVNVEYRDPTTNKQANVYYRITDGGIVEGEPTKAKKFDMLYVRNRYQAVDRAILECRRLIYSRRSMEIKALADGEWINVGDMIQVVDMYDDVQQTGVIEARNGNVFMTSEQLTADDNLYVVITSSDGSTSERLPATVTGLHTFTCNLPSGFQLNIWDGTNVQSESRYVLSTEKELDTTLWVVSQKNPGSDGTTTLTMSEYSDDMYEYAIPSS

Physico‐chemical properties

protein length:	828 AA
molecular weight:	92275,40550 Da
isoelectric point:	4,55931
aromaticity:	0,10266
hydropathy:	-0,38756

Domains

Domains [InterPro]

DC_0118
STR
1–670

DC_0118 DC_0808

NF040662
Unmapped
356–822

NF040662

ANW46771.1

1 828

Architecture

STR

RBD

STR 1-670 | RBD 686-827 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0118	STR	DC_0118	1	670	Novel HMM	DC_0118	Central	Low	Positional only	383 proteins / 383 hits
NF040662	Unmapped	-	356	822	NCBIfam	host specificity factor TipJ family phage tail protein	-	-	-	-
DC_0808	RBD	DC_0808	686	827	Novel HMM	DC_0808	C-terminal	Low	Positional only	361 proteins / 361 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage IME207 [NCBI]	1873985	Uroviricota > Caudoviricetes > Shuimuvirus >
Host	Klebsiella pneumoniae [NCBI]	573	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

ANW46771.1 [NCBI]

Genbank nucleotide accession

KX523699 [NCBI]

CDS location

range 30791 -> 33277
strand +

CDS

ATGCCAGTAATTCATGTTCAGAAGATGCCGGGCACGCCGAAAGAAACGGGAATTGTGCCAGCAGGCACTAACCTGTGGAAGTGGCTGAATAAATCAAACCTACCAGCCAGCATTTCAATTTCGGTAAACGGCAGAGTGCTTGGTGAAGATGATGAGCTTTCCTTCTGCTTGCGAGATGGCGACGTTGTCAACGTTTATTGCCAGCCATCCGGCGCAATTGGCGATCTTATCGGTGCGATACTGAAGCCAGTAACGAAGATTTTCTCCTTCCTTACGCCGAAGGTATCCACACCCAAAACGGATACCAGCTCAAAAACATCACCAAATACCAGCCTGAAAGCGCAGACGAACATTGCGCGCAACGGAGAGGCGCGACCTGATAACTTCGGGCAGATTCGTGCGTTTCCTGATTTGCTTCAGGAATCATTATTCGAATATATCAATAATATTAAGTACGTCACCGAGTTCATGAATTTTGGCCTCGGCAAATATGATGTTTCCTCTGTGCGTTACTCGGAATCAAATCTTGGTTCACTGGCTGGAGCGAGTTACACCATTTATCAGCCAGGAGAAGTTATTCCGGTTGTGTATGAGCCTTATGCTTTTGATGATGTTGACGGTCAGGAACTGTATGGACCAAACGAACTGGATACTGACCCACCGCCAGTGGTTATTGAAACTGCAACAACAACCACGGTCACAGAAACAGAATTTGCTGGAGGTCAGATTGCTGTCAAAATACCGAAAAACTCAGCATTCGATTATTTCGTTGACCTAACCATGCCTCATGACGTGGTATTCAAGCTGAATATAACTTATGCGCAAGGTGGTGGCGCATCTGTCACCGAAAACGTTACGCTATCAGGAAGACTTGTCTCTGCAACAGAGACTGATGATGGCGGGCTGCCACCAGTAAACTACTGGTACACATTTATTATTAACAGCATCAACTACTCAGGCGCGCCAATATCATCCCTGAATGGCGTGACGATTAATAACACCTATTTCAACCTGACAGATAACCAGCCGATTGTTTCTGGTCCGTACTTTTCACCGATTGATGGTGATCAGCTTTGGGTGCACCTGCAACACCAGACCAATGATGGTAATGATTTCAGCGTGCTCATTGAGTGGTGGAAGATTGACGACGATAACGTTCAGATTCCCGGCACATATCAGTCGATGAACTATTATCAGGACGTGGACAGAAACGACACGTTCTACTATACAATCAAGCTAACCCCAGCTGCTGGAACTGGTCGCTACGCGATTCAGATGAGACGGACAAACAACAGTTCAGACACATCAATTCTTCAGCTTGAGGAGATTCACTCAATAGTCACGCGGACCAATGTTTCGTATCCAGATGACACAGTGGTTAAAGTTGTTGTACGCGCCACAGAGAACGCAACAGGAAGCCGTGACAGGAAATATAATGCATTAGTTACTCGCCACACCATCGGATACAACCGCGATACTGGCACGGTGCGCTACACACTTGCACCATCTCGTAGCTTTGCTGATGCTGTTCTGCATAACTGGCTGATTACCGCTGGCAATCCAGAAAACACAATTGACATCGTGAGGCTGTATGAAATTGCCGACAGTTTGCCAGATGAGCGACTTGGGTATTTCGATTACACGTTTGACGATGAGGATAAGAGCATTGGCGAACGTCTGCAAACAATCTGCGACGCAGCACGAGTCACCGCATTCTGGGATGATGGCGTAATGAGTTTCTCTCGTGATGAAAAGCGAGAATATCCAGCAACTGTATTTAACACTAGAAACACTCAAAGCGATGGCTACAAACTGAGTTATGACATCAGCCTTCCAGGCACTTATGATGGTGTTAACGTCGAATATCGTGACCCAACAACAAACAAGCAGGCCAACGTTTACTATCGCATCACAGATGGTGGTATCGTTGAAGGTGAGCCAACCAAAGCGAAGAAATTCGACATGCTTTATGTTCGCAATCGCTATCAGGCTGTTGATCGCGCAATCCTTGAGTGTCGTCGCCTGATTTATTCACGCCGCAGCATGGAAATTAAAGCGCTGGCAGATGGAGAATGGATTAATGTAGGCGATATGATTCAGGTAGTTGATATGTATGATGACGTGCAACAGACTGGCGTTATTGAAGCGCGCAACGGAAACGTATTCATGACCAGTGAGCAGTTAACCGCTGATGACAATCTCTACGTTGTGATTACCAGTTCGGATGGCAGCACATCAGAGAGATTGCCAGCAACAGTAACCGGATTGCATACATTCACCTGCAACCTGCCGTCTGGTTTTCAGCTAAACATATGGGATGGCACGAACGTGCAATCTGAATCTCGCTATGTCCTGAGTACGGAGAAAGAGCTGGACACCACGTTATGGGTTGTAAGCCAGAAGAATCCGGGAAGCGACGGAACAACAACGCTGACGATGAGTGAGTACAGTGATGACATGTACGAATATGCCATTCCATCATCGTGA

Genome Context

Tertiary structure

PDB ID

d2516e4a1a99b087840c60c158766c9eb49cfba8019e8f578d28100e53a876be

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2964

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence