Protein

View in Explore

Genbank accession

CAO2434660.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MLPIPLLKLGRHFLDKRGGIKELAVLSYPIDNSDGTSNTVSYVNSLAILFDDGQLNITGYNKFGECRTGDRNPINYPSETAWNVDHVWRADRAFVIRTFDNQFFYIGCTAGLIGSTAAGGNDVCVNEWTPLPEQIVKGLHLDTHPERLIEVMGGINNTVWVIAEAEGTGILKLYGSGNNTYGSLHVDKNQHATPVKIGETSENPETGPWKNPSINCEVHDNSVIFGGPRGFWIAGYDFLRNNSRNDLVWPPVQITRNDLRGIPADEEWKGFMCGPNGAIIATQRMHKPNDQQLVNVFYGQDVWGDDTWRSLNITYTHEVIMARGYGTSGIFFNNGTKQYRGFSRNLCNDIGAQSANNSPRANFIHYQALATAKYVEQRLPVSWTESVYFQGIHREGFLGTFTVVNGKLWWSGIPRGSFAGSNNLFGGRLNSQGFTEIPENWYKNVPVDSWGIEDIFDVNGVSNVSNIYIGDTVKMKLKPQPEGATFIIDKIELVNAAGTVVTDANYQFSTNWNHGGANEVVVTQYNRNINRRGLYSIKITYHDKHGTGRTYTTRTLNWNTIVPAYPSNGKWHTVGRNKQFHVNDTVYFGLNGTQPAVEGDTSYMVRLHRMDAGSVTYDVTQEIYDQRRATYDNIVKTQALWEFNPNGKGGKMLQVNEQNGTSLTVHEHPDPWPDPGKPHPGARTLKIVSHDAGYFGIRWEATVRYVDGTTNNIGITLGGTSEDNSLKIAYTPRGISIDSMDVVRNGYGDVNVKVTLGEHLGGERIIMYAFDHDPRTNGTYANQAWSYLINAPEPNTKEFYYGMKRDVCKKTGTHDWIAICVKDERTAWDEPVNRWFIGIPTRSDKYVAEYIVCMGGTNLNMCWNEDVNKYSDYDYMRDYSCNLWFNQTTGYPPRQARVNPAIFTDTQVFLTKQANEVQTFKNKYDPNKWFYNCYGAFFWGPGELPGGGSCLNEATYASDYIMGQVKKYKIIPGPETLGNAVDPYIIMTALRSNMDGTSMSMQIPVTNGYKRVVMIIKCDLIGKQVLAENGTSTHPFEIALHYQFADSPFAGDKRISDTDAQRCKKVLLGAGWWWYEFDLTDKFTDTSKVVTGLRLDLGENMHKAVCDGTYGDPTIYLKYVSFEHPEDVVYGPKLRLFGSWIAKDRVGMGKKVRGLLVDAGTEDMLVNAVWPELPGTQWDNSAKSINWFNIHRAMWTTNCYLWRELNDQAFGFSDGRRMAIICWTTLQRCYDHDYEIGGRAWKNIRDRIITNFADDNGGGAHNFGTSRLIHLNGSSAYKKEGYSGSMIEWGLVKDARVLMGQQLAAAIGPSAVQSVKPAWFDIPLWSPGTPGTAAINPTTGDLEISWEDLKQVGGWDKTGYQVQWWRADGSLAADEFVKDNFYTMSSAKAQQLFGQATPSTITMSMCCKDNRTGALGPRVAKVFSGIKWNLPVQSISWKQIGDNKLLVTPACQFNATLNVDPAVAANSAKASDFSVSNTAMADVRKIDTLNARITCKNTYGTFQIINNFTDADSKVVRTASQTLSLGTLAYAALITEQSATLQGGGVGKSITTPVWKPNEWVVFDLTVDFSSDNNWTWVRNCLSQLMGGPSSVSDSHDSTDPSVFQVGKTHPETGETLPDRKYALVCISYGKADVTFSGTHTYNGTYNFSRKYSLKAGNIIDEVGVLYNPGNGIGIVGGKLQMQEPSITPSNVSGIRKTWESSNTNIATVDATTGLVTFKATGNVTIKFVVTDDAGRKTSSTSFTVKQMAPQWRMWIGTATNGAYPNPAGTSGMKTFSTSKPMEYGSGPKVGQMVYFGAYIPEIIGLPRSQLQLLFGAGVDDLATFGYSDNIEAARSSGWVGFRMESGKEGRILGTASIGVMFPGDQQYRLEAYATFSR

Physico‐chemical properties

protein length:	1878 AA
molecular weight:	208539,81670 Da
isoelectric point:	6,48774
aromaticity:	0,11289
hydropathy:	-0,39036

Domains

Domains [InterPro]

DC_0065
STR
1–1664

DC_0065 IPR008964 DC_0095

IPR009091
STR
41–197

IPR009091 DC_1711

G3DSA:2.60.40.1080
STR
1675–1746

G3DSA:2.60.40.1080

IPR003343
STR
1682–1733

IPR003343

CAO2434660.1

1 1878

Architecture

STR

RBD

STR

RBD

STR 1-1664 | RBD 1665-1674 | STR 1675-1746 | RBD 1747-1878

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0065	STR	DC_0065	1	1664	Novel HMM	DC_0065	Central	Low	Positional only	140 proteins / 140 hits
IPR009091	STR	IPR009091	41	197	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
DC_1711	RBD	DC_1711	1647	1760	Novel HMM	DC_1711	C-terminal	Low	Positional only	141 proteins / 141 hits
IPR008964	RBD	IPR008964	1665	1737	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	1675	1746	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR003343	STR	DC_0008	1682	1733	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
DC_0095	RBD	DC_0095	1747	1878	Novel HMM	DC_0095	C-terminal	Low	Positional only	80 proteins / 80 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAO2434660.1

1 1878

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0450
Central domain	11	360	351	0,9304
C-terminal	361	1878	1517	0,1488

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain|N-terminal too short, forced to 10 residues

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-360

C-terminal
361-1878

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage KCP_009 [NCBI]	3465670	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAO2434660.1 [NCBI]

Genbank nucleotide accession

OZ346226 [NCBI]

CDS location

range 39618 -> 45254
strand +

CDS

ATGCTTCCAATCCCTTTGCTAAAACTTGGTCGTCATTTCCTCGATAAGAGGGGTGGAATTAAGGAACTTGCTGTTCTGTCATACCCAATAGACAACAGTGATGGTACAAGCAACACAGTATCCTATGTAAATAGCTTGGCTATACTTTTTGATGATGGTCAGCTTAATATTACGGGCTATAACAAGTTCGGGGAGTGTCGCACTGGGGATCGTAACCCTATAAACTACCCAAGCGAAACAGCCTGGAATGTTGATCATGTGTGGAGAGCAGACCGTGCGTTTGTGATCCGGACTTTTGATAACCAGTTTTTCTACATCGGCTGCACTGCAGGTCTTATCGGATCCACTGCGGCAGGCGGTAATGATGTTTGCGTAAACGAGTGGACACCTCTTCCGGAACAGATTGTTAAAGGGTTGCACCTTGACACCCACCCAGAGCGCCTTATTGAGGTGATGGGTGGTATTAACAACACTGTCTGGGTTATTGCAGAGGCAGAAGGCACTGGCATACTTAAACTATATGGATCTGGTAACAACACCTACGGATCTTTGCATGTAGATAAAAATCAGCATGCAACCCCTGTAAAGATTGGTGAGACATCGGAAAATCCGGAAACAGGTCCTTGGAAAAACCCAAGCATCAACTGCGAGGTGCATGACAACTCTGTTATTTTCGGTGGTCCTAGAGGCTTCTGGATTGCTGGATACGACTTTCTAAGAAATAACAGTAGAAACGACCTTGTTTGGCCTCCTGTGCAGATTACTCGTAACGATTTGAGGGGCATTCCTGCAGATGAAGAGTGGAAAGGGTTTATGTGCGGTCCTAACGGGGCAATAATTGCCACACAGAGGATGCACAAACCAAATGACCAGCAGCTTGTTAACGTATTCTACGGGCAAGACGTTTGGGGAGATGACACGTGGCGTTCCTTAAATATCACCTACACCCATGAGGTGATAATGGCTCGTGGATACGGCACAAGTGGCATTTTCTTCAATAATGGCACTAAACAGTATCGTGGATTCTCTCGCAACTTGTGTAATGATATTGGTGCACAATCTGCAAACAATAGCCCTAGGGCTAATTTTATCCACTATCAGGCTCTTGCTACAGCTAAATATGTTGAGCAACGCCTGCCAGTTAGCTGGACAGAGAGTGTTTATTTCCAAGGCATCCACAGGGAAGGTTTCTTAGGAACCTTTACTGTTGTTAATGGCAAACTTTGGTGGTCAGGCATCCCAAGGGGGAGTTTTGCAGGATCTAACAACCTCTTTGGCGGCAGACTTAACAGCCAAGGGTTCACAGAGATTCCGGAGAATTGGTATAAAAATGTCCCGGTAGATAGCTGGGGTATCGAAGACATCTTTGATGTCAATGGTGTGAGCAATGTTAGCAACATTTACATCGGAGATACTGTCAAGATGAAATTGAAACCTCAGCCGGAGGGTGCTACGTTCATTATTGACAAGATTGAGTTGGTAAATGCTGCAGGCACTGTTGTTACAGATGCAAACTATCAGTTCTCCACTAACTGGAACCATGGTGGTGCTAACGAAGTTGTGGTCACCCAGTATAACCGTAACATCAACAGACGTGGTTTGTATTCTATCAAGATCACCTACCATGACAAGCATGGCACTGGAAGAACCTATACGACAAGAACTTTGAACTGGAACACTATAGTTCCTGCGTATCCGTCCAACGGCAAGTGGCATACCGTTGGTAGAAACAAGCAGTTCCATGTTAACGATACTGTATACTTTGGGCTGAATGGGACCCAGCCTGCAGTAGAAGGGGATACATCGTATATGGTCAGACTCCACAGAATGGATGCTGGATCAGTCACTTATGATGTGACCCAAGAGATCTACGATCAAAGACGTGCCACGTATGACAATATTGTAAAAACACAAGCCTTGTGGGAGTTCAATCCTAATGGCAAGGGTGGTAAAATGTTGCAGGTTAATGAGCAGAACGGAACGTCGTTGACTGTTCACGAACACCCAGACCCTTGGCCTGATCCTGGAAAACCTCACCCGGGAGCTCGTACACTGAAAATTGTCAGCCATGATGCAGGATATTTCGGAATACGCTGGGAAGCTACAGTAAGATATGTCGACGGGACAACAAACAACATAGGGATTACACTTGGCGGCACTAGTGAAGATAACTCGCTGAAAATTGCCTACACGCCCAGAGGTATCTCTATTGATAGTATGGATGTTGTTCGCAATGGCTACGGCGATGTGAATGTCAAAGTTACTCTTGGCGAACATCTTGGTGGGGAAAGGATCATCATGTATGCCTTTGATCATGATCCACGCACCAATGGAACTTATGCAAATCAGGCATGGAGTTACCTGATAAATGCACCTGAGCCGAATACTAAAGAGTTCTACTATGGTATGAAGCGAGATGTGTGCAAGAAAACAGGAACACATGACTGGATTGCTATCTGCGTTAAAGATGAGCGCACAGCTTGGGATGAGCCTGTTAACAGATGGTTCATAGGTATTCCTACCAGAAGTGATAAGTATGTCGCAGAATATATTGTATGCATGGGCGGTACCAACCTAAACATGTGTTGGAACGAAGATGTAAACAAATACTCTGATTATGACTATATGAGGGATTACTCTTGTAATTTGTGGTTTAACCAAACTACAGGTTACCCTCCAAGACAGGCGAGAGTAAACCCTGCAATCTTCACAGACACGCAGGTTTTCTTGACAAAACAGGCCAACGAGGTTCAGACCTTCAAGAATAAATACGATCCTAACAAGTGGTTCTACAACTGTTACGGCGCATTTTTCTGGGGACCTGGTGAGTTACCTGGTGGGGGATCTTGCTTGAATGAGGCAACTTACGCAAGTGACTACATCATGGGGCAGGTCAAGAAGTATAAGATAATCCCCGGTCCTGAGACTTTGGGCAATGCCGTTGACCCTTATATCATCATGACTGCACTGAGATCAAACATGGATGGGACATCCATGTCCATGCAAATTCCGGTAACAAACGGATACAAACGTGTTGTGATGATCATTAAGTGCGACCTGATAGGTAAACAAGTTCTTGCAGAAAACGGGACATCCACACATCCTTTTGAGATCGCTCTGCACTATCAGTTTGCTGACTCACCTTTTGCAGGGGATAAGAGAATATCTGATACAGACGCACAGCGTTGTAAGAAAGTATTGTTGGGTGCAGGTTGGTGGTGGTATGAGTTTGATTTAACAGACAAATTCACCGACACGTCTAAAGTTGTAACAGGACTTCGTCTAGACCTTGGCGAGAACATGCACAAAGCTGTTTGTGATGGCACCTATGGTGACCCTACAATATACCTAAAATATGTTTCTTTTGAGCATCCGGAAGATGTTGTCTACGGTCCAAAACTGAGATTGTTTGGCAGCTGGATTGCAAAAGATAGGGTAGGCATGGGTAAGAAGGTAAGAGGGCTCTTGGTTGATGCAGGAACAGAAGACATGCTGGTTAATGCAGTGTGGCCTGAATTACCTGGGACTCAGTGGGACAACTCAGCCAAATCTATAAACTGGTTTAACATTCATAGGGCCATGTGGACCACTAACTGCTACTTGTGGAGAGAGCTTAACGATCAGGCCTTTGGATTCAGCGATGGTAGAAGGATGGCGATCATTTGCTGGACAACACTGCAAAGATGTTATGACCATGACTATGAGATTGGGGGCAGGGCATGGAAAAATATCAGGGATAGAATCATAACCAATTTTGCAGACGACAACGGTGGTGGAGCACATAACTTTGGCACAAGCCGACTCATCCATTTGAACGGATCCTCAGCCTACAAGAAAGAAGGTTACTCTGGGTCTATGATCGAGTGGGGTCTGGTGAAAGATGCTCGCGTATTGATGGGCCAGCAACTTGCTGCCGCAATAGGTCCCAGCGCAGTGCAGTCGGTTAAACCAGCGTGGTTCGATATTCCATTGTGGTCACCCGGAACACCGGGAACTGCTGCAATCAACCCTACCACTGGGGATCTAGAAATCTCCTGGGAGGACTTGAAGCAGGTCGGTGGTTGGGACAAAACAGGGTACCAGGTTCAGTGGTGGAGAGCTGATGGATCTTTAGCTGCTGATGAGTTTGTTAAGGACAATTTCTACACTATGTCCTCTGCAAAAGCACAGCAATTATTTGGTCAGGCAACTCCGTCAACGATCACCATGTCTATGTGCTGTAAAGACAACAGGACTGGAGCTTTGGGGCCAAGGGTTGCTAAAGTTTTCTCAGGTATTAAATGGAATCTACCTGTCCAAAGTATTTCATGGAAGCAAATAGGTGATAACAAGCTGCTGGTTACCCCTGCCTGTCAGTTCAACGCAACTCTTAACGTTGATCCTGCTGTTGCGGCAAACTCAGCTAAAGCTTCTGACTTCTCTGTGTCTAACACTGCTATGGCAGATGTGAGGAAGATTGACACGCTGAACGCCAGAATTACCTGTAAAAACACTTATGGCACATTCCAGATCATCAACAACTTCACAGATGCTGATTCTAAGGTAGTGAGGACAGCAAGCCAGACTTTGAGTTTAGGAACTCTGGCCTATGCGGCCCTGATCACTGAACAGTCGGCAACACTCCAAGGAGGTGGTGTAGGCAAGTCCATTACAACACCTGTGTGGAAGCCAAATGAGTGGGTTGTGTTTGATTTGACTGTGGACTTCTCCAGCGATAATAACTGGACATGGGTAAGGAATTGTTTGTCACAGTTGATGGGCGGTCCAAGCTCCGTTAGTGATAGTCACGACTCTACTGACCCGAGTGTGTTCCAGGTAGGTAAAACTCACCCAGAGACTGGAGAAACGTTGCCTGACAGGAAGTATGCTTTGGTTTGCATCTCTTACGGGAAGGCAGATGTCACCTTCTCAGGGACACACACTTATAACGGAACCTACAACTTCTCAAGGAAGTATAGTCTCAAAGCAGGGAACATTATAGACGAGGTTGGTGTGCTGTATAATCCGGGCAACGGCATAGGGATTGTTGGTGGTAAACTGCAGATGCAGGAACCTTCTATTACCCCTTCCAACGTATCCGGGATTAGAAAGACTTGGGAAAGTAGTAATACCAACATTGCAACAGTGGATGCCACCACAGGACTGGTAACATTTAAAGCTACTGGGAATGTCACCATAAAGTTTGTAGTTACAGATGATGCAGGGCGCAAAACGTCTTCAACATCTTTTACTGTCAAACAGATGGCACCACAGTGGAGAATGTGGATAGGTACAGCAACAAACGGGGCATACCCTAATCCGGCAGGTACTTCTGGTATGAAGACTTTCTCTACAAGCAAACCGATGGAGTACGGCAGCGGTCCTAAGGTAGGGCAGATGGTGTACTTTGGTGCGTATATTCCTGAAATTATAGGGCTTCCGAGAAGTCAGCTTCAGTTGCTGTTTGGGGCTGGTGTTGACGATCTTGCCACTTTCGGGTATAGCGACAACATCGAGGCTGCAAGGAGTTCAGGATGGGTAGGGTTCAGAATGGAGTCTGGAAAGGAAGGCAGGATTCTAGGGACAGCCTCTATAGGTGTTATGTTCCCTGGTGACCAGCAGTATCGTCTAGAAGCCTACGCAACCTTTTCTCGTTAA

Genome Context

Tertiary structure

PDB ID

9cc5f4c7e0d3e5a5fc90609f279e98a82cf0dcae0c4df1d444e1c6fb6f10bcbc

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4073

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence