Protein

View in Explore

Genbank accession

XLV54150.1 [GenBank]

Protein name

Ig-like domain-containing protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MLPIPLLKLGRHFLDKRGGVKELAVLSYPIDNSDGTSTTVAYVNSLAILFDNGQLNITGYNKFGECRTGDRNPINYPSETAWNVDHVWRADRAFVIRTFDNQFFYIGCTAGLIGSTAAGGNDVYVNEWTPLPEQIVKGLHLDTHPERLVEVMGGINNTVWVIAEAEGTGILHLYGSGNNTYGSLHVDKNQHATPVKIGETSENPETGPWKNPRINCEVHDNSVIFGGPRGFWIAGYDFLRNNSRNDLVWPPAQITRDDLRGIPADEEWKGFMCGPNGAVVVTQRMHRPDDQQLVNVFYGQDVWGDDTWRALNITYTHEVIMARGYGTSGIFFNNGTKQYRGFSRNLCNDIGAQSANNNPRANFIHYQALATAKYVEQRLPVSWTESVYFQGIHREGFLGTFTVVNGKLWWSGIPRGSFAGSNNLFGGRLNSQGFTEVPENWYKNVPVDSWGVDDIFDVNGVSSVSNIYIGDTVKMKLKPQPEGATFIIDKIELVNAAGTVVTDANYQFSTNWNHGGANEVIVTQYNRNVNRRGLYSVKITYHDKHGTGRTHTTRTLNWNTIVPAYPSEGKWHTVGRNKQFHVNDTVYFGLNGAQPAVEGDTSYMVRLHRMDAGSVTYDVTQEIYDQRRNTYNNLVQTQALWEFNPNGRGGKMLQINEQNGTSLTVHEHSDPWPDPGKPHPGARTLKIVSHDVGYFGIRWEATVRYADGTTNNIGITLGGTSEDNSLKIAYTPRGISIDNMDVVRNGYGDVNIKVTLGEHLGGERIIMYAFDHDPRTNGTYANQAWSYLINAPEPNTKEFYYGMKRDVCKKTGTHDWIAICVKDERTAWDEPVNRWFIGIPTRSDKYIAEYIVCMGGTNLNMCWNEDANKYSDYDYMRDYSCNQWFNQSTGYPPRQARVNPAIFTDTQVFLTKQANEVQTFKNKYDPNKWFYNCYGAFFWGPGELPGGGSCFESATYASDYIMGQVKKYKIIPGPETLGNAVDPYIVMTALRSNMDGTSMSMQIPVTNGYKRVVMIIKCDLIGKQVLAENGTSTHPFEIALHYQFADSPFAGDKRISDTDAQRCKKVLLGAGWWWYEFDLTDKFTDTSKVVTGLRLDLGENMHKSVCDGTYGDPTVYLKYVSFEHPEDVVYGPKLRLFGSWIAKDRVGMGKKVRGFLVDAGTEDMLVNAVWPELPGTQWDNSAKSINWFNIHRAMWTTNCYLWRELNDQAFGFSNGRRMAIICWTTLQRCYDHDYEIGGRAWKDIRDRIITNFADDNGGGAHNFGTSRLIHLNGSPAYKKEGYSGSMIEWGFVKDTRVLMGQQLAAAIGPNAVQSVKPAWFDIPIWSSGTPGTAAINPTTGDLEISWEDLKQVGGWDKTGYQVQWWRSDGSLAADEFVKDNFYTMSSAKAQQLFGQATPSTITMSMSCKDNRTGALGPRVAKVFSGIKWNLPVQSVSWKQIGDNKLLVTPACQFNATLNVDPAVAANSARASDFSVSNTAMADVRKIDTLNARITCKNTYGTFQIINNFTDVDSKVVRTASQTMQLGTLAYSALITEQSPTLQGGGVGKLITTPVWKPNEWVVFDLTVDFSSDNNWTWVRNCLSQLMGGQNSISDSHDSTDPSVFQIGKTHPETGAPLPDRKYALVCISYGKADVTFSGTHTYNGTYNFSRKYSLKAGNIIDEVGVLYNPGNGIGIVGGKLQMQEPSITPSNVSGIRKTWESSNTDIATVDATTGLVTFKAPGNVTITFVATDDAGRKTSSTSFTVKQMTPQWRMWIGTATDGAYPNPAGTSGMKTFSTSKPMEYGSGPKVGQMVYFGAYIPEIIGLPRSQLQLLFGAGVDELATFGYSDNIEAARSSGWVGFRMESGKEGRILGTASIGVMFPGDQQYRLGAYATFSL

Physico‐chemical properties

protein length:	1878 AA
molecular weight:	208795,72180 Da
isoelectric point:	6,31631
aromaticity:	0,11448
hydropathy:	-0,40479

Domains

Domains [InterPro]

DC_0065
STR
1–1664

DC_0065 IPR008964 DC_0095

IPR009091
STR
36–281

IPR009091 DC_1711

G3DSA:2.60.40.1080
STR
1673–1748

G3DSA:2.60.40.1080

IPR003343
STR
1682–1733

IPR003343

XLV54150.1

1 1878

Architecture

STR

RBD

STR 1-1748 | RBD 1749-1878

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0065	STR	DC_0065	1	1664	Novel HMM	DC_0065	Central	Low	Positional only	140 proteins / 140 hits
IPR009091	STR	IPR009091	36	281	Merged direct domain	Regulator of chromosome condensation 1/beta-lactamase-inhibitor protein II	Central	Low	Positional only	141 proteins / 141 hits
DC_1711	RBD	DC_1711	1647	1759	Novel HMM	DC_1711	C-terminal	Low	Positional only	141 proteins / 141 hits
IPR008964	RBD	IPR008964	1665	1737	Merged direct domain	Invasin/intimin cell-adhesion fragments	C-terminal	Low	Positional only	2 proteins / 2 hits
G3DSA:2.60.40.1080	STR	G3DSA:2.60.40.1080	1673	1748	Merged direct domain	G3DSA:2.60.40.1080	Central	Low	Positional only	18 proteins / 18 hits
IPR003343	STR	DC_0008	1682	1733	InterPro cluster	Bacterial Ig-like domain, group 2	C-terminal	Medium	Text match	304 proteins / 473 hits
DC_0095	RBD	DC_0095	1747	1878	Novel HMM	DC_0095	C-terminal	Low	Positional only	80 proteins / 80 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XLV54150.1

1 1878

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	10	10	0,0340
Central domain	11	360	351	0,9126
C-terminal	361	1878	1517	0,1344

Note: Constraints were applied during segmentation.
Sequence started with non-N-terminal domain|N-terminal too short, forced to 10 residues

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-10

Central
11-360

C-terminal
361-1878

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage HMD-6 [NCBI]	3375969	Viruses >
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XLV54150.1 [NCBI]

Genbank nucleotide accession

PQ505080 [NCBI]

CDS location

range 105715 -> 111351
strand +

CDS

ATGCTTCCAATCCCTTTGCTAAAACTTGGTCGTCATTTCCTCGATAAGAGGGGTGGAGTTAAGGAACTTGCTGTTCTGTCATACCCAATAGACAACAGTGACGGTACAAGCACTACAGTAGCTTATGTAAATAGCTTAGCTATACTTTTTGACAATGGTCAGCTTAATATTACGGGTTATAACAAGTTCGGGGAGTGTCGCACTGGGGATCGTAACCCTATAAACTACCCTAGCGAAACAGCCTGGAATGTTGATCATGTGTGGAGAGCAGACCGTGCGTTTGTGATCCGGACTTTTGATAACCAGTTTTTCTACATCGGCTGCACTGCAGGTCTTATCGGATCCACTGCGGCAGGTGGTAATGATGTTTACGTAAACGAGTGGACACCTCTTCCTGAACAGATTGTTAAAGGGTTGCACCTTGACACCCACCCAGAGCGCCTTGTTGAGGTGATGGGAGGTATTAACAACACTGTTTGGGTTATTGCAGAGGCAGAAGGCACTGGCATTTTACACCTGTACGGATCTGGTAACAACACCTACGGATCTTTGCATGTGGATAAAAACCAGCATGCAACCCCTGTAAAGATTGGTGAAACATCTGAAAATCCTGAAACAGGTCCTTGGAAAAACCCAAGAATCAACTGTGAGGTGCATGATAACTCTGTTATTTTCGGTGGTCCTAGAGGTTTCTGGATTGCTGGGTACGACTTTCTGAGAAACAACAGTAGAAACGACCTTGTTTGGCCTCCTGCTCAGATTACCCGTGACGATTTGAGAGGTATTCCTGCAGATGAGGAGTGGAAAGGGTTCATGTGCGGTCCGAACGGGGCAGTGGTTGTAACACAAAGAATGCACAGACCTGATGACCAGCAGCTTGTTAACGTATTCTACGGGCAAGACGTTTGGGGAGATGATACATGGCGTGCCTTGAATATCACCTACACCCATGAGGTAATAATGGCTCGTGGGTACGGCACAAGTGGCATTTTCTTCAACAATGGCACTAAGCAGTACCGTGGATTCTCTCGCAACCTTTGCAATGATATTGGCGCACAATCCGCAAACAATAACCCTAGGGCCAATTTTATCCACTATCAAGCCCTTGCCACAGCTAAATATGTTGAGCAACGACTGCCAGTCAGCTGGACAGAGAGTGTTTATTTCCAAGGCATTCACAGAGAAGGTTTTTTAGGGACCTTTACTGTTGTTAATGGTAAACTTTGGTGGTCAGGTATCCCAAGGGGAAGTTTTGCAGGCTCTAATAACCTGTTTGGCGGCAGACTTAATAGCCAAGGGTTCACGGAGGTCCCTGAGAATTGGTATAAAAATGTCCCAGTAGACAGTTGGGGTGTTGATGATATTTTCGACGTTAACGGTGTTAGCAGCGTTAGCAATATCTACATTGGGGATACGGTCAAGATGAAATTGAAGCCTCAGCCGGAGGGGGCTACGTTCATTATTGACAAGATTGAACTGGTAAATGCTGCAGGCACGGTTGTTACAGATGCAAATTACCAATTCTCCACCAACTGGAACCACGGTGGGGCCAACGAAGTTATTGTTACCCAGTATAACAGGAATGTTAACAGACGTGGACTGTACTCTGTAAAAATAACCTACCATGACAAGCATGGCACAGGTAGAACGCACACGACAAGGACTTTGAACTGGAACACCATAGTTCCTGCGTATCCTTCTGAAGGTAAGTGGCATACTGTTGGTAGAAATAAACAGTTCCATGTCAATGACACTGTATACTTTGGACTGAATGGGGCTCAGCCTGCAGTAGAAGGGGATACATCGTATATGGTCAGACTCCATAGAATGGATGCTGGATCAGTAACTTATGATGTTACCCAAGAGATTTATGATCAGCGACGAAATACCTACAATAACTTGGTGCAGACGCAGGCCTTATGGGAGTTCAACCCCAACGGCAGAGGTGGTAAAATGCTGCAGATCAACGAACAAAATGGGACATCGTTGACTGTTCACGAACACTCAGACCCGTGGCCTGATCCTGGAAAACCTCACCCAGGTGCTCGTACACTAAAAATTGTCAGCCATGACGTAGGATATTTCGGAATACGCTGGGAAGCAACGGTAAGATATGCCGACGGGACGACAAACAATATTGGGATCACCCTTGGTGGCACTAGTGAGGATAACTCACTGAAAATTGCCTACACTCCTAGAGGCATTTCTATTGATAATATGGATGTTGTTCGCAACGGTTACGGGGATGTGAACATCAAAGTCACCCTTGGTGAACATCTTGGTGGGGAAAGAATCATCATGTATGCCTTTGATCATGACCCTCGCACCAACGGAACTTATGCAAACCAGGCATGGAGTTACCTGATAAACGCACCTGAGCCGAATACTAAAGAATTCTACTATGGTATGAAACGAGATGTGTGCAAGAAAACAGGAACACACGACTGGATTGCGATCTGCGTTAAAGATGAGCGAACAGCTTGGGATGAGCCTGTTAATAGATGGTTCATAGGTATTCCTACCAGAAGCGATAAGTATATCGCAGAATATATTGTGTGCATGGGCGGTACCAACCTAAATATGTGTTGGAACGAAGATGCAAACAAATACTCTGATTATGACTATATGAGAGATTACTCTTGTAATCAGTGGTTTAACCAATCGACAGGGTACCCTCCCCGCCAGGCTAGAGTAAACCCTGCAATCTTTACAGATACGCAGGTTTTCTTGACAAAACAGGCTAACGAGGTTCAGACCTTCAAGAACAAATACGACCCTAACAAGTGGTTTTATAACTGTTATGGCGCATTTTTCTGGGGTCCGGGGGAACTACCTGGCGGGGGATCTTGCTTCGAGTCTGCAACTTACGCCAGTGACTACATCATGGGGCAGGTTAAGAAGTATAAGATAATCCCCGGCCCTGAAACTTTGGGAAATGCCGTTGACCCTTATATCGTCATGACTGCGCTGAGATCAAACATGGATGGGACATCCATGTCTATGCAAATCCCAGTAACAAATGGGTACAAACGTGTTGTAATGATCATTAAGTGCGACCTAATAGGTAAACAAGTTCTTGCAGAAAACGGGACCTCCACACATCCTTTTGAGATCGCTCTACACTATCAGTTTGCTGACTCACCTTTTGCAGGTGATAAGAGAATATCTGATACAGATGCACAGCGTTGTAAGAAGGTGTTGTTAGGTGCAGGTTGGTGGTGGTATGAATTTGATTTAACAGACAAATTCACCGACACGTCAAAAGTTGTAACGGGTCTTCGTCTAGACCTTGGCGAGAACATGCACAAATCTGTTTGTGATGGCACCTATGGTGACCCTACAGTATATCTAAAGTATGTCTCTTTTGAGCATCCAGAAGATGTTGTTTACGGTCCAAAACTGAGATTGTTTGGCAGTTGGATTGCAAAAGACAGGGTAGGCATGGGTAAAAAGGTAAGAGGGTTCTTAGTTGATGCAGGAACAGAAGACATGCTGGTTAATGCAGTATGGCCTGAATTGCCTGGCACTCAGTGGGATAACTCAGCCAAGTCCATAAACTGGTTCAACATTCACAGAGCTATGTGGACCACTAACTGCTACTTATGGAGAGAGCTTAACGATCAGGCTTTTGGCTTCAGTAACGGTAGAAGGATGGCAATCATTTGCTGGACAACGCTGCAAAGATGTTATGACCATGACTACGAGATTGGCGGTAGGGCATGGAAAGATATCAGGGATAGAATCATAACTAATTTTGCAGACGACAACGGCGGTGGAGCACATAACTTCGGCACAAGTAGACTTATTCACTTGAACGGATCCCCTGCCTACAAGAAAGAGGGTTACTCTGGATCTATGATCGAGTGGGGTTTTGTGAAAGATACTCGCGTATTGATGGGTCAACAACTTGCTGCTGCAATAGGGCCTAACGCAGTGCAGTCTGTTAAACCAGCGTGGTTCGATATCCCAATATGGTCATCTGGAACACCAGGAACTGCGGCAATCAACCCTACCACTGGAGATCTGGAAATCTCTTGGGAGGACTTGAAGCAGGTTGGTGGCTGGGATAAGACAGGCTACCAGGTGCAATGGTGGAGATCTGACGGATCGTTAGCGGCTGATGAGTTTGTTAAGGACAATTTCTACACCATGTCCTCTGCAAAAGCACAGCAATTGTTTGGTCAGGCCACTCCGTCGACGATCACCATGTCTATGAGCTGTAAAGACAACAGGACTGGAGCTCTGGGACCAAGGGTTGCTAAAGTTTTCTCAGGTATTAAATGGAATCTCCCTGTTCAAAGTGTTTCATGGAAGCAAATAGGTGATAACAAGCTACTGGTTACTCCTGCCTGCCAGTTCAACGCAACTCTCAACGTTGATCCCGCTGTTGCAGCAAACTCGGCTAGAGCTTCTGACTTCTCTGTGTCTAACACTGCTATGGCAGATGTGAGGAAGATTGACACACTGAACGCCAGAATTACCTGTAAAAACACTTATGGTACATTCCAGATCATCAACAACTTCACAGATGTTGATTCTAAGGTAGTGAGGACAGCAAGCCAGACTATGCAGTTAGGCACTCTGGCATACTCTGCCCTGATCACTGAACAGTCTCCTACCCTTCAGGGTGGAGGTGTTGGTAAGTTGATTACAACTCCTGTATGGAAGCCGAATGAGTGGGTTGTGTTCGATTTGACTGTGGACTTCTCCAGTGATAATAACTGGACATGGGTAAGGAATTGCTTGTCACAGTTGATGGGTGGTCAAAACTCCATTAGTGATAGCCATGACTCTACTGACCCGAGTGTGTTCCAGATTGGTAAAACTCACCCAGAGACTGGGGCACCGTTGCCTGACAGGAAGTATGCTTTGGTTTGCATCTCTTACGGAAAAGCAGATGTCACCTTCTCAGGGACACACACTTATAATGGAACTTACAACTTCTCAAGGAAGTATAGTCTCAAGGCAGGTAACATTATAGATGAAGTTGGTGTGTTGTATAACCCAGGTAACGGCATAGGGATTGTGGGTGGTAAACTGCAGATGCAGGAACCTTCTATTACCCCTTCCAATGTGTCTGGGATTAGAAAGACTTGGGAAAGCAGTAATACTGACATTGCAACAGTGGATGCTACCACAGGGCTGGTAACATTTAAAGCCCCTGGTAATGTCACTATAACGTTTGTAGCTACCGATGATGCAGGGCGCAAAACGTCTTCAACATCTTTTACTGTCAAACAGATGACACCACAGTGGAGAATGTGGATAGGTACAGCAACAGACGGGGCATACCCTAATCCGGCAGGGACTTCTGGTATGAAGACTTTCTCTACAAGCAAGCCGATGGAGTACGGCAGTGGTCCTAAGGTAGGGCAGATGGTGTACTTTGGTGCATATATTCCTGAAATTATAGGGCTTCCGAGAAGTCAGCTTCAGTTGCTGTTTGGGGCTGGTGTTGACGAGCTTGCCACTTTCGGGTATAGCGACAACATCGAGGCTGCAAGGAGTTCAGGATGGGTAGGGTTCAGAATGGAGTCTGGAAAGGAAGGCAGGATTCTAGGGACAGCCTCTATAGGTGTTATGTTCCCTGGTGACCAGCAGTATCGTCTGGGAGCCTACGCAACTTTCTCTCTTTAA

Genome Context

Tertiary structure

PDB ID

d04e513a1099fef97f11c1c7ada7d08da9771d95f9cf36e0e2500a5e19da3308

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4189

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence