Protein

View in Explore

Genbank accession

WCZ57477.1 [GenBank]

Protein name

chaperone of endosialidase

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,57

Evidence RBPdetect2

Probability 0,94

Evidence Phold

Probability 1,00

Protein sequence

MAITKIILQQMVTMDQNSITASKYPKYTVVLSNSISSITAGELTAAIESSKASAAAAKQSEINAKQSELNAKDSENEAEISAASSQQSATQSASSATASANSAKAAKTSETNAKASETAAKTSETNAKASETAAKTSETNANSSKTAAAASASAAKTSETNAAVSASAAKTSETNANSSKTAAASSASAAKASETNAKTSETNAAASATKAESVASGMRDSIGLGNAPRNCPDISGNPSAYIGFMRIMSTAVGFPSIASGESSLTGFISQVDGSPAYTGVFQGWASRSLYTYRWASNIGPQWTRHARKNEVDRLVQLSSETHLLNPGDNAKIIITSNKLWGAYDIENRTYIPLAVGQGGTGGRSAAEARTNLQLNRFQRSSDTRTIVCSTDVQKDGCYLQIDADGQWGAFNPTTGKWQPLAIAQGGTGALNTSDARRNLEVMYRRFSTLTDQNLNDLTGESTGFYYQGLSANATTARNYPIQEAGNLMVLQNGANGVAGCCQIYITFSTNRIYERSYNPGTSTWSAWGSILNSYDPSYCRQLIELGSQHAPLFAGLALTGYSDSTVAAGGIINSYLRATDGTQRVRMRLYPEKLADGVAAATLQVMGEDTGPSYKTFHFKHNGQLYVPNEINTETIAVRNLTVTQRNLGIPTTGFMGDYQTINAPAGAVDGKYYPVIIYTGGTNGYGTTPVPIFVRTPGRSASHEMNNNVFSGYVTCGGWSDSPTMAHGMFTTYDPNELGILCIKGSNKDYAQHIAVYVHYKAFPVNIMTDPKVEIIVPTEDYVLGTNGVKFKFGVTDAGDGNTEGNVKNILNFTGGGSGYYSTHPFRQGLSNNFALTNNLSTGDAFSATAPSFTFNGSVVGANSYSARGDAVTKNTYTSQLVNSADNIVGQSEFRATEEAGQIIVRDMSSSASHKFFNFNKDGTFSAPSGILSSTGIDWNTQHNTINKFYGVAGQVNTPENNVVFGGIHVGFSGNYATQLAGRGSRYYLRSIESGTIGAWNRIITDQYADFKTQIFANKNGEAITIKSTVNDNSESGYIAGRNNTNTRLWYVGKSGPQETVVIRNDMNGNQILLRDGAGDISLDTKDGNKVVYANASNFRLVNSNGKYTRLVTSGTSTHAISLDNWGSTTRPTVFECKYENPSTSANVSWIFYGQVNTDGSRVFQVNGAVNCVTLNQSSDRDLKDNIKPIKDATNALRKMNGYTYTLKEDGLPYAGVIAQEVMEALPEAVSGFTKYTDLEGPTLTGEQLVGEERFYSVDYGAITGLLVQVSRESDSRITALESEVSDLKKQIADLTLVVNSLLANKAQ

Physico‐chemical properties

protein length:	1309 AA
molecular weight:	139587,55330 Da
isoelectric point:	6,34422
aromaticity:	0,08403
hydropathy:	-0,36921

Domains

Domains [InterPro]

Coil
57–77

Coil cd19958 G3DSA:6.20.80.10 IPR030392

IPR030392
1180–1231

IPR030392 Coil

WCZ57477.1

1 1309

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	57	77	Coils	None
cd19958	447	527	CDD	None
G3DSA:6.20.80.10	1021	1081	Gene3D	None
IPR030392	1180	1286	InterPro	Intramolecular chaperone auto-processing domain
IPR030392	1180	1231	InterPro	Intramolecular chaperone auto-processing domain
Coil	1272	1306	Coils	None

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage Kenya-K20 [NCBI]	3027609	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

WCZ57477.1 [NCBI]

Genbank nucleotide accession

OQ291032 [NCBI]

CDS location

range 77591 -> 81520
strand -

CDS

ATGGCTATAACTAAAATAATTTTACAGCAAATGGTCACTATGGATCAGAATAGCATAACTGCAAGCAAATATCCTAAGTATACAGTTGTGCTTTCTAATTCTATTAGCTCTATTACAGCAGGAGAACTAACTGCTGCTATAGAATCCTCCAAAGCTTCTGCTGCAGCAGCTAAGCAATCAGAGATTAATGCTAAACAGTCGGAGCTAAATGCCAAAGATTCTGAGAATGAAGCAGAAATTTCTGCGGCATCTTCCCAGCAGTCTGCAACTCAGTCTGCTTCTTCTGCTACTGCTTCTGCTAATAGTGCTAAAGCTGCTAAGACTTCTGAGACCAATGCAAAAGCTAGCGAGACAGCTGCAAAAACTTCAGAAACTAACGCAAAAGCTAGTGAAACCGCAGCTAAAACTTCTGAGACTAATGCTAATAGTAGCAAAACTGCTGCGGCTGCTTCTGCATCAGCTGCTAAAACTTCAGAAACTAATGCTGCTGTATCTGCTTCTGCCGCTAAAACTTCTGAGACTAACGCTAATAGTAGTAAAACTGCTGCTGCTAGCAGTGCTAGTGCTGCTAAGGCCTCGGAAACTAATGCTAAAACATCAGAAACTAATGCGGCTGCCTCAGCTACTAAAGCCGAAAGTGTAGCTTCTGGTATGCGTGATTCTATAGGTTTAGGTAATGCCCCTCGTAATTGTCCTGATATTTCTGGTAATCCTTCTGCGTATATTGGCTTTATGCGTATCATGAGTACTGCGGTAGGCTTTCCATCAATAGCCTCTGGAGAGAGTAGTCTTACAGGATTTATTAGTCAAGTGGATGGCAGTCCAGCGTACACTGGTGTTTTCCAGGGATGGGCGTCTCGCTCATTATATACATATCGTTGGGCAAGCAACATAGGCCCACAGTGGACACGTCATGCTCGTAAGAATGAGGTTGATAGGCTCGTCCAACTAAGTTCTGAGACCCACCTATTAAACCCGGGTGATAATGCTAAAATAATTATTACTTCCAATAAACTCTGGGGAGCTTATGATATAGAGAATAGGACATACATACCTCTTGCAGTAGGACAGGGAGGTACCGGGGGTAGATCAGCTGCTGAAGCAAGAACTAATCTACAGCTAAACCGCTTCCAACGTTCCAGTGATACAAGAACCATCGTTTGTTCAACAGATGTTCAGAAGGACGGCTGTTACTTACAGATTGATGCTGACGGTCAGTGGGGAGCATTTAATCCTACAACTGGTAAATGGCAACCTCTCGCAATAGCTCAGGGTGGCACTGGTGCTCTTAATACTTCTGACGCACGTAGAAATCTGGAAGTAATGTATCGTAGATTTTCTACCTTAACAGACCAAAACTTGAATGATCTTACGGGTGAGTCTACAGGTTTCTACTACCAGGGTCTATCTGCTAATGCAACTACAGCCCGTAATTATCCTATTCAAGAAGCGGGAAACTTAATGGTACTACAAAATGGTGCTAATGGGGTTGCTGGATGTTGTCAAATATACATTACCTTTAGTACTAATAGGATATACGAACGTAGTTATAACCCAGGTACCTCAACATGGTCTGCCTGGGGATCTATCCTTAATAGTTATGATCCTAGCTACTGTAGACAGCTTATTGAGCTAGGTTCCCAGCATGCACCATTATTTGCCGGTCTAGCATTAACTGGATATAGTGATAGTACGGTAGCTGCTGGAGGTATTATTAATAGCTATCTAAGAGCTACAGATGGTACTCAAAGGGTACGTATGCGCTTATACCCCGAGAAACTTGCTGATGGGGTTGCAGCTGCAACGCTACAGGTTATGGGGGAAGATACTGGTCCATCTTATAAAACATTCCATTTTAAACACAATGGCCAATTATACGTACCAAATGAGATAAATACGGAGACTATAGCTGTTAGGAATCTTACTGTAACCCAACGAAATTTAGGTATACCTACTACTGGATTTATGGGCGATTACCAGACTATCAATGCACCCGCAGGTGCTGTAGATGGAAAATATTACCCAGTTATAATCTACACTGGAGGTACCAATGGTTATGGTACTACGCCTGTACCTATATTTGTGCGTACTCCGGGTAGATCTGCGTCCCATGAGATGAACAATAATGTTTTCTCTGGATATGTAACTTGTGGGGGTTGGAGTGATAGTCCCACTATGGCACACGGCATGTTTACAACATACGATCCTAATGAACTAGGGATCTTATGTATAAAGGGTAGTAACAAAGACTACGCCCAGCATATAGCAGTGTATGTACACTATAAGGCATTCCCTGTAAATATTATGACAGACCCTAAGGTTGAGATAATTGTTCCAACCGAGGATTATGTATTAGGTACTAACGGTGTTAAATTTAAGTTTGGGGTAACAGATGCGGGTGATGGGAACACAGAAGGTAATGTGAAGAATATTCTGAACTTTACTGGTGGTGGTTCTGGTTACTACTCTACCCATCCTTTCCGCCAGGGATTATCTAATAATTTTGCCCTAACTAATAACCTTAGTACTGGAGATGCTTTTTCTGCTACTGCACCTTCTTTTACTTTTAATGGTAGTGTTGTCGGTGCTAATAGCTATTCTGCTAGAGGTGATGCTGTAACAAAAAATACGTATACATCTCAACTGGTAAATAGTGCCGATAACATAGTAGGACAGAGTGAGTTTAGGGCAACCGAAGAAGCAGGACAAATTATTGTTAGAGATATGAGTAGTTCTGCTAGCCATAAATTCTTTAACTTCAATAAGGATGGAACCTTTTCAGCTCCTTCTGGTATTTTATCTTCTACTGGTATAGACTGGAATACCCAACATAATACTATCAATAAATTTTATGGTGTTGCGGGTCAAGTTAATACTCCTGAAAATAATGTTGTTTTTGGTGGTATCCATGTAGGGTTTAGCGGTAATTATGCTACTCAATTAGCCGGTAGGGGTAGTAGATATTACCTGAGAAGTATTGAATCTGGCACTATAGGTGCATGGAATCGTATAATTACGGATCAGTATGCAGATTTTAAAACACAAATTTTTGCTAACAAAAATGGCGAAGCTATAACCATTAAATCGACAGTGAATGACAACTCGGAATCTGGATATATCGCTGGTAGAAATAATACCAATACCCGTTTATGGTACGTAGGAAAATCCGGTCCTCAAGAAACTGTGGTTATCCGTAACGATATGAACGGAAACCAAATACTGTTAAGGGATGGTGCTGGCGATATAAGCTTGGATACAAAGGACGGGAACAAGGTTGTATACGCAAACGCGTCGAACTTTAGGCTTGTTAATAGTAACGGAAAGTATACAAGATTAGTAACATCCGGAACTTCAACTCATGCAATTAGCCTGGATAATTGGGGTTCAACCACAAGACCAACTGTATTTGAATGTAAGTACGAAAATCCTTCTACTTCTGCTAACGTTAGTTGGATATTCTATGGTCAAGTAAATACCGATGGATCTAGAGTATTTCAAGTTAATGGTGCTGTTAACTGTGTAACTTTAAATCAAAGTTCCGACCGTGATCTTAAAGACAATATTAAACCAATCAAAGACGCAACAAATGCTTTGCGGAAAATGAATGGTTATACATATACACTTAAAGAAGACGGCTTACCTTATGCGGGTGTTATTGCTCAGGAAGTGATGGAGGCTCTACCTGAAGCTGTAAGTGGATTTACAAAATATACAGATCTTGAAGGACCTACCCTTACTGGAGAACAATTAGTTGGTGAAGAAAGATTCTACTCAGTAGACTATGGAGCAATTACCGGGTTATTAGTACAGGTAAGTAGGGAATCTGATAGTAGGATCACAGCTCTAGAATCAGAAGTATCTGATCTTAAAAAGCAAATTGCAGACCTAACGTTAGTAGTTAATTCTCTGCTAGCAAATAAGGCACAATAA

Tertiary structure

PDB ID

7131c6f957e6b4a4d9c8949ae0c8715ef1f0529dc9431df0bc3a6c0048a3d01d

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5524

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Whole genome sequence of Salmonella phage Kenya-K20	Gunathilake,D., Makumi,A., Loignon,S., Trembley,D., Labrie,S., Svitek,N. and Moineau,S.	2024-01-11	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature