Protein

View in Explore

Genbank accession

QBX16190.1 [GenBank]

Protein name

endopeptidase

RBP type

Evidence RBPdetect2

Probability 0,91

Protein sequence

MITFLDEKDVEHGALATIKVTNAVNGERSLTGEIESGDYVLSNIERGWRLRFENEFYVVTYAKPVDDGKATHVTFDAVHQFFWDFDKSSVHEQLNDGSHTFLNYLDFIFADSGYTYTVDPLLKVYAFEKQSFGYKSRLNLFNDIITASGVEFQVIGKVVRILEKTGTDLSTVVRKNFNMNELGIEKHIGDFVTYQKGFGAWFDENDHTKGRLVTEYTSPLASVYGKLEAEPLVDERYTQADNMIAALKANVDNSYSISITLDMEDLTRAGYDYTQPTAGDYIMAINETLDFKEKIRIVSFTSEYDVTGQLVKHEVTCNDIGAVKKLSASYNLAKEQAQNASDSVAKAVEMANKALVSADGKSTVYFGNEFPKDEPKGTLHKGDSLYLTVGDTTKMYYWTGSDWEELPIVNDVEAFKEQIAEELKEVPDREEFEATIAQELATSKAELETQIDTAKTQAESNAKAYADEINQATAEVAEQANTTANSLKPDLAKVQTDLTATTSTANAAKTSASEAKQQLTTVANDLNTAKQDLQTQASQLTAQASAQSELTKRVSSVEETANGTKTTVSELSKTVAQNGKDITSVTARTKTVEDDLTSTKTTLSQVKTTADSTSQKTATLETGLNGLNAKFETLKIGSRNYFKNSKSRKYYINSTETQDVRTYIGDEFWQNDTRFTKNYVRMSFDIAFNPALPSNFTTNVHFSASPWYNCGGITFKGGTTALQHFDLKFDLSGASKSYKTDNVFIRLNNTLPLNTAVSLENFNLYLSAVVEDYNQNEADIESKVAEYKQTADQNYASLQSTVQTLDGTVKQNKSEFDQTASQIKSSISAVEGKIPTEIGSSNLLRNTAVNADNLKLFGAANSTVSIATKDGHQTYKIVVSATNNSGALFNGNAQYYNLIKDRYYTFSFWVLANKDKSYNFNGLGHVQTINNNSDKVGNDSVHQHTSPVYSTSVVKANTWTKVWCTFKATSNSYFKPYFWYLTAGDEIYIYDMILNEGKIPLSYTPAIEDTESDISKLNTTLTQTANGLEQLSTQVTSQGNTITSHTNSINSLSTGLSAKVSQTDFNTLSGRVTTAENNITAKANELSSKISSVEGKIPTRNDFRNLYIIANSSAGYIQANNASVLGTQDSVFKEWTSDYIPVSAGEKYTFQTWVTLTGSQQGWRAWQFYNEDKSLNGGRWAATYSSDQQAQHVITVPANAKYLRVSARLYSDGKIMVEKGDTYQNYALAPEDYDSKLASAQSEIKQTTDSIKASVSALDKSTVKSASLTINTDGIVMKAGKSTTDVANAIGSYFAVNQNAINLFSDKINVKANMIVDGAITSAKIASKSINTAHLNGKIITADVISSNAITSDAIKAGAVTTDKMTANSINGDRITAGTLDAAKIKAGSITASQIASGTITSSQIKSGTISAANIATGAVTTDKIAANSINSDKIVSSGITANVIKGGKLQSLSNATNFELDTGKLFYNNNNTGIFRVQDNASTMGLKFSNTSITVSGTSRILSRVILGGDRRETTLDDGKWDQGGFSGIVVETINGVAANDHERADSLRVIADNIYFGHSYNKDVATNTSAAGWKMETYSPNSTYTGHVVMKPFGINSRYADIVTGDVRLDNGDGSGYWVRGCIQVLRNCFQHFLNGGTSDDAKNAIRNALRDISGV

Physico‐chemical properties

protein length:	1658 AA
molecular weight:	180986,23290 Da
isoelectric point:	5,35227
aromaticity:	0,08866
hydropathy:	-0,40772

Domains

Domains [InterPro]

DC_1353
STR
1–809

DC_1353 G3DSA:2.60.120.260 G3DSA:1.20.5.340 DC_0412

G3DSA:3.55.50.40
STR
79–166

G3DSA:3.55.50.40 PTHR32083 Coil DC_0855 DC_0853

IPR010572
ENZ
97–303

IPR010572 Coil Coil

G3DSA:1.20.5.170
STR
468–622

G3DSA:1.20.5.170

QBX16190.1

1 1658

Architecture

STR

RBD

STR

STR 1-809 | STR 841-1337 | RBD 1338-1381 | STR 1382-1656 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1353	STR	DC_1353	1	809	Novel HMM	DC_1353	Central	Low	Positional only	61 proteins / 61 hits
G3DSA:3.55.50.40	STR	G3DSA:3.55.50.40	79	166	Merged direct domain	G3DSA:3.55.50.40	Central	Low	Positional only	63 proteins / 63 hits
IPR010572	ENZ	DC_0675	97	303	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
PTHR32083	Unmapped	-	328	621	PANTHER	CILIA AND FLAGELLA-ASSOCIATED PROTEIN 58-RELATED	-	-	-	-
Coil	Unmapped	-	437	482	Coils	Coil	-	-	-	-
G3DSA:1.20.5.170	STR	G3DSA:1.20.5.170	468	622	Merged direct domain	G3DSA:1.20.5.170	Central	Low	Positional only	8 proteins / 8 hits
Coil	Unmapped	-	512	543	Coils	Coil	-	-	-	-
Coil	Unmapped	-	770	790	Coils	Coil	-	-	-	-
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	841	996	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_0855	STR	DC_0855	895	1337	Novel HMM	DC_0855	Central	Low	Positional only	10 proteins / 10 hits
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	998	1097	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits
DC_0412	RBD	DC_0412	1336	1398	Novel HMM	DC_0412	C-terminal	Low	Positional only	4 proteins / 4 hits
DC_0853	STR	DC_0853	1382	1656	Novel HMM	DC_0853	Central	Low	Positional only	5 proteins / 5 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage Javan235 [NCBI]	2548060	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Streptococcus gallolyticus UCN34 [NCBI]	637909	Bacillota > Bacilli > Lactobacillales > Streptococcaceae > Streptococcus > Streptococcus gallolyticus

Coding sequence (CDS)

Genbank protein accession

QBX16190.1 [NCBI]

Genbank nucleotide accession

MK448711 [NCBI]

CDS location

range 35794 -> 40770
strand +

CDS

TTGATTACATTTTTAGATGAAAAAGACGTTGAGCATGGTGCACTTGCCACTATCAAGGTTACTAATGCTGTCAATGGCGAACGCTCATTGACTGGTGAAATTGAATCAGGCGATTATGTCCTATCTAATATTGAACGTGGCTGGCGTCTAAGGTTTGAAAATGAGTTTTATGTGGTAACTTATGCTAAACCTGTTGATGATGGAAAAGCGACACACGTAACGTTTGACGCTGTTCATCAATTTTTCTGGGATTTTGATAAGTCATCTGTACATGAACAATTAAATGATGGTTCACATACATTTCTGAATTATCTTGATTTCATCTTTGCAGACAGCGGCTATACTTATACAGTTGACCCGCTTTTGAAAGTCTATGCTTTTGAAAAACAGTCATTTGGTTATAAGAGCCGTCTGAACCTCTTTAATGATATTATCACGGCATCTGGTGTTGAGTTTCAAGTTATTGGTAAAGTCGTTCGTATCCTGGAAAAGACGGGAACGGACCTATCAACAGTTGTTCGCAAGAACTTCAATATGAATGAGCTCGGCATTGAAAAACATATTGGTGACTTTGTCACTTATCAAAAAGGTTTCGGTGCATGGTTCGATGAGAATGACCATACTAAAGGTCGTTTAGTTACTGAATATACAAGTCCACTAGCCAGCGTGTACGGCAAACTGGAAGCTGAACCATTGGTTGATGAACGCTATACACAAGCAGACAACATGATTGCTGCATTAAAAGCTAACGTTGATAATTCTTACAGCATCTCGATTACTCTTGACATGGAAGATTTAACTCGTGCTGGTTATGATTATACTCAACCAACAGCGGGTGATTACATCATGGCTATCAATGAAACACTTGATTTTAAAGAAAAAATTAGGATTGTTTCATTTACTAGTGAATATGATGTGACTGGTCAACTAGTTAAACACGAAGTGACATGTAACGATATTGGAGCAGTCAAGAAGTTATCAGCAAGTTACAACTTAGCTAAAGAACAAGCTCAAAATGCGTCAGATTCAGTCGCTAAAGCTGTAGAAATGGCTAATAAAGCGCTAGTTTCTGCAGATGGTAAAAGTACTGTTTATTTTGGTAATGAATTTCCAAAAGATGAGCCAAAAGGTACATTACATAAAGGTGACTCACTTTATTTGACAGTCGGCGACACAACGAAAATGTATTACTGGACTGGATCAGATTGGGAAGAGCTACCCATCGTTAATGATGTTGAAGCGTTCAAGGAACAGATAGCTGAGGAACTAAAAGAAGTTCCAGACCGTGAAGAATTCGAAGCGACTATTGCGCAAGAACTCGCCACGTCTAAAGCAGAACTTGAAACGCAGATTGACACAGCTAAAACGCAAGCAGAATCAAACGCCAAAGCATACGCTGATGAAATCAACCAGGCCACAGCAGAAGTTGCTGAACAAGCGAATACGACTGCTAACAGCTTGAAACCTGATTTAGCCAAAGTGCAGACTGATTTAACTGCCACAACGTCAACTGCAAATGCTGCTAAGACGTCAGCGAGTGAAGCCAAACAGCAACTCACCACAGTAGCTAACGATTTGAACACTGCTAAGCAAGACTTGCAAACACAAGCTAGTCAGTTGACTGCACAAGCTAGCGCACAGTCAGAATTGACTAAACGTGTAAGTAGCGTCGAAGAAACAGCGAATGGTACTAAGACAACTGTCAGCGAGTTAAGCAAGACAGTAGCTCAAAACGGCAAAGACATCACAAGTGTTACTGCACGAACCAAAACGGTCGAAGATGACTTAACAAGCACTAAAACGACATTGTCACAAGTTAAGACGACTGCGGACAGTACTAGTCAAAAAACAGCTACTTTAGAAACTGGGTTGAATGGACTTAATGCGAAGTTTGAAACTTTGAAAATCGGTAGTCGAAACTATTTCAAAAATTCAAAATCACGTAAATACTATATTAATAGTACAGAAACACAAGACGTCAGAACTTATATTGGTGATGAATTTTGGCAAAATGATACTCGTTTTACTAAAAACTACGTGAGAATGTCTTTTGATATTGCTTTCAATCCAGCTTTGCCATCAAATTTCACAACGAATGTGCATTTTAGTGCTAGCCCTTGGTATAACTGCGGTGGCATTACATTCAAAGGTGGCACAACTGCTTTACAACACTTTGATTTGAAGTTTGATTTGAGTGGTGCTAGCAAGAGCTATAAAACGGATAATGTATTTATTCGTTTAAATAATACACTTCCACTTAATACAGCTGTAAGTCTTGAAAACTTTAATCTCTACCTATCTGCGGTAGTTGAAGACTATAACCAAAATGAAGCCGACATTGAATCGAAAGTCGCTGAGTACAAGCAAACAGCAGACCAGAACTACGCTAGCTTGCAATCAACAGTTCAAACATTAGACGGTACGGTTAAGCAGAATAAGTCAGAGTTCGACCAAACAGCAAGTCAGATTAAAAGTAGTATTTCAGCAGTCGAGGGTAAGATACCAACCGAAATAGGGTCATCTAACTTATTGCGAAACACTGCGGTAAATGCTGATAACTTAAAACTTTTTGGAGCAGCTAACTCAACAGTTAGCATTGCCACAAAAGATGGACATCAGACGTATAAAATCGTAGTGTCAGCTACTAACAATTCTGGTGCGCTCTTCAACGGTAACGCTCAATACTACAATTTAATCAAAGACAGGTATTACACATTCAGTTTTTGGGTTTTGGCTAATAAAGATAAGAGTTATAATTTTAATGGTTTAGGTCACGTTCAAACGATTAATAACAACAGTGATAAAGTCGGAAATGATAGCGTGCATCAGCATACGTCGCCTGTTTACAGCACTAGTGTTGTAAAGGCAAATACATGGACAAAAGTTTGGTGTACGTTTAAGGCCACATCAAATAGTTACTTTAAACCGTATTTCTGGTATCTAACGGCTGGGGATGAAATTTACATCTATGACATGATATTAAATGAAGGAAAGATTCCTCTAAGTTATACGCCAGCAATTGAGGACACCGAATCAGATATTAGTAAGCTAAACACAACACTAACTCAAACTGCAAATGGTCTTGAACAGCTAAGTACGCAAGTAACGTCACAAGGAAACACAATTACATCACACACTAACTCGATTAATTCATTATCAACTGGTTTAAGTGCCAAAGTCTCACAGACCGATTTCAATACGCTGTCTGGTCGTGTGACAACTGCTGAAAACAACATTACAGCTAAAGCTAACGAATTAAGCAGTAAGATTAGTAGTGTTGAGGGTAAGATACCGACAAGAAATGATTTTAGAAACTTGTATATTATCGCGAATTCAAGCGCTGGTTATATTCAAGCGAATAATGCGAGTGTTTTAGGTACGCAAGATAGTGTGTTTAAAGAATGGACTTCTGATTACATTCCTGTTAGTGCAGGCGAAAAGTATACTTTTCAAACGTGGGTGACGTTGACCGGAAGTCAGCAAGGCTGGCGAGCATGGCAATTTTATAATGAAGATAAATCATTGAACGGTGGCCGCTGGGCAGCTACCTATTCAAGCGACCAGCAGGCGCAACACGTTATTACAGTACCGGCAAACGCAAAATACTTGCGTGTTTCAGCAAGGCTTTATAGCGATGGAAAAATTATGGTTGAAAAAGGTGATACCTACCAAAATTATGCGTTAGCACCCGAAGACTACGATAGCAAGCTAGCCAGCGCCCAATCTGAAATCAAACAGACGACTGATTCAATCAAAGCTAGCGTGTCTGCGTTGGATAAATCGACGGTTAAGAGTGCTAGTTTAACCATTAACACAGACGGAATCGTCATGAAGGCTGGTAAGTCAACGACTGATGTCGCTAATGCGATTGGTTCTTATTTTGCTGTTAATCAGAACGCTATTAATCTGTTTTCTGACAAGATTAACGTAAAAGCGAATATGATTGTTGACGGTGCTATCACAAGCGCTAAGATTGCCAGTAAGTCAATCAACACAGCACATTTGAACGGTAAAATCATTACTGCTGATGTGATTTCAAGCAATGCCATTACAAGTGATGCCATTAAAGCAGGAGCTGTAACGACCGATAAAATGACAGCCAACAGTATCAATGGTGACCGCATTACAGCAGGCACATTAGACGCTGCAAAAATCAAGGCTGGTAGTATTACAGCTAGTCAGATTGCTAGTGGCACGATTACAAGTAGTCAAATCAAGTCAGGGACGATTAGCGCAGCGAATATTGCTACAGGTGCAGTAACCACTGATAAGATTGCAGCGAATAGTATCAATTCAGATAAAATTGTATCAAGTGGTATTACAGCGAACGTTATCAAAGGTGGTAAATTACAATCACTATCTAATGCAACTAATTTTGAACTTGATACTGGTAAACTTTTCTACAATAACAACAATACTGGTATTTTTCGAGTCCAGGACAACGCCAGCACAATGGGACTTAAATTTTCAAATACTAGTATTACAGTTAGTGGAACTAGCAGAATCTTATCACGAGTTATCTTAGGTGGTGACCGTCGCGAAACAACACTTGATGATGGCAAATGGGACCAAGGTGGATTTTCAGGAATTGTAGTCGAAACCATTAATGGCGTTGCTGCAAATGACCATGAAAGAGCAGATTCTTTGCGTGTAATTGCCGATAACATTTATTTTGGACACAGTTATAACAAAGACGTTGCAACCAACACATCTGCTGCAGGTTGGAAAATGGAAACATACAGCCCTAATTCTACCTATACAGGACATGTTGTCATGAAACCCTTTGGGATTAATTCACGATACGCAGATATTGTAACAGGTGATGTTCGACTTGATAACGGAGATGGTTCTGGTTACTGGGTTCGTGGTTGTATTCAAGTTTTGAGAAATTGTTTCCAACATTTCTTAAACGGTGGAACATCAGATGATGCAAAAAATGCAATTAGAAACGCTTTAAGAGATATTTCAGGAGTTTAA

Genome Context

Tertiary structure

PDB ID

923406917cb80bd1879a930c3065495b808d6e663e7cf20632ec77c8eb674d0a

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7141

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence