Protein

View in Explore

Genbank accession

QBX22013.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,52

Protein sequence

MDIIIHDSKLKKVAYIDNELQDTLSFYDDKWSRYLDTASSTFEFTVYKKGIKSDSVKEKAYRTLTERSFVSFKYNKRTYLFNVMRTEETETTIRCYCENLNLELLNEMAGPFKATTEMSFVDYCNKFFLLVGGAITVGHNEIEDRERTLEWTGTDTKLKRLLSIANQFDAEIEFETVLDEDSSLKSFILHIYKENDDKNQGVGRKRDDVVLRYGHNVEGVTRTIDKTGIFNMITPIGKATVDVTTTKANSKYVAPQLGTVNYNGGSISNAGRTINKDLVNDILNLCVQHKLLPSGVFSQLYLESWWGNSPVARADNNWGGLTWTGSTTRPSGVKVTQGTARPANEGGYYMHFASVSDYMKDYTYLLAEQGIYKVKGANNIDDYTKGLFRVGGATYDYAAAGYAHYAPLMRSIRNGINSASNGAMDALDAQLKSAGTVGTAPVSQKADKVISALNALTAKKGQLIGSGQCYAVSAWYAMTLGGPWLGGGVTNGFKGLYPGGGSAAARIGEDYNWSQFGWKMVRPSQVSHLIPGSIANIKANFNGGFLNTTGWGHTVVIKAISGDTLTVLEQNFAGHQYVEERTYSASAYLSSIQTLCYPPEIVQGKRIDGTESSPVQSGNNEPKTISETQQQEKTVGIPKDLYREWKNEEGVVEFYLKNGSIYAPISKELYPSAFSGEEISDNWIRKNVEYETIDVEKLISYSLEDIRKNCYPSISYEVNGTDESLDMGDTVKIDDEEFPDGLVLSARVSEQHISFTKNGTNQTVFDNYKALKNKLSKDLIDRYEELAEQTKPYELRLITDKGTQFKNSTGLSVLTAELWKSNKQYDATFQFRNFDTLLASGLSYTADGSTIPIDKPFLVSVDAYIGNDLVATRQITFTNITDGTDGIGINSTSVTYGISTSASAQPTTWTETMPVATPEQYLWTRKITDYTDPTKPDTIELTYSYQGKNGSAGTSLKVLKTEYQAGTSGTVAPTGTWTTGLPVVPDGQFLWMRVTMSDNSTIIVPTKQGAKGADGVTYYPHTAWANSEDGKVDFSTTDSKGRRYKGDYSDTNVNGSTDPAKYKWVNMVGTVQVGGRNLLIGSSETYIYQGLSEFLRTADLAPVIDKYGLVQYTLSFDAKVAVAGNVQVYMQNGAGSRYSGLMAKIDMTTDWKRYSVTFTPTNSNLSLTQSFLAFFGTYDTGVIPNIKRIKVEQGNVATDYSEAPEDTQLKIDSKADQALTQEQLNALSEQSAIAKAELQAKASIDTLNQWITSYQNYVASNNADSQQAKADLIAWSQKVEALGTQMGEVKETKVFMDTYFSQSSEGLVIGQTDGTSNILIKEDRISMFSAGNEVMYISQGVLNINNGIFALSIQLGRFREEQYAGNKDINVIRYVGGV

Physico‐chemical properties

protein length:	1378 AA
molecular weight:	152150,21100 Da
isoelectric point:	5,23364
aromaticity:	0,10305
hydropathy:	-0,40406

Domains

Domains [InterPro]

DC_0558
ATT
1–405

DC_0558 G3DSA:3.90.1720.60 DC_0921

IPR010572
ENZ
145–254

IPR010572 IPR002901 IPR007921 G3DSA:2.60.120.260

G3DSA:1.10.530.10
RBD
275–411

G3DSA:1.10.530.10 IPR008979

IPR002901
ENZ
284–397

IPR002901

QBX22013.1

1 1378

Architecture

ATT

STR

ATT 1-411 | STR 412-1377 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0558	ATT	DC_0558	1	405	Novel HMM	DC_0558	N-terminal	Low	Positional only	70 proteins / 70 hits
IPR010572	ENZ	DC_0675	145	254	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
IPR002901	ENZ	DC_0048	266	403	InterPro cluster	Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase-like domain	Central	High	Text match	76 proteins / 112 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	275	411	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR002901	ENZ	DC_0048	284	397	InterPro cluster	Mannosyl-glycoprotein endo-beta-N-acetylglucosamidase-like domain	Central	High	Text match	76 proteins / 112 hits
G3DSA:3.90.1720.60	STR	G3DSA:3.90.1720.60	412	597	Merged direct domain	G3DSA:3.90.1720.60	Central	Low	Positional only	18 proteins / 18 hits
IPR007921	ENZ	DC_0404	444	599	InterPro cluster	CHAP domain	C-terminal	High	Text match	2 proteins / 2 hits
DC_0921	STR	DC_0921	600	1377	Novel HMM	DC_0921	Central	Low	Positional only	77 proteins / 77 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1109	1192	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	1111	1164	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QBX22013.1

1 1378

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	305	305	0,8924
Central domain	306	653	349	0,5086
C-terminal	654	1378	724	0,0397

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-305

Central
306-653

C-terminal
654-1378

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage Javan629 [NCBI]	2548288	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Streptococcus uberis C8329 [NCBI]	1450185	Bacillota > Bacilli > Lactobacillales > Streptococcaceae > Streptococcus > Streptococcus uberis

Coding sequence (CDS)

Genbank protein accession

QBX22013.1 [NCBI]

Genbank nucleotide accession

MK448822.1 [NCBI]

CDS location

range 30367 -> 34503
strand +

CDS

TTGGATATTATTATTCATGATTCTAAATTAAAAAAAGTTGCATACATTGATAACGAATTACAAGACACGCTTTCATTCTACGACGACAAGTGGTCACGTTATTTAGACACTGCATCATCGACATTTGAATTCACGGTTTATAAAAAAGGAATTAAATCAGATTCCGTTAAAGAAAAGGCCTATCGGACACTAACTGAGAGGTCTTTTGTTTCGTTTAAATACAATAAACGCACATACTTATTTAATGTCATGCGTACTGAAGAGACAGAAACAACGATCAGATGTTACTGCGAAAATCTCAATCTTGAATTGTTAAATGAGATGGCTGGACCTTTTAAGGCAACAACAGAAATGTCATTTGTCGACTACTGCAACAAGTTTTTCTTACTTGTTGGCGGTGCGATTACAGTTGGTCATAATGAAATTGAAGACAGAGAGAGAACTCTTGAATGGACTGGAACTGACACAAAACTAAAACGCTTGTTATCAATCGCAAATCAGTTTGACGCTGAGATTGAATTTGAGACAGTTTTGGACGAAGATTCCAGTCTGAAATCATTTATCTTGCACATCTACAAAGAAAATGACGACAAGAATCAAGGCGTAGGTCGCAAGCGTGATGATGTCGTTTTGCGATATGGGCATAATGTTGAAGGTGTGACACGCACAATTGATAAGACTGGTATTTTCAATATGATTACGCCAATTGGAAAGGCAACAGTTGATGTCACGACAACTAAGGCAAATTCTAAGTACGTTGCGCCACAATTGGGCACGGTTAATTATAATGGTGGTTCAATTTCGAACGCTGGACGGACGATTAACAAAGATTTAGTCAATGATATTTTAAATCTCTGTGTCCAACATAAATTATTGCCATCTGGTGTATTTTCTCAACTATATTTAGAATCTTGGTGGGGTAACTCTCCAGTAGCTCGTGCTGACAATAACTGGGGAGGTTTGACATGGACTGGTTCCACAACTAGACCATCTGGTGTTAAGGTTACACAAGGTACAGCTCGCCCTGCCAATGAGGGCGGTTATTATATGCACTTCGCAAGTGTGTCTGACTATATGAAAGACTACACTTACCTACTAGCGGAACAAGGTATTTATAAAGTCAAAGGTGCTAACAACATTGACGACTACACAAAAGGTTTATTCCGTGTCGGCGGTGCTACATATGATTATGCAGCCGCAGGGTATGCACACTACGCACCATTAATGCGATCAATCAGAAATGGTATCAACAGCGCTTCAAACGGCGCAATGGATGCACTAGACGCTCAATTAAAATCAGCTGGAACAGTTGGAACTGCACCAGTTAGTCAAAAGGCAGATAAGGTTATTTCTGCATTAAATGCCTTAACTGCAAAAAAAGGCCAACTCATCGGTTCAGGTCAATGTTACGCAGTGTCTGCGTGGTATGCAATGACGCTCGGCGGTCCATGGCTCGGTGGTGGAGTAACAAATGGATTTAAAGGATTATATCCCGGTGGTGGTTCTGCGGCAGCTCGAATCGGAGAAGATTATAACTGGTCTCAATTCGGTTGGAAAATGGTTAGACCATCGCAAGTAAGCCATCTAATTCCCGGCTCAATTGCTAACATTAAAGCTAATTTTAACGGTGGATTTTTAAATACGACCGGTTGGGGTCATACAGTTGTTATTAAGGCGATTTCGGGCGATACTCTAACCGTATTAGAGCAAAATTTCGCAGGACATCAATACGTTGAAGAGCGTACTTATTCCGCTAGTGCTTATTTAAGCTCTATTCAAACTCTATGTTATCCACCTGAAATTGTTCAAGGCAAACGTATTGACGGTACAGAAAGCTCACCAGTGCAATCTGGGAACAACGAGCCTAAAACGATATCCGAAACACAACAACAAGAAAAAACAGTAGGAATCCCAAAGGATTTATATCGTGAGTGGAAAAATGAAGAAGGCGTAGTTGAGTTTTATCTGAAAAACGGTTCAATCTATGCACCAATCTCAAAAGAGCTTTATCCGTCCGCATTTTCTGGGGAAGAAATTTCTGATAACTGGATTAGAAAAAATGTTGAATATGAAACAATTGATGTTGAAAAATTGATTTCGTACTCACTTGAAGACATTAGGAAAAATTGTTATCCGTCAATTTCTTACGAGGTTAATGGAACAGATGAAAGTCTTGATATGGGCGACACTGTTAAAATTGATGATGAGGAATTTCCTGACGGTCTCGTATTATCTGCAAGAGTATCTGAGCAACATATTTCATTTACTAAAAACGGAACTAATCAGACTGTATTTGACAACTATAAAGCTTTAAAAAACAAACTAAGTAAAGATTTGATTGATCGCTACGAAGAATTAGCAGAACAAACTAAACCGTATGAATTGCGATTAATTACAGATAAAGGCACTCAATTTAAAAACTCAACTGGTTTATCCGTTCTAACTGCAGAGCTGTGGAAGTCTAACAAGCAGTATGATGCCACATTCCAATTTAGGAATTTTGACACTTTACTTGCTAGCGGTTTGTCTTATACCGCTGACGGTTCGACAATTCCAATTGATAAGCCGTTTTTGGTTTCGGTCGATGCTTATATCGGAAATGACTTAGTTGCTACAAGACAAATAACATTTACTAATATCACGGATGGTACGGATGGAATTGGTATTAACTCAACATCTGTTACTTATGGCATATCCACATCAGCATCAGCCCAACCTACAACTTGGACAGAAACAATGCCGGTTGCCACTCCTGAACAATATCTGTGGACACGTAAAATCACAGATTACACTGATCCGACCAAACCAGATACCATTGAATTGACTTACAGCTATCAGGGAAAAAATGGTAGTGCTGGAACATCACTTAAAGTCTTAAAAACTGAATATCAAGCAGGGACATCAGGTACTGTTGCACCAACAGGGACATGGACAACTGGTCTGCCAGTAGTTCCTGATGGCCAATTTCTGTGGATGCGTGTGACAATGTCAGACAACAGCACGATTATTGTGCCGACAAAACAAGGTGCAAAAGGCGCTGACGGTGTTACTTACTATCCACATACCGCTTGGGCTAACAGCGAGGATGGCAAAGTAGACTTTAGCACGACAGACTCAAAAGGTAGACGGTATAAAGGTGATTACTCAGATACTAATGTCAATGGTAGCACTGACCCTGCTAAGTATAAATGGGTAAATATGGTCGGGACTGTACAGGTTGGTGGCAGAAACCTATTGATAGGCTCATCGGAAACTTATATATACCAAGGATTGAGTGAATTTCTTAGAACAGCTGACTTAGCACCTGTAATTGATAAATACGGGTTGGTGCAATACACACTTAGTTTTGATGCTAAAGTTGCAGTAGCTGGTAATGTGCAAGTATATATGCAGAATGGTGCAGGTAGTCGTTATTCCGGTCTAATGGCAAAAATAGATATGACAACTGATTGGAAACGCTATTCTGTAACATTTACACCCACAAATTCCAATTTATCACTTACACAAAGCTTTCTAGCTTTTTTTGGCACATATGACACAGGAGTAATTCCAAACATTAAAAGAATTAAAGTTGAGCAAGGTAATGTTGCGACAGATTATTCAGAGGCCCCTGAAGACACTCAACTCAAGATTGACAGCAAAGCGGACCAAGCTTTGACGCAAGAACAATTAAACGCATTGTCCGAACAGTCTGCAATTGCAAAAGCGGAATTACAAGCAAAAGCTAGTATCGACACACTCAATCAGTGGATAACATCTTATCAAAATTATGTTGCATCAAATAATGCTGACTCTCAACAAGCGAAGGCTGATTTAATTGCTTGGTCTCAAAAGGTTGAGGCGCTCGGAACTCAAATGGGTGAAGTCAAAGAGACTAAGGTTTTTATGGACACTTACTTCTCACAATCAAGCGAAGGTCTGGTCATTGGTCAGACAGACGGAACAAGTAACATTCTAATTAAAGAAGACCGCATTTCGATGTTTTCGGCTGGTAATGAAGTGATGTACATTTCGCAAGGTGTGCTTAATATCAACAATGGTATTTTCGCACTAAGTATCCAGCTTGGACGATTTAGAGAAGAGCAGTACGCAGGCAATAAAGATATTAACGTTATTCGATATGTAGGAGGTGTGTAG

Genome Context

Tertiary structure

PDB ID

1884d852f5a4a8e537e446bb8711d81fef035ee65b5e5c1a9cacb15aa12b2f81

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7451

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence