Protein

View in Explore

Genbank accession

YP_001469060.1 [GenBank]

Protein name

virion structural protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,83

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MAKNNYKPSREDKFNRARNDYNYGNGFNSRGLAPAYLGADSLPQAVSDVHWSEHGLAKRIDDLELEVNDININISNDQINEDQVINDIGQLTIGGGESLTNYSGYLTKVLTTRPRIFADSFEDETYMQANDRLRGFTTNYQWIAYNEDSINSKGKLDKLIDYTFITDTHVEDKSNSRYVYKGQIRLPQLGTMKRIFVTQIGNNIVVRYLLSSTIPNGDVVGYTGTIVREEYDFKGNQVSKANESIAHTPLILLGAFNADSNDDSDYIQYISTDYKLIQNYDSNDLIIGPLPSDVIDMIDPVNELVSDSKVAYIMTYDNKGHLKFPLKGFTLLDVIKDDIYKKSETDEDSDEPIIDKTGKASLVEGKEYANLHRKFATVEFTFDSELMKKFVSITPRVSTKRLKVDKFDQQMWNEGGFYTEVYDSEVDDTTKDYLYPAASHIFYMADSLAWPDTDWFADTMFEYHTDSPSPFSFFRERDYMEFSKITFNSGMRKIYPEIQQDFGIGDVPFTIDFDWSKATEEVTVHLVKPFKLMRYLREKGNNTLVGGKAVAVNTRLGYTVTQNSDAVIDAANTNILAVYNKLDFVMPVHKEAHNYVSLQPNYNSNAYLHQFVRYQVVSPMPNETTGKSIFDNADSVTRLTYFDTRGSQTIDLTSLTGAFINNSNFDEQFGDIVGSANAVSPGSTNDFLYNLTNSRFIFTSNDKYKDLPFMYTSEGAYGSTLNHTFMLTNNQDSKGMTQILCVTESNADNVVSSLMFRRTVRKSGNAVSGVSAWLGSGHVQWVQESGLTTPPSGKTGKDIFQVMNTTGIYHLAEEVTPVTAFPNTSPSTGNTNIGDWAGQYVGTAQPKHAVFANAKDVRFEVYNAKDGLRHVMLTVTDALGKSMTYHNVAKATGKTSDGVNLDATVDNTSGGYTYVLDKWLPGAYVGDNDNPLPPDLNVGDKDNWGEIALSELIRSRKPEGYDSAYPDLPARLDQQIGKTTDFRSFEQDKSFMTRVYNESAERGVNVKWFGAKGDGIANDTNSIQNAINHVNSIGGGTVLIPIGTYLHDGLISYTGVSIIGESWKNTLLKNISIDTDSISIQGSGYLWPEQYKIANLHLTSDIVVKDMRKGINNYINRFFRYENLKITNHGTGLYERGSWYSEHIGINISNCDIGIMIPAYSIPGTPNSFTDCSIISCRIGLLVEPGVDTIVWRGGHIGGCSEKAIYLDSTKSYNMRNLSFDSVNIEGNLGSEDVTIGYASGDKTNGYIHNVIFTNCRFAQWNVIPNKVGVAINYGSEIITLINCYFIGYTTCVVDTSTFANGQTLIENCGMTNSSNGFNLRGNIGEFSSINGHYRKKYFSYPTAIENISSILTVHDNSAILFAEKNGNNVKIGLSITSEIPAFSDLVIFSNNAYMRALDVVLPGGQYPLSSYFASKRIKNRTKLPSETYLLIDYFVN

Physico‐chemical properties

protein length:	1437 AA
molecular weight:	160381,10540 Da
isoelectric point:	5,14520
aromaticity:	0,11134
hydropathy:	-0,37307

Domains

Domains [InterPro]

Coil
Unmapped
60–80

Coil IPR012334

IPR011050
STR
1000–1325

IPR011050

IPR024535
ENZ
1004–1073

IPR024535

YP_001469060.1

1 1437

Architecture

STR

STR 989-1340 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
Coil	Unmapped	-	60	80	Coils	Coil	-	-	-	-
IPR012334	STR	IPR012334	989	1340	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	1000	1325	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR024535	ENZ	DC_0410	1004	1073	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_001469060.1

1 1437

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	138	138	0,9418
Central domain	139	604	467	0,6564
C-terminal	605	1437	832	0,1311

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-138

Central
139-604

C-terminal
605-1437

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Lactococcus phage KSY1 [NCBI]	2913972	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Lactococcus lactis [NCBI]	1358	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

YP_001469060.1 [NCBI]

Genbank nucleotide accession

NC_009817.1 [NCBI]

CDS location

range 37205 -> 41518
strand +

CDS

ATGGCTAAAAACAACTATAAACCTTCTAGAGAAGATAAGTTTAATAGAGCAAGAAATGACTATAACTATGGAAATGGTTTTAATTCTAGAGGATTGGCTCCAGCCTACTTAGGTGCTGACAGTTTACCTCAAGCAGTATCTGATGTCCACTGGTCTGAACATGGCTTAGCTAAACGTATTGATGATCTAGAACTTGAAGTAAATGATATTAATATCAACATTAGTAATGACCAAATTAATGAAGATCAAGTAATCAATGACATTGGTCAACTTACTATTGGTGGTGGAGAAAGTCTTACTAACTACTCTGGCTACTTAACAAAAGTACTAACTACTCGTCCTCGTATCTTTGCTGATAGCTTTGAAGATGAAACATATATGCAAGCTAATGATAGACTTCGTGGGTTTACTACAAACTATCAATGGATTGCTTACAATGAAGACAGCATCAATAGTAAAGGTAAACTTGACAAGCTAATTGACTATACTTTCATTACTGATACTCATGTAGAAGACAAAAGTAATTCTCGTTATGTATATAAAGGTCAAATCAGACTTCCACAACTTGGAACAATGAAACGTATCTTTGTTACACAAATTGGAAACAACATTGTTGTACGTTACTTATTATCAAGCACAATTCCTAATGGAGATGTTGTAGGATATACAGGTACAATTGTACGTGAAGAATATGACTTCAAAGGGAATCAAGTATCTAAAGCTAATGAGTCTATTGCTCATACTCCTTTAATTTTACTTGGTGCATTTAATGCAGATTCAAACGACGATTCAGACTATATTCAATATATTTCTACAGACTACAAACTCATTCAAAACTATGATAGTAATGACTTAATCATTGGCCCATTGCCTTCTGATGTTATTGACATGATTGACCCAGTTAATGAATTGGTATCTGACTCTAAAGTAGCATACATAATGACGTATGATAATAAAGGTCATTTAAAATTCCCACTTAAAGGTTTCACTCTTCTTGACGTTATCAAAGATGACATCTATAAAAAATCTGAAACTGACGAAGATTCTGATGAACCTATCATTGACAAAACAGGTAAAGCATCATTAGTAGAAGGCAAAGAGTATGCTAATCTTCATCGTAAGTTTGCTACTGTTGAGTTCACATTTGATTCTGAGCTTATGAAGAAATTTGTAAGCATCACTCCTCGTGTATCAACTAAACGTCTTAAAGTAGATAAGTTTGACCAACAAATGTGGAATGAAGGTGGGTTCTATACTGAAGTATATGATTCTGAAGTAGATGATACTACTAAAGATTATTTATACCCAGCAGCTTCTCACATCTTCTACATGGCTGATAGCTTGGCATGGCCTGATACTGATTGGTTTGCAGACACAATGTTTGAATACCACACAGATTCACCATCTCCATTCTCGTTCTTCCGTGAACGTGACTATATGGAATTTTCAAAGATTACTTTCAACTCTGGTATGCGTAAAATCTATCCAGAAATTCAACAAGACTTTGGAATTGGTGACGTGCCATTTACTATTGATTTTGACTGGTCTAAAGCAACAGAAGAAGTTACTGTTCACTTAGTAAAACCTTTCAAACTTATGCGTTATTTGCGTGAAAAGGGAAATAATACATTAGTTGGAGGTAAAGCAGTAGCAGTAAATACTCGTCTTGGGTACACTGTAACTCAAAACTCTGATGCTGTAATTGATGCTGCTAATACTAACATCTTGGCAGTCTACAATAAATTGGACTTTGTAATGCCTGTACATAAAGAAGCACATAACTATGTATCATTACAACCTAACTACAACAGCAATGCTTACTTACATCAGTTCGTAAGATATCAAGTTGTATCTCCAATGCCAAATGAAACTACAGGAAAATCTATCTTTGACAATGCTGACTCAGTAACTCGTCTTACATATTTTGATACTCGTGGTTCTCAAACAATTGACTTAACAAGTCTTACTGGTGCATTTATAAACAACAGTAACTTCGATGAACAGTTTGGAGATATTGTAGGTTCAGCTAATGCAGTGTCACCAGGAAGTACTAATGACTTCTTGTACAACTTGACTAACTCTCGTTTCATCTTTACTTCAAATGATAAATACAAAGATCTACCATTTATGTACACAAGTGAAGGAGCTTATGGTAGTACTTTGAACCATACTTTCATGTTGACTAATAATCAAGATAGTAAAGGTATGACTCAAATTCTTTGTGTAACAGAATCTAATGCAGACAATGTAGTATCAAGTTTGATGTTTAGACGTACAGTAAGAAAGTCAGGTAATGCTGTATCTGGAGTATCTGCATGGTTAGGTTCTGGTCACGTTCAATGGGTTCAAGAGTCTGGACTTACTACTCCTCCTTCTGGTAAAACAGGAAAAGACATCTTCCAAGTAATGAATACTACTGGTATCTATCACTTGGCTGAAGAAGTAACTCCTGTCACAGCATTCCCTAATACATCTCCTTCGACAGGCAACACTAACATTGGTGATTGGGCTGGACAATATGTAGGAACTGCTCAACCTAAGCATGCAGTATTTGCAAATGCTAAAGATGTAAGATTTGAAGTATACAATGCTAAGGATGGCTTACGCCATGTTATGCTTACAGTAACTGATGCATTAGGTAAGTCTATGACTTATCATAATGTGGCTAAAGCTACAGGTAAAACATCTGATGGTGTCAACCTTGATGCAACTGTAGACAATACTTCAGGTGGCTATACTTATGTATTAGACAAATGGTTGCCAGGAGCATATGTTGGTGATAATGACAACCCATTACCACCAGACCTTAATGTTGGAGACAAGGATAACTGGGGCGAAATCGCGTTATCTGAATTGATACGGTCACGGAAACCAGAGGGGTATGATTCGGCGTATCCAGACCTGCCGGCTAGGCTAGATCAACAAATCGGTAAAACCACTGATTTTAGGTCTTTTGAACAGGACAAATCGTTTATGACTAGGGTTTATAATGAATCAGCAGAACGAGGAGTGAATGTCAAATGGTTTGGAGCTAAAGGAGACGGAATAGCTAATGATACTAATTCTATACAAAATGCTATAAATCACGTAAACTCAATTGGCGGTGGGACTGTACTTATACCAATAGGCACGTACCTACATGATGGGTTGATTTCTTATACCGGCGTTTCTATTATTGGCGAAAGTTGGAAGAACACCTTACTCAAAAATATTAGCATAGATACGGATAGTATTTCTATTCAAGGGTCTGGGTATTTGTGGCCGGAACAATACAAGATAGCTAACCTACACCTTACATCTGACATTGTCGTAAAAGATATGCGTAAGGGTATAAACAACTATATAAACAGATTTTTCCGATATGAAAATCTTAAAATAACCAATCATGGTACTGGATTATATGAAAGAGGTTCGTGGTATTCAGAACACATTGGTATAAACATCTCAAATTGTGATATCGGTATAATGATTCCAGCATACTCTATCCCCGGAACGCCTAACAGTTTTACAGATTGCTCTATAATTTCTTGTCGTATAGGATTGTTAGTCGAACCAGGCGTGGATACCATTGTGTGGAGAGGTGGTCATATAGGCGGATGCTCTGAAAAAGCAATTTACTTAGATAGTACCAAAAGTTATAATATGCGAAATCTCTCATTTGATTCGGTTAATATAGAAGGTAACTTAGGTTCGGAAGATGTTACGATCGGTTACGCTTCAGGTGATAAAACTAATGGCTATATTCATAACGTCATTTTTACTAACTGTCGTTTTGCTCAATGGAATGTTATACCAAATAAAGTAGGAGTGGCGATAAATTATGGTTCTGAAATTATCACTCTGATAAATTGTTACTTTATCGGTTATACAACTTGTGTTGTTGACACCTCTACATTTGCAAATGGTCAAACGCTGATTGAAAACTGTGGTATGACTAACTCATCGAACGGGTTTAATCTTAGAGGTAACATCGGGGAATTTTCTTCTATAAACGGGCATTACCGGAAAAAGTATTTTTCATATCCAACGGCAATAGAAAATATTTCAAGTATTCTTACAGTTCACGACAATTCAGCGATACTGTTTGCGGAAAAAAATGGTAATAATGTTAAAATCGGTTTGAGTATTACCTCAGAAATTCCAGCATTTTCTGACCTTGTTATTTTTTCTAATAATGCTTACATGAGAGCATTGGATGTAGTTTTACCAGGTGGACAATATCCTTTATCTTCTTATTTTGCCTCCAAAAGAATAAAAAACAGAACTAAACTTCCGTCAGAAACATACTTGCTCATTGATTATTTTGTTAATTGA

Genome Context

Tertiary structure

PDB ID

d8b979836bfdd9e78e2f74d3ce1eef02998aa62ee622097a0543829bcb28599e

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,3780

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence