Protein

View in Explore

Genbank accession

WCZ54865.1 [GenBank]

Protein name

tail protein

RBP type

Evidence RBPdetect2

Probability 0,94

Protein sequence

MQYPVDGIRASLIAKNRILKVDAGHKLKDQRFVIKRINRIMGNDGLSYSIYAEHISYITADYALKPNLTVNGSGNVAMTQWLNGIIDSNRIHVDSDITTENTTSWTIDKVQNARQALGGVQGSILDVWGGEYRFDNLNISLLRHRGTVSNTLLSYGRNITDFDQEENITNTYTSIYPFASYSVQNGDTSEQKILTIPDLVVDSEYVNNFPNRKIQVVDFSDKFSTDEKPTVERLAEFAKSYIKSNNVGVPTVSTKISFVDLSKTENYKEFAPLEELDLCDEVPFAFEKFGIKTTAKISRIVWNVLLDSYDSLELGELKTNLSDVINNTNNAALDAKDAANDAKNSADNAALSANGKNRNWYGADDPTFGHLSELREGDSWYMPNGEDTELYHWINGQWVFILSTKDAHDAADAADKASKEAEEAKKTANKAVDGANDAVAKAGFANDTATQAKSDAAAATQNATTALTNAGTALTNAKNALDNVTKLDQTVKTEVTNINGQLAQKVSQTTFDTLKGTVTSQGTLINQNKDAIKLKADQTYVDTIKGTVANNTAAIDLNSKEIKLKASQSDVDKLGGRVTNAEAQIKLQADQIKLTVSKTELTNVLGDYATQTWTQSQIKSTADQINLSVEQSITTSENTLNNNIANATNDMATKTWTKGQLDLTDSSLTSQISSVKDGLTTQYTQLQQTLNGVQVTANNAVTQTQYTQLSDQFTTTIANVGNGGTNLLYDGGFESGKLNGLPEFYNNSLGNRPLPRGNYAVYLYAMPAEVNDDKVWYWSLPNPIVIKANQYYVISYDYSAAGSATTASDYAVDNAGNIIFGIMMEHTAHDMSDQSAWKRYKKVFRLSTDTTITKLRFGWVANSLSGGWKVIDNVQIEDGSIAHPYSPSQNDLATSSQFTQLQNDINLRVKAGDVVNQINISPESILIDGKKVHITGQTSIDNAVIKDAMIADIKADKITAGTLNAANVNVINLNADNITTGTLKGANLSLNLNTGEVVFQKGSIKSTNGNLNIDISKGTMAVINQYKSGFYFEDGKLVLNDGWLEGTSNQPKYGSLEYNANFFTVNGLAVKGTEGVTIGTPGYNPLAMFSSVKESGIAIDKKHLEIGSVGPTIISSGNEFFMNLWTQPPFIAVGTTADGNHMTTSDPGSRISLYAEYVHIKSAYSKTASGSANVIVSEDGALVRSTSASKYKTDIVRTNISNYGEKLLELPTATWTDIAETKRYRDDPVNQIKPTRNFGMIAEDLAEAGLEMLVVRGTDGELEGINYDRIGPALIPVIAKLKNEVETLKQQLEEKTA

Physico‐chemical properties

protein length:	1297 AA
molecular weight:	141294,57050 Da
isoelectric point:	5,04426
aromaticity:	0,07556
hydropathy:	-0,38921

Domains

Domains [InterPro]

DC_1571
ATT
1–325

DC_1571 Coil DC_0469

IPR007119
Unmapped
5–315

IPR007119 IPR012892 IPR030392

IPR010572
ENZ
100–325

IPR010572

DC_1613
STR
257–637

DC_1613

WCZ54865.1

1 1297

Architecture

ATT

STR

RBD

CHP

ATT 1-325 | STR 326-637 | RBD 743-1274 | CHP 1275-1292 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1571	ATT	DC_1571	1	325	Novel HMM	DC_1571	N-terminal	Low	Positional only	29 proteins / 29 hits
IPR007119	Unmapped	-	5	315	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
IPR010572	ENZ	DC_0675	100	325	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
DC_1613	STR	DC_1613	257	637	Novel HMM	DC_1613	Central	Low	Positional only	14 proteins / 14 hits
Coil	Unmapped	-	407	438	Coils	Coil	-	-	-	-
DC_0469	RBD	DC_0469	743	1274	Novel HMM	DC_0469	C-terminal	Low	Positional only	48 proteins / 48 hits
IPR012892	RBD	DC_0453	905	1041	InterPro cluster	Gp58-like	C-terminal	Low	Positional only	116 proteins / 119 hits
IPR030392	CHP	DC_0088	1187	1292	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Latilactobacillus phage TMW 1.706 P1 [NCBI]	3027591	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Latilactobacillus curvatus [NCBI]	28038	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

WCZ54865.1 [NCBI]

Genbank nucleotide accession

OQ240253 [NCBI]

CDS location

range 21412 -> 25305
strand -

CDS

ATGCAATATCCGGTTGATGGGATTCGGGCTAGTTTAATCGCTAAGAATCGTATTCTTAAAGTAGATGCTGGACATAAATTAAAGGACCAGCGCTTTGTAATCAAGCGGATTAATCGCATCATGGGGAACGACGGATTATCTTACTCTATTTATGCTGAACATATTAGTTATATAACTGCTGATTATGCCCTCAAACCAAATTTAACGGTTAATGGTAGCGGAAATGTAGCTATGACTCAATGGCTAAACGGCATCATAGACTCTAATAGAATTCACGTTGATAGTGATATCACCACCGAGAATACGACAAGTTGGACGATTGACAAGGTGCAGAATGCACGCCAAGCATTAGGCGGTGTTCAAGGTTCAATTCTTGACGTTTGGGGCGGCGAATATCGCTTTGACAATCTGAACATTAGTTTATTAAGACATCGTGGAACTGTTTCAAATACGCTGCTATCATATGGGCGTAATATTACAGATTTTGACCAAGAAGAGAATATTACAAACACTTATACTTCAATATATCCATTTGCTAGCTACTCCGTACAAAATGGCGACACTTCGGAGCAGAAGATTTTAACTATTCCCGATCTAGTTGTAGATTCCGAATATGTAAATAATTTTCCAAATCGAAAAATTCAAGTTGTAGATTTCAGCGATAAGTTTAGTACCGATGAAAAGCCCACTGTTGAACGCTTAGCAGAATTTGCTAAAAGCTATATCAAAAGCAATAACGTAGGTGTACCGACTGTTTCTACTAAAATTAGTTTTGTTGACTTATCTAAAACTGAAAATTATAAAGAATTTGCACCGCTAGAAGAGCTCGATTTATGCGATGAAGTTCCTTTCGCTTTTGAAAAATTTGGGATAAAAACAACTGCTAAAATTAGTAGAATTGTGTGGAATGTTTTACTTGATAGCTACGATTCATTAGAACTAGGCGAGTTAAAGACGAATTTAAGCGATGTTATTAATAACACTAATAATGCTGCTCTTGATGCAAAAGATGCCGCTAATGATGCAAAAAACAGCGCAGACAATGCAGCATTATCTGCCAATGGGAAAAATAGAAATTGGTACGGGGCAGATGACCCGACTTTTGGTCATCTTAGTGAACTTCGCGAGGGTGATTCCTGGTATATGCCTAACGGCGAAGATACCGAACTATATCATTGGATTAACGGCCAGTGGGTCTTTATTTTGTCGACCAAGGATGCCCATGACGCGGCAGACGCAGCGGACAAAGCATCAAAAGAAGCCGAAGAAGCCAAAAAAACGGCTAACAAGGCAGTAGATGGTGCCAATGACGCAGTAGCCAAAGCGGGATTTGCGAACGACACGGCGACACAAGCTAAATCAGATGCGGCGGCTGCCACTCAGAATGCAACGACAGCCCTAACTAATGCGGGCACAGCTTTAACCAATGCTAAAAATGCCTTGGATAACGTTACTAAGTTAGACCAAACGGTTAAAACCGAAGTCACTAACATTAATGGGCAGCTTGCACAAAAGGTTAGCCAGACTACGTTTGATACGTTAAAAGGCACTGTTACAAGCCAAGGTACACTTATCAATCAAAATAAAGATGCTATTAAATTAAAGGCTGATCAGACTTACGTCGACACGATTAAGGGTACGGTGGCAAATAATACTGCTGCCATTGACCTTAACAGCAAAGAAATCAAGCTAAAGGCTAGCCAATCAGACGTCGATAAGCTAGGCGGGCGAGTAACCAACGCGGAAGCTCAAATCAAACTGCAAGCTGACCAGATTAAGTTGACGGTAAGTAAGACAGAACTAACCAACGTTTTGGGCGACTATGCCACACAAACATGGACGCAGTCGCAGATTAAAAGCACTGCTGACCAGATTAATTTAAGTGTTGAGCAATCGATCACGACCTCAGAAAATACGTTAAATAATAACATTGCAAACGCCACAAACGATATGGCCACAAAAACGTGGACAAAAGGACAACTTGATTTAACGGATAGCAGCCTAACGAGCCAGATATCAAGTGTTAAAGATGGGTTAACAACCCAATATACTCAGTTACAGCAAACGCTAAATGGCGTGCAAGTGACGGCCAATAACGCGGTCACACAAACTCAATACACTCAACTGTCAGATCAATTTACGACAACAATCGCCAATGTGGGTAATGGAGGTACAAACCTTTTATACGATGGAGGGTTTGAGAGCGGCAAATTAAATGGTCTACCGGAATTTTATAATAATAGTCTCGGTAATCGGCCGTTACCACGAGGTAATTATGCTGTTTACTTATATGCTATGCCGGCTGAGGTCAATGACGATAAAGTATGGTATTGGTCATTGCCAAACCCGATTGTGATTAAAGCAAATCAATATTATGTTATCTCTTATGATTATTCTGCGGCAGGATCAGCGACAACTGCTAGTGATTATGCGGTCGATAATGCCGGTAACATAATTTTTGGTATTATGATGGAACATACCGCACATGACATGTCAGATCAGAGTGCCTGGAAACGGTATAAAAAGGTGTTTAGATTAAGCACTGATACCACAATTACAAAGTTGAGATTTGGTTGGGTTGCTAACAGCTTATCGGGAGGCTGGAAAGTAATAGACAATGTGCAGATTGAGGACGGTTCAATTGCACATCCGTATAGTCCATCGCAAAACGATTTAGCAACATCTAGTCAGTTTACTCAGCTCCAAAACGACATTAATCTCCGCGTTAAAGCGGGCGACGTAGTCAACCAAATTAACATCAGTCCAGAAAGCATTTTAATTGACGGCAAGAAGGTCCACATCACGGGGCAAACGTCAATTGATAACGCAGTGATTAAAGATGCCATGATTGCAGACATTAAAGCCGATAAGATTACCGCTGGGACGCTTAATGCTGCTAACGTGAATGTGATTAACCTTAATGCGGATAACATTACGACGGGGACTTTAAAGGGCGCTAATTTAAGCTTGAATCTTAATACCGGGGAAGTTGTATTCCAGAAAGGTTCGATTAAATCAACCAATGGCAATCTAAACATCGACATCAGCAAGGGTACAATGGCGGTTATCAACCAGTACAAAAGTGGTTTTTATTTTGAAGATGGCAAGCTTGTTTTAAATGACGGCTGGTTGGAAGGTACTTCGAACCAGCCTAAATATGGGTCGCTTGAATACAACGCCAATTTCTTCACTGTTAACGGCTTAGCTGTTAAAGGAACAGAAGGCGTGACGATTGGGACACCAGGTTACAATCCATTAGCAATGTTCTCGTCAGTTAAGGAATCCGGGATTGCAATTGACAAAAAACATCTAGAAATAGGAAGTGTTGGCCCAACAATAATTAGTTCTGGCAATGAATTCTTTATGAATTTATGGACACAGCCGCCTTTTATTGCCGTTGGGACAACAGCGGATGGTAATCATATGACTACTAGTGATCCTGGCTCTCGAATTTCTTTATACGCCGAGTATGTACACATTAAATCGGCATACTCAAAGACAGCCAGTGGTTCGGCGAATGTTATCGTTTCCGAAGATGGCGCGCTTGTCCGTTCCACGTCAGCCTCTAAATATAAAACCGATATTGTTCGAACTAACATCTCTAATTACGGAGAGAAGTTGCTAGAGTTGCCAACTGCGACATGGACTGATATTGCTGAAACTAAACGTTATCGAGATGATCCAGTTAATCAGATTAAACCGACGCGCAACTTCGGGATGATTGCCGAAGATTTGGCGGAAGCTGGGCTTGAAATGCTGGTTGTCCGCGGAACAGATGGCGAACTTGAAGGAATTAATTACGACCGTATCGGGCCAGCTTTAATCCCGGTAATTGCGAAACTTAAAAATGAAGTTGAAACACTAAAACAACAATTGGAGGAAAAAACAGCATGA

Genome Context

Tertiary structure

PDB ID

8fc3ab1c04b4d13f9a54bd6341add3f6264018e02facecde4540db9712bf33f8

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7555

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence