Protein
View in Explore- Genbank accession
- WCZ54865.1 [GenBank]
- Protein name
- tail protein
- RBP type
-
TF
- Protein sequence
-
MQYPVDGIRASLIAKNRILKVDAGHKLKDQRFVIKRINRIMGNDGLSYSIYAEHISYITADYALKPNLTVNGSGNVAMTQWLNGIIDSNRIHVDSDITTENTTSWTIDKVQNARQALGGVQGSILDVWGGEYRFDNLNISLLRHRGTVSNTLLSYGRNITDFDQEENITNTYTSIYPFASYSVQNGDTSEQKILTIPDLVVDSEYVNNFPNRKIQVVDFSDKFSTDEKPTVERLAEFAKSYIKSNNVGVPTVSTKISFVDLSKTENYKEFAPLEELDLCDEVPFAFEKFGIKTTAKISRIVWNVLLDSYDSLELGELKTNLSDVINNTNNAALDAKDAANDAKNSADNAALSANGKNRNWYGADDPTFGHLSELREGDSWYMPNGEDTELYHWINGQWVFILSTKDAHDAADAADKASKEAEEAKKTANKAVDGANDAVAKAGFANDTATQAKSDAAAATQNATTALTNAGTALTNAKNALDNVTKLDQTVKTEVTNINGQLAQKVSQTTFDTLKGTVTSQGTLINQNKDAIKLKADQTYVDTIKGTVANNTAAIDLNSKEIKLKASQSDVDKLGGRVTNAEAQIKLQADQIKLTVSKTELTNVLGDYATQTWTQSQIKSTADQINLSVEQSITTSENTLNNNIANATNDMATKTWTKGQLDLTDSSLTSQISSVKDGLTTQYTQLQQTLNGVQVTANNAVTQTQYTQLSDQFTTTIANVGNGGTNLLYDGGFESGKLNGLPEFYNNSLGNRPLPRGNYAVYLYAMPAEVNDDKVWYWSLPNPIVIKANQYYVISYDYSAAGSATTASDYAVDNAGNIIFGIMMEHTAHDMSDQSAWKRYKKVFRLSTDTTITKLRFGWVANSLSGGWKVIDNVQIEDGSIAHPYSPSQNDLATSSQFTQLQNDINLRVKAGDVVNQINISPESILIDGKKVHITGQTSIDNAVIKDAMIADIKADKITAGTLNAANVNVINLNADNITTGTLKGANLSLNLNTGEVVFQKGSIKSTNGNLNIDISKGTMAVINQYKSGFYFEDGKLVLNDGWLEGTSNQPKYGSLEYNANFFTVNGLAVKGTEGVTIGTPGYNPLAMFSSVKESGIAIDKKHLEIGSVGPTIISSGNEFFMNLWTQPPFIAVGTTADGNHMTTSDPGSRISLYAEYVHIKSAYSKTASGSANVIVSEDGALVRSTSASKYKTDIVRTNISNYGEKLLELPTATWTDIAETKRYRDDPVNQIKPTRNFGMIAEDLAEAGLEMLVVRGTDGELEGINYDRIGPALIPVIAKLKNEVETLKQQLEEKTA
- Physico‐chemical
properties -
protein length: 1297 AA molecular weight: 141294,57050 Da isoelectric point: 5,04426 aromaticity: 0,07556 hydropathy: -0,38921
Domains
Domains [InterPro]
DC_1571
ATT
1–325
ATT
1–325
IPR007119
Unmapped
5–315
Unmapped
5–315
IPR010572
ENZ
100–325
ENZ
100–325
DC_1613
STR
257–637
STR
257–637
1
1297
Architecture
ATT 1-325 | STR 326-637 | RBD 743-1274 | CHP 1275-1292 |
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Latilactobacillus phage TMW 1.706 P1 [NCBI] |
3027591 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host |
Latilactobacillus curvatus [NCBI] |
28038 | cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
WCZ54865.1
[NCBI]
Genbank nucleotide accession
OQ240253
[NCBI]
CDS location
range 21412 -> 25305
strand -
strand -
CDS
ATGCAATATCCGGTTGATGGGATTCGGGCTAGTTTAATCGCTAAGAATCGTATTCTTAAAGTAGATGCTGGACATAAATTAAAGGACCAGCGCTTTGTAATCAAGCGGATTAATCGCATCATGGGGAACGACGGATTATCTTACTCTATTTATGCTGAACATATTAGTTATATAACTGCTGATTATGCCCTCAAACCAAATTTAACGGTTAATGGTAGCGGAAATGTAGCTATGACTCAATGGCTAAACGGCATCATAGACTCTAATAGAATTCACGTTGATAGTGATATCACCACCGAGAATACGACAAGTTGGACGATTGACAAGGTGCAGAATGCACGCCAAGCATTAGGCGGTGTTCAAGGTTCAATTCTTGACGTTTGGGGCGGCGAATATCGCTTTGACAATCTGAACATTAGTTTATTAAGACATCGTGGAACTGTTTCAAATACGCTGCTATCATATGGGCGTAATATTACAGATTTTGACCAAGAAGAGAATATTACAAACACTTATACTTCAATATATCCATTTGCTAGCTACTCCGTACAAAATGGCGACACTTCGGAGCAGAAGATTTTAACTATTCCCGATCTAGTTGTAGATTCCGAATATGTAAATAATTTTCCAAATCGAAAAATTCAAGTTGTAGATTTCAGCGATAAGTTTAGTACCGATGAAAAGCCCACTGTTGAACGCTTAGCAGAATTTGCTAAAAGCTATATCAAAAGCAATAACGTAGGTGTACCGACTGTTTCTACTAAAATTAGTTTTGTTGACTTATCTAAAACTGAAAATTATAAAGAATTTGCACCGCTAGAAGAGCTCGATTTATGCGATGAAGTTCCTTTCGCTTTTGAAAAATTTGGGATAAAAACAACTGCTAAAATTAGTAGAATTGTGTGGAATGTTTTACTTGATAGCTACGATTCATTAGAACTAGGCGAGTTAAAGACGAATTTAAGCGATGTTATTAATAACACTAATAATGCTGCTCTTGATGCAAAAGATGCCGCTAATGATGCAAAAAACAGCGCAGACAATGCAGCATTATCTGCCAATGGGAAAAATAGAAATTGGTACGGGGCAGATGACCCGACTTTTGGTCATCTTAGTGAACTTCGCGAGGGTGATTCCTGGTATATGCCTAACGGCGAAGATACCGAACTATATCATTGGATTAACGGCCAGTGGGTCTTTATTTTGTCGACCAAGGATGCCCATGACGCGGCAGACGCAGCGGACAAAGCATCAAAAGAAGCCGAAGAAGCCAAAAAAACGGCTAACAAGGCAGTAGATGGTGCCAATGACGCAGTAGCCAAAGCGGGATTTGCGAACGACACGGCGACACAAGCTAAATCAGATGCGGCGGCTGCCACTCAGAATGCAACGACAGCCCTAACTAATGCGGGCACAGCTTTAACCAATGCTAAAAATGCCTTGGATAACGTTACTAAGTTAGACCAAACGGTTAAAACCGAAGTCACTAACATTAATGGGCAGCTTGCACAAAAGGTTAGCCAGACTACGTTTGATACGTTAAAAGGCACTGTTACAAGCCAAGGTACACTTATCAATCAAAATAAAGATGCTATTAAATTAAAGGCTGATCAGACTTACGTCGACACGATTAAGGGTACGGTGGCAAATAATACTGCTGCCATTGACCTTAACAGCAAAGAAATCAAGCTAAAGGCTAGCCAATCAGACGTCGATAAGCTAGGCGGGCGAGTAACCAACGCGGAAGCTCAAATCAAACTGCAAGCTGACCAGATTAAGTTGACGGTAAGTAAGACAGAACTAACCAACGTTTTGGGCGACTATGCCACACAAACATGGACGCAGTCGCAGATTAAAAGCACTGCTGACCAGATTAATTTAAGTGTTGAGCAATCGATCACGACCTCAGAAAATACGTTAAATAATAACATTGCAAACGCCACAAACGATATGGCCACAAAAACGTGGACAAAAGGACAACTTGATTTAACGGATAGCAGCCTAACGAGCCAGATATCAAGTGTTAAAGATGGGTTAACAACCCAATATACTCAGTTACAGCAAACGCTAAATGGCGTGCAAGTGACGGCCAATAACGCGGTCACACAAACTCAATACACTCAACTGTCAGATCAATTTACGACAACAATCGCCAATGTGGGTAATGGAGGTACAAACCTTTTATACGATGGAGGGTTTGAGAGCGGCAAATTAAATGGTCTACCGGAATTTTATAATAATAGTCTCGGTAATCGGCCGTTACCACGAGGTAATTATGCTGTTTACTTATATGCTATGCCGGCTGAGGTCAATGACGATAAAGTATGGTATTGGTCATTGCCAAACCCGATTGTGATTAAAGCAAATCAATATTATGTTATCTCTTATGATTATTCTGCGGCAGGATCAGCGACAACTGCTAGTGATTATGCGGTCGATAATGCCGGTAACATAATTTTTGGTATTATGATGGAACATACCGCACATGACATGTCAGATCAGAGTGCCTGGAAACGGTATAAAAAGGTGTTTAGATTAAGCACTGATACCACAATTACAAAGTTGAGATTTGGTTGGGTTGCTAACAGCTTATCGGGAGGCTGGAAAGTAATAGACAATGTGCAGATTGAGGACGGTTCAATTGCACATCCGTATAGTCCATCGCAAAACGATTTAGCAACATCTAGTCAGTTTACTCAGCTCCAAAACGACATTAATCTCCGCGTTAAAGCGGGCGACGTAGTCAACCAAATTAACATCAGTCCAGAAAGCATTTTAATTGACGGCAAGAAGGTCCACATCACGGGGCAAACGTCAATTGATAACGCAGTGATTAAAGATGCCATGATTGCAGACATTAAAGCCGATAAGATTACCGCTGGGACGCTTAATGCTGCTAACGTGAATGTGATTAACCTTAATGCGGATAACATTACGACGGGGACTTTAAAGGGCGCTAATTTAAGCTTGAATCTTAATACCGGGGAAGTTGTATTCCAGAAAGGTTCGATTAAATCAACCAATGGCAATCTAAACATCGACATCAGCAAGGGTACAATGGCGGTTATCAACCAGTACAAAAGTGGTTTTTATTTTGAAGATGGCAAGCTTGTTTTAAATGACGGCTGGTTGGAAGGTACTTCGAACCAGCCTAAATATGGGTCGCTTGAATACAACGCCAATTTCTTCACTGTTAACGGCTTAGCTGTTAAAGGAACAGAAGGCGTGACGATTGGGACACCAGGTTACAATCCATTAGCAATGTTCTCGTCAGTTAAGGAATCCGGGATTGCAATTGACAAAAAACATCTAGAAATAGGAAGTGTTGGCCCAACAATAATTAGTTCTGGCAATGAATTCTTTATGAATTTATGGACACAGCCGCCTTTTATTGCCGTTGGGACAACAGCGGATGGTAATCATATGACTACTAGTGATCCTGGCTCTCGAATTTCTTTATACGCCGAGTATGTACACATTAAATCGGCATACTCAAAGACAGCCAGTGGTTCGGCGAATGTTATCGTTTCCGAAGATGGCGCGCTTGTCCGTTCCACGTCAGCCTCTAAATATAAAACCGATATTGTTCGAACTAACATCTCTAATTACGGAGAGAAGTTGCTAGAGTTGCCAACTGCGACATGGACTGATATTGCTGAAACTAAACGTTATCGAGATGATCCAGTTAATCAGATTAAACCGACGCGCAACTTCGGGATGATTGCCGAAGATTTGGCGGAAGCTGGGCTTGAAATGCTGGTTGTCCGCGGAACAGATGGCGAACTTGAAGGAATTAATTACGACCGTATCGGGCCAGCTTTAATCCCGGTAATTGCGAAACTTAAAAATGAAGTTGAAACACTAAAACAACAATTGGAGGAAAAAACAGCATGA
Genome Context
Genome Context
Tertiary structure
PDB ID
8fc3ab1c04b4d13f9a54bd6341add3f6264018e02facecde4540db9712bf33f8
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50