Protein
View in Explore- UniProt accession
- U5PXK4 [UniProt]
- Protein name
- Tail fiber protein
- RBP type
-
TFTFTFTF
- Protein sequence
-
MVERLKQTIRHPKMEVLVDFKGLGLNRINEWENITDYVLDISGSKEKATESVGGVTSDIVTFATDNKGNVFSNTNPKSPFYQKVKSNVDFVLKTGFKGEELKIYAAGIITKFAPSWNDKKYNVSAEDYFYLLKNTDAPKTAYQDVSLDELVHILLDAAEIPSQIKRIIPKTEFNFQYFKFEEANCFDALKKLMEISVGQAYFEGLNFVFETKLALDYELDLTVKHTIEEDDIFTFDETIEDSDIVNAVSIISDPKTIFPKELVFQTPENIVQVNEEPITFGDGSSFFIDNTHLPIINNTENPISVKNLTQGRTINILTVDKNTGKITIAPESLAYVAKGDLLVVSYSYQQLVLLPGQSRTYSLSLSGEVHALTDVDVAVWDATGQLPRDYSTTPNKANTVSLNQFNFNQTSGLVTVVLKNNYNEGITISTLQLRGNPIKSANPLEIYVRDLPSINEYKKQEIQIANNYFTNTKLAQKIAQYIVDNRSQPRKKIGVDMDGYTELELNDIAKVIENESGTNHTFYADRIDYSFSADGGWTAKVTFTQTETEQWVYESFKGESWEKTNPGNPIDDFIFDINANMIKNGGAELHTGIADYVDAGAIGSAHYVPDYWRFTRSTGNASARIRTGGELALHADQSFEISASNSGSGYYEQTIEGVVPSKTHSASFIARLDGCTGVFIVEQYANTSLIKTLSYDLPEGLKEYEFQFASEPTATSFIVKFKKKAGTKGSESMIFDKVKVEEADKASLYLEANETQSVQAGQKYDNSVIIGNNYGVSVYDANNSQRVRMGQYAPGKYGMRIDNGALEIVNGLLYEQLANDVGKKLDISANNAITSLAMSMSGLDGDLDTVSGIVNSHTSLIQQNSEQIQLRVLSSTYKTDKDGILKRLSDNETAISQTAHDITLLATKDSLDELGNVVESNTAAINVNATAITQRVTTSTFNQAITDTKAYADSAATSKANTAESNAKAASEKNIHIGNTSPTDTTRKWLDTNTTIPILKYYTGGTWKKLIPTAASDIGAETPSGAQTKATTAETNAKKYMDSVNATIQDQFTAQSSSITQLSNRIDSKVESTTYTQGIADAKTYADGKASTAESNAKGYADTKDTATLNSAKGYADTKDAVIVERVETNSSLISQQADKILSMVTKTEFNSLKIGGQNKVTGTDFKNAVGWTRWNVGTLSFAQADSSMPKNYLKVETKDGSGNNLTVASGQAIGLQHSGRTFRVIAGQTYTASMIVATSELGGMLDYLYVIHKDGQGNKRLTNVDTTNFVTVHPAYSGAPSTYDFRMVYFTFTAARTDDVYLLIGGTTKRDLGSTAYAWIRLYDFKVEDGDKATAWTPSTEDVKQDINTLSTQISQTAEDISLNVVKNNKVLTAINASAEGVKIKADRLDITGLVTFNVLNNDMQSRISNADQAYADTVRWKLPNTTLINGGLIAADTVTASQILVGSWENLYQNGGFEKKDAGWKNASVWSVVSTAPYNGTYHAEGTWGSSGAVSYYDDREIDVRPGEKYYFEGYFRTKTSTTTKARTILVRFKDKTGSYSYNIVEETLSTSWQKFSYVVDIPSDCVSMTIGLSVKGGMPSGNSTYADNLFCKRMTDGSLIVDGTITASMIKSLNGLNIGSGQFTVDGSGNVIIGGGATLRAAKFEGLRGNTISFGDHGAKIDTSIAGTIKRTRFAGNDTNYLAIDDDGTFNFVMNGDFNPKFYIANGGHKGLKLGMGQIIGLTDGEAIHVRNGANSDYGKFAAGDVAVTKELDVWGKAKIGGTDLTINGSTAGMLKLKGSPYAYMEFYANGTQVGFVGLEQASGQNNVMLQNNNGGEVLIKTAATRVKFDRSVGQVVFKDQNDNGYISLIAKDFVPGSLRELKKDITPFEKTSTGRTVLEEICSTTVFNYRYKEENSEIDPLRMGLIYDSAPYEVIDPRGQGINLYGLATMSFQGVKELNIKLEERVSELEMTIDSLSARIAILETK
- Physico‐chemical
properties -
protein length: 1970 AA molecular weight: 215537,19760 Da isoelectric point: 5,14503 aromaticity: 0,09086 hydropathy: -0,34579
Domains
Domains [InterPro]
DC_0107
STR
1–548
STR
1–548
G3DSA:2.60.120.260
STR
1449–1594
STR
1449–1594
1
1970
Architecture
STR 1-548 | STR 579-749 | STR 1026-1081 | RBD 1224-1448 | STR 1449-1594 | RBD 1595-1970
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Bacillus phage Staley [NCBI] |
1406792 | Uroviricota > Caudoviricetes > Slashvirus > |
| Host |
Bacillus megaterium [NCBI] |
1404 | cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AGY48740.1
[NCBI]
Genbank nucleotide accession
KF669663
[NCBI]
CDS location
range 38043 -> 43955
strand +
strand +
CDS
ATGGTTGAACGCTTAAAACAAACAATCAGACATCCTAAGATGGAAGTGTTAGTGGATTTTAAAGGTTTGGGCCTGAACAGAATCAATGAGTGGGAAAATATCACTGATTATGTCCTAGATATTTCAGGTAGTAAGGAGAAAGCTACAGAATCAGTCGGTGGTGTTACTAGTGATATTGTTACATTTGCAACAGATAACAAAGGTAATGTATTTTCAAATACTAATCCTAAAAGCCCTTTTTATCAAAAAGTAAAATCGAATGTTGACTTTGTTCTCAAGACAGGATTTAAAGGTGAAGAGTTAAAAATTTATGCTGCTGGTATTATCACAAAATTCGCTCCTTCGTGGAATGACAAGAAATACAATGTAAGTGCTGAAGATTATTTTTATTTGCTGAAAAATACTGATGCTCCTAAAACAGCTTACCAGGATGTTTCATTAGATGAACTAGTGCATATCCTTTTAGATGCAGCTGAAATTCCTTCACAAATTAAGCGGATCATACCGAAAACTGAATTCAACTTTCAGTATTTTAAATTTGAAGAAGCTAATTGTTTTGATGCCCTGAAGAAATTAATGGAGATTTCCGTTGGTCAGGCATACTTTGAGGGGCTTAATTTTGTATTTGAAACAAAGTTAGCACTTGATTATGAATTAGATTTGACTGTAAAACACACAATTGAAGAGGATGACATCTTTACCTTTGACGAAACAATTGAAGATTCAGATATCGTAAATGCTGTTTCGATTATTTCTGATCCTAAGACGATCTTTCCAAAAGAGCTTGTATTTCAAACTCCTGAAAATATCGTACAGGTAAATGAAGAACCTATTACGTTTGGTGATGGTAGTTCGTTCTTTATTGACAATACTCATTTGCCAATCATCAACAATACTGAAAATCCTATTTCGGTAAAGAATTTAACTCAAGGCCGTACGATTAATATTCTTACTGTAGATAAAAATACAGGTAAAATCACAATCGCTCCTGAAAGTTTAGCTTATGTAGCAAAAGGTGACTTGTTAGTTGTTTCTTATTCTTATCAGCAACTAGTTTTACTTCCAGGCCAATCACGTACTTATTCACTTAGCTTATCAGGTGAGGTACACGCTCTTACAGACGTTGATGTAGCTGTTTGGGATGCAACAGGGCAATTACCTAGAGATTATTCAACAACGCCAAATAAAGCAAATACAGTATCTCTAAACCAATTCAACTTCAATCAAACTTCAGGTTTGGTTACTGTTGTTTTAAAGAACAACTATAATGAAGGTATCACAATTTCTACGCTGCAATTACGTGGTAATCCAATTAAAAGTGCTAATCCATTAGAAATTTACGTTCGTGATCTTCCTTCTATTAACGAATATAAAAAGCAAGAAATACAAATCGCTAACAATTACTTCACGAATACGAAGTTAGCTCAAAAAATTGCACAATACATTGTAGACAATCGTTCTCAACCTAGAAAGAAAATCGGCGTTGATATGGATGGTTACACTGAATTAGAACTTAATGATATCGCAAAGGTAATTGAAAATGAAAGCGGAACAAACCATACGTTCTACGCTGATCGTATCGATTATTCTTTTTCTGCTGATGGTGGGTGGACTGCTAAAGTTACATTTACTCAAACTGAAACTGAACAATGGGTGTATGAATCATTCAAAGGTGAATCATGGGAGAAAACAAATCCTGGAAATCCTATCGATGACTTCATTTTCGATATCAATGCAAATATGATTAAGAATGGTGGAGCTGAACTTCATACTGGAATTGCTGATTATGTAGATGCTGGTGCAATTGGTTCTGCTCATTATGTTCCGGACTATTGGAGATTCACACGTTCAACAGGAAATGCTTCAGCTAGGATTCGTACCGGCGGTGAATTAGCTTTACATGCGGATCAGTCTTTCGAAATCTCAGCATCAAATAGCGGTTCAGGTTATTATGAACAAACTATCGAAGGTGTTGTTCCTTCTAAGACACATTCAGCTTCTTTTATAGCACGTTTAGATGGGTGTACCGGCGTCTTTATCGTTGAGCAATACGCTAACACTAGTTTAATCAAAACGCTTTCATATGACCTTCCTGAAGGCTTAAAAGAATATGAATTCCAATTCGCTTCTGAACCTACAGCAACTTCTTTTATTGTCAAGTTTAAAAAGAAAGCTGGTACAAAAGGTTCTGAATCAATGATCTTTGACAAAGTAAAAGTTGAAGAAGCCGACAAAGCTAGTTTGTATTTAGAAGCTAATGAAACTCAAAGTGTTCAAGCTGGACAAAAGTATGATAATTCAGTTATAATCGGTAATAACTACGGTGTATCGGTTTATGATGCTAATAATTCTCAACGTGTTCGCATGGGCCAATATGCACCAGGAAAGTACGGTATGCGTATTGACAATGGAGCACTTGAAATTGTTAACGGATTATTATATGAACAACTAGCTAATGATGTAGGTAAAAAGTTAGACATCAGCGCAAATAACGCTATAACAAGTTTAGCTATGAGTATGTCAGGTCTTGATGGTGATTTAGATACAGTTTCAGGTATCGTCAATAGTCATACAAGCCTTATCCAGCAGAACTCTGAACAGATACAATTAAGAGTTTTATCGTCAACATACAAAACGGATAAGGATGGAATATTGAAACGTCTTTCTGACAATGAAACGGCTATCAGTCAAACGGCCCACGATATCACCTTACTTGCTACTAAAGACTCTTTAGATGAATTAGGTAACGTTGTTGAATCAAATACAGCAGCAATCAATGTCAATGCTACTGCTATTACTCAACGTGTAACAACATCAACTTTCAATCAGGCCATTACTGATACTAAAGCTTATGCTGATTCTGCTGCTACTTCTAAAGCAAATACCGCTGAAAGTAATGCTAAAGCTGCTTCAGAAAAGAATATTCACATTGGCAATACTTCGCCAACCGACACAACGAGAAAATGGTTAGATACAAATACAACCATTCCGATCTTGAAGTATTATACAGGTGGAACATGGAAAAAGTTAATTCCTACAGCTGCTTCAGATATTGGCGCTGAAACTCCATCAGGAGCACAAACTAAAGCAACAACAGCGGAAACAAACGCTAAAAAGTATATGGATTCAGTGAATGCAACAATTCAAGATCAATTCACGGCCCAATCATCAAGCATTACTCAACTTTCGAACAGAATAGATAGTAAAGTTGAATCAACAACTTACACTCAAGGTATCGCTGATGCTAAAACTTACGCTGATGGTAAAGCTTCTACAGCTGAATCAAACGCAAAAGGATACGCCGATACTAAAGATACCGCAACTTTAAATAGCGCTAAAGGTTATGCAGATACTAAAGATGCTGTTATCGTCGAAAGAGTAGAAACGAATTCATCTTTAATTAGTCAACAAGCGGATAAAATTTTATCTATGGTTACTAAAACCGAATTCAATAGCTTGAAAATCGGTGGTCAGAATAAAGTAACTGGAACTGATTTTAAAAACGCTGTAGGATGGACTAGATGGAATGTTGGTACACTTTCATTTGCTCAAGCTGATTCTAGTATGCCTAAAAATTATCTGAAAGTAGAAACAAAAGATGGATCAGGTAACAATTTAACTGTAGCAAGCGGTCAAGCGATAGGTTTACAACATAGTGGACGAACTTTCAGGGTAATCGCTGGTCAAACTTATACAGCTTCTATGATAGTTGCTACTAGTGAATTAGGCGGTATGTTGGATTATCTTTATGTAATTCACAAAGATGGTCAAGGTAACAAGAGATTAACCAACGTTGATACAACTAATTTCGTAACTGTTCATCCTGCTTATAGTGGTGCTCCTTCAACTTATGATTTCAGAATGGTTTACTTCACATTTACAGCAGCACGTACAGATGATGTTTACTTGTTAATCGGCGGTACAACTAAACGTGACTTGGGTTCTACTGCTTATGCCTGGATTCGTTTATACGATTTCAAAGTAGAAGATGGTGATAAAGCTACTGCTTGGACTCCTTCAACAGAAGATGTTAAACAAGATATCAACACACTTTCTACTCAAATCAGTCAAACAGCTGAAGATATCTCATTGAATGTTGTTAAAAATAACAAAGTATTGACAGCTATCAACGCTTCAGCAGAAGGCGTTAAAATCAAAGCTGATCGTTTAGATATCACTGGATTAGTTACCTTCAACGTACTAAATAACGATATGCAATCAAGAATTTCTAATGCAGATCAAGCTTATGCTGATACTGTTAGATGGAAATTACCAAATACAACTTTAATCAATGGTGGTTTAATTGCTGCTGATACAGTTACAGCTAGTCAGATTTTAGTTGGATCGTGGGAAAACCTTTACCAAAACGGCGGTTTCGAAAAGAAAGATGCTGGATGGAAAAATGCTTCTGTTTGGTCAGTAGTTTCAACAGCTCCTTACAATGGAACGTATCACGCTGAAGGAACTTGGGGTAGTAGCGGTGCTGTTTCTTACTATGATGACCGCGAAATTGATGTCAGACCAGGAGAAAAATATTACTTCGAAGGTTATTTCCGTACAAAAACTTCTACTACAACGAAAGCTAGAACTATCCTGGTGAGATTTAAAGATAAAACAGGATCTTATTCTTACAATATCGTTGAAGAAACGTTATCTACTTCTTGGCAAAAGTTTTCTTATGTTGTAGATATTCCTTCTGATTGTGTATCGATGACTATAGGTTTATCTGTAAAAGGCGGTATGCCTTCAGGAAATTCAACATATGCAGATAACTTATTCTGTAAGCGAATGACAGACGGTTCTTTGATTGTCGATGGAACAATTACAGCTAGTATGATTAAATCATTAAATGGTTTAAATATTGGTAGCGGTCAGTTTACAGTAGATGGATCAGGCAACGTAATTATTGGTGGTGGAGCAACTTTAAGGGCCGCTAAGTTTGAAGGTCTAAGAGGTAACACAATTTCATTTGGCGATCACGGTGCTAAAATTGATACTTCTATCGCTGGAACAATCAAACGTACACGTTTTGCTGGAAATGATACAAACTACCTAGCTATTGATGACGATGGTACTTTCAACTTTGTTATGAACGGTGACTTCAACCCTAAATTTTATATCGCTAATGGTGGACACAAAGGATTGAAATTAGGGATGGGCCAAATCATCGGCCTGACTGATGGTGAAGCTATTCACGTTCGTAACGGCGCTAACTCTGATTATGGTAAGTTTGCTGCTGGTGATGTTGCTGTAACGAAAGAACTTGATGTTTGGGGCAAAGCTAAAATCGGTGGTACTGATTTAACCATTAACGGTTCTACAGCTGGTATGCTTAAATTGAAAGGTTCTCCATATGCTTACATGGAATTCTACGCTAATGGAACACAAGTTGGTTTCGTTGGTTTAGAACAAGCTTCAGGTCAGAATAACGTGATGCTTCAGAATAACAACGGCGGCGAAGTATTAATTAAAACCGCTGCAACTCGTGTTAAATTTGACCGATCTGTTGGACAAGTTGTTTTTAAAGATCAGAATGATAATGGTTACATTAGCCTAATCGCTAAAGATTTCGTTCCTGGATCATTAAGAGAACTAAAGAAAGATATCACACCTTTCGAAAAAACTTCAACAGGAAGAACAGTTTTGGAAGAGATTTGCAGCACAACAGTATTTAATTATCGTTACAAAGAAGAAAATAGTGAAATCGATCCGCTAAGAATGGGTTTGATTTATGATTCTGCTCCTTATGAAGTAATTGATCCGCGCGGTCAAGGTATTAATTTGTACGGTTTAGCTACAATGTCTTTCCAGGGTGTAAAGGAATTGAACATTAAGTTAGAAGAAAGAGTTTCTGAATTAGAAATGACTATTGACTCCTTGAGTGCTAGAATAGCTATTTTGGAAACAAAGTAA
Genome Context
Genome Context
Tertiary structure
PDB ID
d93b15c8edfa5ba205df39be6a3badb63b6a8f44c0f406d81a7b32345722f11e
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50