Protein
View in Explore- Genbank accession
- QEP29449.1 [GenBank]
- Protein name
- structural component of the tail fiber
- RBP type
-
TFTFTF
- Protein sequence
-
MAGGRRFQAGLGSEHKRLYKEGQQINTLLLAQVIQVNYKYNTVDLLALQHKEVFQNSYANEGRFSARLPMEFGGRNLAGQPYGQVNPIAVGTVVLVGFINSDKDMPIVISVYNNNDVNKQLSRTRFANADPTDMALAGQMYQKFSLYPSLTYDSIDGDGNRVVTFSGKSFIAFDTKDMQNSPMTDASYGSRYEDLGTSYYNDGELIEPMKGRAPNVLFKHQGILDDDNKPDTHNFMIHINPDGTYRTSMMDTEQDWRTMFEMTPEGKIRLRRQGDTVRLNDGFEIGELGINEEGIVYLRNGDMDLEVREDGIYSQGKLITENINLDDIYEKLANVTFEINKTNESLQILTEKSELQDGKIVNLETEITIVAGKVESKVSATEVQDMIDSSIVDMTDAIKKAQEDADRANKVISDMASDNRLAPSEKLELLKEWDTIKNEYPTYLAQAELYEVDSTTYTAKYKALETFVTPLLEDMEATSVVDGSIMRKTFSAYYTERINLLNAITKGLKDGLEEAMKKASQASVDATQALADSAQAQIDANNAKQLIADIASDGKLTASEKYQLKKEWDVIVKEYPTTIAQATKYKVNTDNYTAKYKALETFVTPLFANMDETSVVNGEQLRAVFSDYYAVKITLLKEITDIARDELTDYGNRITVAETKITQTSEAITLMASRVETVENDVKTNTAQLKVQADLISQKVTASEVKDAIDNAIDNMSIGGSNLFVIKTQTAGLLNENNGTVGTAVDKSVVSNYIKVTAKMPYVASLYGNTGTNSIIIAWYDTSKTFISGQAVADSGDFHKTYVAPENAVYARLSYKKADTVKMKFEVGTKPTDYSPSWDDIKGDQTALEEYIKQVEEQAKQAQQEAENAKNEAENANSAIADMSNDNMLTANEKQQILLQWEEIKTEYPINLDQATKFGVSATQYTTAYNALKTYLDPLLADMTTTSVIVGSTMRSTFNTYYDRRTTLLNRVAELAKQVADQAKDTADKVDDDLNNIGGYNYIGFSSGDHMYPRLMIKNIGYYYVPSMGSAEFVDDMVCLKPKTTEKKVQYEIGSSSANISGVGLANYRMKEVKTGQWLTASANLKVVGTGKAYITIFTLENGSWQFSLSDMVTASQGVTRVVAQRKVTDQTQGVFIRISGDIIDEVHFGNTQLEVGIRSTPWKKSDIDIQEDINNVADDIKDYIGARSDNLITNGFGELGNNTNIGGIFDGADRIVGKGSFRQEEGNKSLLFSEHIVIDNKKVYNFDYYMHTLKGVGRSYAMIAPYDVDGKRITFPSLGGRNYNSITPVKFTKLAKPLKVGDTEVFVEDASLWNGQAPQDYQRSIIMWGYKNSFGYTYPDGTYSQLMQMKTYDIGAVDTTANKITLNKPWAVANPNSSDGIFPVGHTLSPTSDGSTYLYLNGHVNIQVPTTYTKYSHLISGSSEFANTTLIPVETGSIQLGFLLNRDTTGEKSWLNGLRLRDYTDTYKLNDDVRETQENVDKAQADADKANQSIADLSNDNLVTPNEKLDLKKEWEIIVAEKPKNDAQADKFGVSKVAYGTAYTALDTYLKPILASTTTNSAIVGQTMRDTFKAYYTARTDLLNTIASKAKELADNAQDTADNIAVGTRNLLIGTQDFSKGKYPGNANVTITDEKLFGNAVMKNDYTTGTGYSDMYQMTTSIIPTGTQYTLSFYAKADLEGTKMSCYFYNPNTTTSSVNSQGGKLSSSDGRTVFVLSTEWTKYWVTWTQTQADKPKSVIIGRKTGGEEPNSAFYMSSPMMVEGNKPQTWMKAPEDIETAINGKEGAWVYSPTAPTNPAVGLVWVDSSKTPNQPKRWVGGETGWVALTPEEVKDLPWGEDGSSLADWVAQAEQKISSDAIISTVLGSEDFTGIFDSKANTEDLNNLASYDDLDAMQAEYERLLKEGIAGIDFSPYVTNTELEQLKDSFTFSVQQAGGVNMLKNSLGFSGTDFWQASSGIDTTQNEQLSKLGFGSGFMINRVQNATLAQTIELPEAKQGLQYALSFYMNVATFGDVTDFQCGAHIYEEGVLKYTVGVTDATQEIPSDYHLYKLVFEPESPNTVIELFVTNGAQATVIISGVMYNIGNIALKWQPYPSEIYNTNVKIDINGITVKNNQTDGYTMITPQEFSGYARVNGEMERIFTLNGQVTEVKMLQAEKRITMEPISVFAMNSKETNTIGWAFVAFGEVAHSAIASSTQ
- Physico‐chemical
properties -
protein length: 2198 AA molecular weight: 243278,22230 Da isoelectric point: 4,78564 aromaticity: 0,09236 hydropathy: -0,41915
Domains
Domains [InterPro]
Coil
391–418
391–418
1
2198
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Enterococcus phage PEf771 [NCBI] |
2601638 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
QEP29449.1
[NCBI]
Genbank nucleotide accession
MN241318.1
[NCBI]
CDS location
range 30798 -> 37394
strand -
strand -
CDS
TTGGCAGGAGGACGTAGATTTCAGGCAGGGTTAGGTTCCGAACATAAAAGATTATACAAAGAAGGACAACAAATTAATACTTTGTTGCTAGCCCAAGTTATCCAAGTTAATTATAAATACAATACAGTTGATTTACTAGCATTACAGCATAAAGAAGTTTTCCAAAACTCCTATGCCAATGAAGGTAGATTTTCTGCTCGTTTACCAATGGAATTTGGTGGACGAAACCTTGCAGGACAACCATATGGTCAAGTAAACCCTATTGCCGTTGGTACTGTTGTCCTAGTAGGTTTTATTAACTCTGATAAAGACATGCCGATTGTTATTAGTGTATACAATAACAACGATGTAAATAAACAATTATCCCGTACACGTTTTGCTAATGCAGACCCTACAGATATGGCTTTAGCGGGACAAATGTATCAAAAATTTAGTTTGTACCCATCTTTAACTTACGATAGTATTGATGGGGATGGTAACCGAGTAGTTACATTCTCTGGTAAATCATTTATTGCATTCGATACAAAAGATATGCAAAACTCTCCAATGACAGATGCTAGTTATGGTTCTCGTTATGAAGACCTAGGAACCTCTTACTATAATGATGGAGAACTAATTGAGCCGATGAAAGGTCGAGCACCTAATGTGTTGTTCAAGCACCAAGGGATTCTTGACGATGATAATAAACCAGATACACATAATTTCATGATTCACATTAACCCAGATGGAACATACCGTACATCTATGATGGATACGGAACAAGACTGGCGGACAATGTTTGAGATGACACCGGAGGGTAAAATCCGTTTACGTAGACAAGGGGATACTGTACGTCTAAACGATGGTTTTGAAATTGGTGAACTAGGTATTAATGAAGAAGGTATCGTTTATTTACGTAATGGGGACATGGACTTAGAAGTTCGTGAAGATGGTATCTATTCCCAAGGTAAACTAATCACAGAAAATATCAATCTTGATGATATTTATGAGAAATTAGCTAATGTTACTTTTGAAATTAATAAGACAAATGAGTCCTTACAAATTTTAACTGAGAAATCAGAGCTACAAGATGGTAAGATTGTAAATCTAGAAACAGAGATTACAATTGTAGCTGGAAAAGTAGAATCTAAAGTAAGTGCAACAGAAGTACAAGACATGATTGATAGCTCTATTGTAGACATGACGGATGCTATTAAAAAAGCCCAAGAAGATGCAGATAGAGCAAATAAAGTTATTTCTGATATGGCTAGTGATAACCGTTTAGCTCCTAGTGAGAAGCTAGAATTACTAAAAGAGTGGGACACTATCAAGAATGAATACCCAACTTATTTAGCACAAGCTGAACTATACGAAGTAGATAGTACAACTTATACTGCTAAGTACAAAGCTTTAGAAACATTTGTTACTCCTTTATTGGAAGACATGGAAGCTACTAGTGTAGTAGATGGTTCTATTATGCGTAAAACATTTAGTGCATATTACACAGAACGAATCAATTTACTAAATGCAATCACTAAAGGGTTAAAAGATGGTTTAGAAGAGGCAATGAAGAAAGCTTCTCAGGCTTCTGTAGATGCTACACAAGCTTTAGCTGATTCTGCACAGGCACAAATTGATGCAAACAATGCAAAACAATTGATTGCAGATATTGCTAGTGACGGTAAGCTGACTGCTTCTGAAAAGTACCAATTGAAAAAAGAATGGGATGTTATTGTTAAGGAGTATCCTACAACAATTGCCCAAGCAACAAAGTACAAAGTAAATACAGATAACTATACTGCTAAGTATAAAGCTTTAGAAACATTTGTCACTCCTTTGTTTGCGAATATGGATGAAACAAGCGTAGTTAACGGGGAACAACTACGTGCAGTATTTTCTGATTACTATGCTGTAAAGATTACTTTATTAAAAGAAATCACAGATATTGCTCGTGATGAATTGACTGATTATGGTAACCGTATTACTGTAGCAGAAACAAAAATCACACAAACATCCGAAGCTATTACGTTAATGGCTTCCAGAGTGGAAACTGTTGAAAATGATGTTAAAACAAACACAGCGCAATTGAAAGTGCAAGCAGACTTAATTAGTCAGAAAGTAACTGCTAGTGAAGTAAAAGATGCTATTGATAATGCAATTGATAACATGTCTATTGGTGGTTCTAACTTGTTTGTAATCAAAACGCAAACAGCAGGACTATTGAATGAAAATAATGGTACTGTAGGAACAGCCGTAGATAAATCTGTAGTATCTAACTATATCAAGGTAACAGCTAAAATGCCTTATGTAGCTTCTTTATATGGAAACACAGGGACAAACAGTATTATCATTGCATGGTATGACACAAGCAAAACGTTTATCTCTGGTCAAGCTGTAGCTGATTCTGGTGATTTCCATAAAACTTATGTTGCACCAGAAAACGCAGTATATGCTCGTTTAAGTTATAAAAAAGCTGACACTGTTAAAATGAAATTTGAAGTAGGTACGAAGCCAACTGATTACAGCCCGTCATGGGATGATATTAAAGGTGACCAGACTGCTTTAGAGGAATACATTAAACAGGTAGAGGAACAAGCTAAACAAGCACAACAAGAAGCAGAAAACGCTAAGAATGAAGCAGAAAACGCAAATAGTGCTATTGCTGATATGTCTAATGACAATATGTTAACAGCAAATGAGAAACAACAAATTTTACTACAATGGGAAGAAATTAAAACGGAATATCCAATTAATTTAGACCAAGCAACTAAATTTGGTGTTTCTGCTACGCAGTATACAACAGCGTACAATGCTCTAAAAACATATTTAGACCCATTATTAGCAGATATGACAACAACTTCTGTAATTGTTGGTTCTACTATGCGCAGTACATTTAATACTTACTACGACCGTAGAACAACATTGCTTAATCGTGTAGCTGAACTAGCTAAACAAGTAGCTGACCAAGCTAAGGATACAGCAGACAAAGTAGACGATGACTTAAACAACATTGGTGGGTACAACTACATCGGATTCTCTTCCGGAGACCATATGTATCCTCGTTTAATGATTAAGAACATTGGTTACTACTATGTACCTTCTATGGGGAGTGCAGAATTTGTAGATGACATGGTATGTTTAAAGCCAAAAACAACAGAAAAGAAAGTTCAGTATGAAATTGGCTCCTCATCAGCTAACATATCCGGTGTTGGTTTAGCAAATTATCGGATGAAAGAAGTTAAAACAGGTCAATGGTTGACTGCTTCTGCAAACTTAAAAGTTGTTGGTACTGGTAAAGCATATATTACTATCTTTACTTTAGAGAACGGCTCTTGGCAATTTTCACTAAGTGATATGGTTACAGCAAGTCAAGGAGTAACTCGTGTAGTAGCTCAAAGAAAAGTGACAGACCAAACACAAGGGGTATTCATACGCATCAGTGGAGATATTATTGATGAAGTTCATTTTGGTAATACACAACTTGAAGTTGGTATTCGCTCTACCCCTTGGAAGAAATCAGATATTGACATTCAAGAAGACATCAACAATGTTGCGGACGATATTAAAGATTATATTGGTGCTCGTTCTGATAACTTAATCACAAATGGTTTTGGTGAATTAGGGAACAATACGAACATTGGTGGTATCTTTGATGGTGCTGATAGGATTGTAGGTAAAGGTTCCTTCCGTCAAGAAGAAGGAAACAAATCACTATTATTCAGTGAACACATTGTTATTGACAATAAGAAAGTTTATAACTTTGATTACTACATGCACACATTAAAAGGTGTTGGTAGAAGTTACGCAATGATTGCCCCGTATGACGTAGACGGGAAACGTATCACATTTCCTTCTCTCGGGGGACGAAACTACAACTCTATTACCCCTGTTAAATTTACAAAACTAGCAAAACCACTTAAAGTCGGAGATACAGAGGTTTTTGTAGAAGATGCTAGTCTATGGAACGGACAGGCACCGCAAGACTACCAACGTAGTATTATCATGTGGGGTTATAAAAACTCGTTCGGCTATACTTATCCCGATGGAACGTATAGTCAGTTAATGCAGATGAAGACATATGATATTGGTGCAGTTGACACCACAGCTAACAAGATTACGTTAAACAAGCCATGGGCAGTTGCAAACCCAAATAGTTCAGATGGGATTTTCCCAGTAGGGCATACACTTAGCCCAACTTCTGACGGTTCCACATATCTATATTTGAATGGTCACGTAAATATACAAGTACCTACTACGTACACCAAGTACAGCCATTTGATTAGTGGCTCTTCTGAGTTTGCTAATACAACGCTTATCCCAGTAGAAACAGGTTCTATCCAACTTGGATTCTTGTTGAACCGTGATACAACAGGTGAAAAATCTTGGCTAAACGGTTTACGTCTACGTGATTATACAGATACGTATAAGCTAAACGATGACGTTAGAGAAACACAAGAAAATGTGGATAAAGCCCAAGCAGATGCAGATAAAGCTAACCAGTCAATTGCTGATTTATCTAATGATAATTTAGTTACTCCTAACGAGAAACTAGATTTGAAAAAAGAGTGGGAAATCATTGTTGCTGAAAAACCTAAGAATGATGCTCAGGCAGATAAATTCGGAGTAAGTAAAGTAGCTTACGGTACTGCGTATACTGCTCTAGATACGTATTTAAAACCCATCTTAGCAAGCACAACAACGAACTCTGCGATTGTTGGACAAACTATGCGGGATACGTTTAAGGCGTATTACACGGCTCGTACAGACCTGTTAAACACTATTGCATCTAAAGCTAAGGAATTGGCTGATAATGCACAAGATACCGCAGATAATATAGCTGTCGGTACTCGTAACCTTTTAATCGGAACACAGGACTTTTCCAAAGGTAAATATCCGGGTAATGCTAACGTTACCATTACAGATGAAAAGCTGTTTGGAAATGCAGTAATGAAGAACGATTACACTACAGGTACCGGATATTCAGATATGTACCAAATGACGACCTCAATTATTCCAACAGGAACTCAGTATACATTATCGTTTTATGCAAAGGCAGACCTAGAAGGAACTAAAATGTCTTGTTACTTCTACAACCCAAATACTACGACAAGTAGTGTAAACAGTCAAGGTGGCAAACTTAGTTCTAGTGACGGTCGTACTGTATTTGTTTTAAGTACAGAATGGACTAAATACTGGGTAACTTGGACACAGACACAGGCAGACAAGCCTAAGTCAGTAATTATTGGTCGTAAGACTGGTGGGGAAGAACCTAACTCTGCTTTCTATATGTCTTCTCCTATGATGGTAGAGGGGAACAAACCACAAACGTGGATGAAAGCCCCAGAAGACATTGAAACAGCTATAAACGGTAAAGAAGGTGCTTGGGTTTACTCTCCAACAGCACCAACAAATCCGGCTGTTGGTTTAGTCTGGGTAGACTCTTCTAAAACTCCGAACCAACCAAAACGTTGGGTTGGTGGAGAAACTGGATGGGTTGCCTTAACCCCAGAAGAAGTAAAAGATTTACCTTGGGGTGAAGATGGTTCTAGTCTTGCTGACTGGGTAGCACAAGCAGAGCAAAAGATTTCTTCTGATGCAATCATTAGTACTGTACTAGGTTCTGAGGACTTTACCGGTATTTTTGACTCCAAAGCAAATACAGAAGACTTAAATAACCTTGCTTCTTACGATGACTTAGATGCTATGCAAGCTGAGTATGAACGTCTGTTAAAAGAAGGGATTGCAGGAATTGACTTCTCACCATATGTAACTAACACAGAGCTAGAACAATTGAAAGATAGCTTCACTTTCTCTGTTCAACAAGCCGGTGGGGTTAATATGTTGAAAAACTCTCTAGGATTCTCTGGGACAGACTTCTGGCAAGCCTCTTCTGGTATAGATACTACTCAGAATGAACAGTTGTCTAAATTAGGATTTGGTTCCGGATTTATGATAAACCGAGTTCAAAATGCAACACTAGCTCAGACAATCGAATTACCAGAAGCAAAACAAGGTTTGCAGTATGCTTTATCCTTCTACATGAATGTAGCTACTTTTGGAGATGTCACTGATTTCCAATGTGGGGCACATATCTACGAAGAAGGTGTGTTGAAGTATACTGTTGGGGTAACAGATGCTACACAAGAAATCCCAAGTGACTATCACTTGTATAAACTTGTATTTGAACCAGAGTCTCCGAATACTGTCATTGAATTATTTGTTACAAATGGTGCACAGGCAACTGTAATCATTTCAGGGGTTATGTACAATATCGGTAACATTGCGTTGAAATGGCAACCATACCCAAGTGAAATCTATAACACGAACGTTAAGATTGATATTAATGGTATTACTGTTAAAAACAATCAGACAGATGGTTATACAATGATTACTCCGCAAGAGTTTTCAGGTTACGCAAGGGTTAACGGGGAGATGGAACGTATCTTTACCCTAAATGGTCAGGTAACAGAGGTTAAGATGTTACAAGCAGAGAAGCGTATTACAATGGAACCTATTTCCGTGTTTGCGATGAACTCTAAAGAAACCAATACAATTGGTTGGGCGTTTGTTGCTTTCGGAGAGGTTGCACATTCTGCCATAGCATCTAGTACACAATAG
Tertiary structure
PDB ID
88a426fa03a9d9a5d255c4e7c394f12cf2ee20fe9d056466ae024cdbaa1163e1
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| Characteristics and whole genome analysis of the Enterococcus faecalis phage PEf771 | Xiang,Y., Ji,X., Wei,Y., Song,F., Li,W. and Yang,X. | 2020-09 | — | GenBank |