Protein
View in Explore- Genbank accession
- AUV57742.1 [GenBank]
- Protein name
- tail fiber protein
- RBP type
-
TF
- Protein sequence
-
MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTSADDSIESIQQELWNTFNLYPSMTYDNIDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTMLYVHQSVYDNHRTTFFVKSDGTFRLGSRHISGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVLVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYFIDTAEIEAKVKEMKDNARKSKDSLQKSIEELVKYIANDVNTNPITDANKLQISKLLDDIDNKKITLDGAAQTILLDPFLTDEQKVAVKKWFDKLNSDHTALKTTVMAAMQDGNLTAQDKKDISNAAETYLNDLASWLTEMDKAADASYEQRIVEAFENAVNYANKESLHQSAVITQLYNMVSIKVSSEQVTQQFLDLNMKIEKTQEETATALDDIQTQIDSTVKNLPYKVEVTSSNGLIFVNGGVNSTIAAKITKGTEDVTSTVAVADFIWTRVSNNTAADTAWNNAHKNVGRSFNINANDVIDRATFFCDYKNPPVATGSVTIANIQDITVGTVEPTNPRDGSLWYDRGTGIVWMWQQGKWVEINRFDVNIRNLFVGSRDFGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSVWGGVKYKSSKLAGSGLLSVGDMVTYVCYVRTVGGTSPDKGIPIRLYVTDNRDGGNGTIGFEMKDKETDGKPVTGTPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKTVRVEPTNFTDIGAGGQLEVKSHMVVKGVIPSDWVPAPEDTKRDTDNTNWNMDALGNDNYLTRFERGLVKTKLADITGESLSGAQDMKTSAQLDADTWGKGQFYAIRKQARDIAIDPVNDAAYKNLTTAYDALRTYLRALKTGSGRNTVYPWDTSSDVVMDVVRTAWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNAEIGKISKTGQHSTADLRVPTTSISPKVTTIALPSFKGNTKNNLQVGGINLLNGTINPFEVKGTGATNQTNNIYAFSGGNSIEMINNTTIIGFYWSVVPDGTKPITGKMWMQGNNPYPTLTPTIEFSDSNNNGVMLFTRTPVGGSTFTHVNMRVDGLSGTLKVWNMMIAKGVTEETIEYSPRPDDKDANGNDVYYNRNRAIAGVTLPTFYTAKNGTTDTTRSSMTIQEVFHGDGTIRDEFYWTEDGQPTKVNRFADILLDTGYSIAIQNQNVSIGGKRYIQVQLNNFADKPILNNGTVRMANGKGVELSRLVTGNFTQPDQFKVDYANANISFLVSADEMNVTSTYQVKGQDVAFFLRGWKLFQGEPVQQTAPSGATIYSFPPYNATSGVAPNFTPIGYTQKDLAIINRGEIAATDTYKRPVEIAPPIKSKQTGQQWQIVYALNSQYDSYCSFTGAIDLIGDPEGVSPTVIRYAYVDWTPPFFDKDGTFMYGNNLATAQEDTRYLIPVLERRIANAETKVETDSIKSVVFSSREYELGLQDKANVTDLQGKADKGDLTNLATKDELAQKDAEQKKALEDAMKNIDFTPYVQKSEIEQLDRSWTAAFFASGGMNIVKNSIGFDKSVSPILKKETFTFWDAVSNTSYNLPESIQTNALDALGFTSGFMFNAATNNTATVIGQVLNVIPNQPYTISYFLQKMTAGDSTYRFNIELQRPTVDNPTNDSHWVTISDGQLADNSSIKHSAFMPSYFEFTPTTSKVRLLLTASPKCTAQISGIMVNIGKKPIKWTMATGENYNTNVRMNLNGIRVSQVDKDGNEIGYTVITPEKFAGYYIKDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENANNAGWAFISNY
- Physico‐chemical
properties -
protein length: 2001 AA molecular weight: 221451,88660 Da isoelectric point: 5,09206 aromaticity: 0,08946 hydropathy: -0,48231
Domains
Domains [InterPro]
Coil
375–395
375–395
1
2001
Legend:
Pfam
SMART
CDD
TIGRFAM
HAMAP
SUPFAM
PRINTS
Gene3D
PANTHER
Other
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Bacillus phage HonestAbe [NCBI] |
2079258 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AUV57742.1
[NCBI]
Genbank nucleotide accession
MG763894.1
[NCBI]
CDS location
range 55461 -> 61466
strand +
strand +
CDS
ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGCAAATACAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTACAAATATAATACAGTTGACGTTATCACAGTAAGAGAAAATAACTCTACAGCTAAAAACCCAAACGATAACGGTAAGTACTCAGCTATGCTTCCAACTCATATGTCTGGTCGTACAGCTAACGGTAATATCTATGGTTCTACAACATTAGTAACTGTAGGTACTCGTGTGCTAATCGGATTTATCGATGGACAAGTAGACACACCAATCGTAATTAACATCTACGGTAAAACAGATGACCAACAACAATTAACTCGTACAGACTTCACATCAGCTGATGATTCAATCGAGTCTATCCAACAAGAACTCTGGAACACTTTTAATCTATACCCATCTATGACTTACGATAACATCGATGGTCGTGGTAACCGCGAAGTAACATTCTCTGGTAAGACGTTCTTAATTTCTACAGACCGTGACCAAGAGAACATGTACGTACAGGATGCACATTTCGATTACATGGACCTTCCACATTCTCGTTATGCAAACGGAGAACTAATCGAACCAGAATCTCCTGATGCTCCTACAATGCTATACGTTCACCAGAGCGTATATGACAACCATCGTACAACGTTCTTCGTCAAGTCAGACGGTACGTTCCGATTAGGTTCTCGTCATATCAGTGGTGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAACCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATTTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGCGTACTTGTAAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATTTCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAGGTAGAGAAAGACACGTACTTTATCGACACTGCTGAGATTGAAGCCAAAGTTAAAGAGATGAAAGACAACGCTCGTAAGAGCAAAGACAGTCTGCAAAAGTCTATCGAGGAACTAGTAAAATATATTGCTAACGATGTCAACACGAATCCTATTACAGATGCTAACAAGTTACAAATATCGAAGCTGTTAGATGACATCGATAACAAGAAAATAACACTAGATGGTGCCGCACAAACTATTTTGCTAGACCCTTTCTTAACTGATGAGCAAAAAGTAGCTGTTAAGAAGTGGTTCGACAAGCTTAACTCTGACCACACTGCATTGAAGACAACTGTCATGGCAGCTATGCAAGATGGTAACTTGACAGCACAAGACAAGAAAGACATTTCAAATGCCGCAGAGACATATCTAAACGACCTTGCTTCTTGGTTAACAGAAATGGACAAAGCTGCCGATGCTAGTTACGAGCAGCGTATTGTTGAGGCATTTGAGAACGCAGTGAACTACGCGAACAAAGAGTCACTGCACCAGAGCGCAGTAATCACTCAGCTGTACAACATGGTTTCTATCAAGGTTAGTTCTGAGCAAGTAACGCAGCAGTTCCTTGATTTGAACATGAAGATTGAGAAGACACAGGAAGAGACCGCGACAGCATTAGACGACATTCAAACGCAGATTGATAGCACAGTTAAGAACTTACCGTACAAGGTAGAAGTGACATCATCTAATGGTTTGATATTCGTAAACGGTGGTGTCAATTCTACAATCGCAGCTAAGATTACAAAAGGTACTGAAGATGTAACAAGCACAGTAGCTGTAGCAGATTTCATCTGGACTCGTGTCTCTAACAATACAGCGGCTGATACAGCTTGGAACAACGCGCATAAGAACGTAGGTCGCTCATTCAACATCAATGCTAATGATGTAATTGACAGAGCAACATTCTTCTGTGATTACAAGAATCCACCAGTGGCTACAGGAAGTGTTACAATTGCCAATATCCAAGATATTACAGTCGGTACTGTTGAGCCAACAAATCCACGTGATGGTTCATTATGGTATGACCGTGGGACAGGTATCGTATGGATGTGGCAGCAAGGTAAGTGGGTTGAGATTAATAGATTCGATGTTAACATCCGTAACTTATTTGTCGGTTCTCGTGACTTCGGTGCACAGAACTCCAACAACCCTACAGACCCTAATAACTCAACACCTCAAGGAAATATCTCAGGTGCATGGGTTATGTCAGGTGACACATCAGGAACACCACCAAAAACAGGAGTTAAACCTTCACCACAGAACGCTACGAATCAGGATACATGGATATCGTATACGCAAAGCGTATGGGGCGGAGTTAAGTACAAATCTAGTAAACTTGCTGGAAGTGGTCTATTATCTGTTGGTGATATGGTAACTTACGTGTGTTACGTGAGAACCGTAGGCGGAACAAGTCCTGATAAAGGCATACCTATTAGACTATATGTGACAGATAACCGCGATGGTGGTAATGGAACAATTGGTTTCGAAATGAAAGACAAAGAGACTGACGGTAAACCAGTCACTGGAACCCCTGTACAAATGCGCGCAACACAACAATGGAAGATGGTGTGGGGTACATTCCCTGTAACACAATTATTCCTAGACACTGCAAACGACCCTAATAGTACGTCTAAAACTGTTCGTGTAGAACCAACAAACTTTACAGACATCGGAGCCGGAGGACAACTAGAAGTTAAGTCTCACATGGTTGTCAAAGGTGTTATTCCTTCTGACTGGGTGCCAGCCCCAGAAGATACAAAACGTGATACGGATAACACTAACTGGAACATGGATGCACTTGGTAATGATAACTATCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAGCTAGCGGACATTACAGGTGAATCTCTATCAGGTGCTCAAGATATGAAGACATCAGCTCAGTTAGACGCAGACACATGGGGTAAAGGTCAGTTCTACGCTATCCGTAAACAGGCTAGAGACATCGCTATAGACCCTGTAAACGACGCGGCGTACAAAAACCTAACTACAGCTTACGATGCTCTTAGAACGTATCTGAGAGCCCTTAAAACAGGTTCTGGTAGAAATACAGTTTACCCGTGGGATACTTCTTCTGATGTAGTCATGGATGTAGTACGTACTGCATGGGATAAAGCGTGGGCGGATTACGAGAATGCTTATGCATCGTTAACTGTTCTTGTGCAGCAGAAACAGAAGACATACACGGATGATAGAATCAAAGATGTTAACGCAGAGATTGGTAAGATTAGTAAAACGGGGCAACACTCGACTGCTGACTTACGAGTACCGACAACTTCTATTTCACCTAAAGTTACAACAATAGCTTTACCGAGTTTTAAGGGTAATACTAAGAACAACTTACAGGTTGGTGGGATTAACCTACTTAATGGGACGATTAATCCTTTTGAAGTGAAAGGTACTGGTGCTACAAACCAAACAAACAACATTTATGCGTTTAGTGGTGGAAACTCAATAGAGATGATAAACAACACAACAATCATAGGATTTTATTGGAGTGTTGTACCGGACGGTACTAAACCGATAACAGGCAAAATGTGGATGCAAGGAAACAACCCTTATCCGACATTAACACCTACCATTGAATTTTCCGATTCCAACAACAACGGTGTAATGTTGTTTACTAGAACACCTGTAGGAGGTAGTACATTTACTCACGTGAATATGCGAGTAGACGGTTTGTCAGGTACCTTAAAAGTATGGAATATGATGATTGCAAAAGGGGTTACAGAGGAGACAATTGAGTACTCCCCTCGTCCGGACGATAAGGACGCAAACGGTAATGACGTGTACTACAATCGAAATAGAGCTATCGCAGGTGTAACATTACCTACATTTTACACAGCTAAAAACGGAACTACAGATACAACACGTTCGTCAATGACGATACAGGAAGTGTTCCATGGTGACGGTACTATTCGAGATGAGTTCTACTGGACAGAAGACGGACAACCTACCAAGGTTAACAGATTCGCGGATATCCTTCTAGACACAGGCTACTCTATTGCCATCCAAAACCAAAACGTGTCTATTGGTGGAAAACGATACATTCAAGTACAACTAAACAATTTTGCAGATAAACCTATACTAAATAACGGTACGGTTCGTATGGCTAATGGTAAAGGGGTAGAGCTTAGTCGTTTAGTTACAGGAAACTTTACGCAACCAGACCAGTTCAAAGTAGACTATGCTAACGCGAATATATCATTTTTAGTATCTGCGGATGAGATGAACGTTACTAGCACGTATCAAGTAAAAGGTCAAGACGTAGCATTCTTCTTACGTGGATGGAAGTTATTCCAAGGCGAACCAGTTCAACAAACAGCGCCTAGTGGGGCTACTATTTACTCATTCCCGCCTTATAACGCTACTAGCGGAGTTGCACCTAACTTCACTCCAATAGGATACACTCAAAAGGACCTAGCGATTATAAACAGAGGAGAAATTGCCGCTACTGATACGTACAAGAGACCCGTTGAGATTGCGCCTCCTATAAAGTCAAAACAGACAGGACAGCAATGGCAAATCGTTTACGCGCTTAACTCACAGTACGATTCTTATTGCTCATTTACTGGAGCTATTGATTTAATCGGTGACCCAGAAGGTGTTTCACCTACAGTTATCCGTTATGCGTACGTAGATTGGACTCCTCCGTTTTTCGATAAAGACGGTACATTTATGTATGGTAACAACTTAGCAACCGCTCAAGAGGACACTAGGTACCTTATACCTGTACTTGAACGTCGTATAGCTAATGCAGAGACGAAAGTAGAGACAGATTCCATTAAGAGTGTTGTGTTTAGTTCACGTGAGTACGAGTTAGGGCTACAGGACAAAGCAAATGTTACAGACCTTCAAGGTAAAGCAGATAAAGGTGACTTGACTAACTTAGCTACAAAAGACGAGTTAGCTCAAAAAGATGCGGAACAGAAAAAGGCGTTAGAGGATGCAATGAAAAACATTGACTTCACACCTTACGTGCAGAAGTCAGAAATCGAACAGTTAGACCGTTCATGGACAGCAGCATTCTTCGCATCAGGCGGTATGAACATCGTAAAGAATTCTATCGGTTTTGACAAGTCTGTTAGCCCTATATTAAAGAAGGAGACGTTTACGTTCTGGGATGCAGTATCTAACACATCTTACAACTTACCAGAAAGTATACAAACTAACGCTCTTGACGCATTAGGTTTCACAAGTGGGTTCATGTTTAACGCAGCTACGAATAACACAGCTACAGTAATTGGTCAAGTACTAAATGTTATCCCTAACCAACCGTACACTATCAGCTACTTCCTACAGAAGATGACCGCAGGAGATAGTACGTACAGATTCAACATCGAACTTCAAAGACCTACTGTAGACAATCCAACTAATGACAGTCACTGGGTAACAATTAGTGATGGTCAGTTAGCGGATAATAGTAGTATTAAACATAGTGCGTTCATGCCTTCTTACTTTGAGTTTACACCAACAACAAGTAAGGTAAGACTTCTGTTAACAGCCTCCCCTAAGTGTACCGCACAGATTTCGGGTATAATGGTTAACATAGGGAAAAAACCTATTAAGTGGACAATGGCTACTGGTGAGAACTATAACACAAACGTCCGCATGAACTTAAATGGTATCCGTGTATCTCAGGTCGACAAGGATGGTAACGAGATTGGTTATACCGTTATAACGCCGGAGAAATTTGCAGGTTACTATATTAAGGATGGTAAACCAGAAGAAATTTTCCGACTGGATGGTGATGAAACTTGGACTAAGAAGTTGAGAGCAGAAAATGAGATAAACATGGGACCAATCAAGATACTACGCGTAGAGAATGCAAACAACGCAGGTTGGGCGTTTATCTCAAACTACTAG
Tertiary structure
PDB ID
a4b9afdb15cc25c093e19202ad64d4d8263885f26d9a792d6b660303ec802b85
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50