UniProt accession
A0AAE7V4G1 [UniProt]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
Protein sequence
MDNNKDAVYIQQLRKYCKDNKKWNEIFPVTFIQAIYNAANGNRLDTLLAMYNSIFVEYKGSFATTVAAIDNIVRKKGLIITYFDENNLSWTRRYKLHDTSDINFQNEDNWEGYNFDILVDEIYKAIKYIFTNIDKFPDLKNVLIQQITEVTENIFNNIEDYTNLYNIFKELIKENINNVFNNINDYTNLKNLINTNIYNRVDYIFNNIDDFKVLLNKINVAILNRVDYIFNNINNYPELKQLIINSLQAKQLFTIEFSVNGDTLDIINKDELNSYIENNNVNNNALFTFIGKFFDSSNNKLLYNLVFTAFVNINSNYLNLDNCYGETLIINNGKLYKCKINFNINTETEMSNPNWITYARKYDDIPTFEFNYISTNIYSIVDIDDYNKYVNSFKYNTLVRFIFNESSTIINEYIGYISKVGSTLRILIYLQESNDFVYDTIISGIIENNELRISRLTNSDILTYLYNANSSGGVVLLDDNTLIPSKFLPSYIDDVIDLLGGIVESTPTSGMTAGYKYYVTSTKKIFTASSATSGITSDPISDVIYVVPDDINGAIMYRWSGTTLVEIVNGGIVIGTTTGTAFDGARGLNNENILKSVPNKLITDVSVIARGLNDDVIIRTTYSERTNNDGSYVANKYRDYQLPEAQQGRAGLMSTSDKVKLDSIYNEYIINDENFFSVSQGQAFTLTTWGKSNFNAFRDAILNGKQVQLYLSSYEDGAEANINVPCEVAVNAKTLIITYVIPDLLKQVKATLTINDNNNNVSCSITNVINLTGVGSGLTIGTTSGTAFEGNRGLQAEKDIDKLQSYTNNGVVSNVESSSNSSGELKVTRRINSGGAIVTSEQYIALPQSSSSKAGLMSANDKTKLDNIIIIKLTGTDLTSVNEDTDINSVKNTNIDITEFDGILESLNSDKNVKIYINEYNDAVKQTFNINCDIAFNYNSKEIFIQYDIYDVNKRIYASLYKDGDRVSLEILAVKNKYTKFYYIDSNILYNPTKGKSINLSAAQFSMQQFDELVSDIQKRKDFCVYSTVFTSKNSDVKYYRYNINCIVNSNTQLLCNYINPLDNTYIKFTMNKLTTDVQIVINEKYNIINTVDVLNTIMSGLVLKPTSGNQFETNQRYSSSDTLIQLINKFIQNSGYNDFRIVHSPTTINFVFGTTINNSNPIVNVLSFASNLLVGAPVLRIYSKSIDFSEVATLTYAELNNTIRDGSWRSFELDLSNIGSGGSGYTLPIASATTLGGIKIPANGQMTIDKDGNLYPNAATSNSAGIVRPGVRSGLFMNDSSISVTLGRKDINLGTLTPGSTINGGRYYIYDDIVVGNASPKFKLNNNINSWEDPLAIIIVNRKNIGGMYFEGTNINMLTATNDCTKIGAIFIRYFQNGNENGYFVWAVPKAI
Physico‐chemical
properties
protein length:1393 AA
molecular weight: 156542,04990 Da
isoelectric point:4,92774
aromaticity:0,11055
hydropathy:-0,21522

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage uncultured phage cr17_1
[NCBI]
2986404 Uroviricota > Caudoviricetes > Crassvirales > Crudevirinae > Endlipuvirus
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
QWM90373.1 [NCBI]
Genbank nucleotide accession
MZ130488 [NCBI]
CDS location
range 80372 -> 84553
strand +
CDS
ATGGATAATAATAAAGATGCTGTTTATATACAGCAATTAAGAAAATATTGTAAAGATAATAAAAAATGGAATGAGATATTTCCTGTTACTTTTATTCAAGCTATATATAATGCCGCAAATGGAAATAGATTAGATACTTTGTTAGCAATGTATAATTCTATTTTTGTTGAATATAAAGGTAGTTTTGCTACTACTGTTGCGGCAATAGATAATATAGTTAGAAAAAAAGGTCTTATAATTACATATTTTGATGAAAATAATTTATCCTGGACTCGTAGATATAAACTTCATGATACTTCAGATATTAATTTTCAAAATGAAGATAATTGGGAAGGTTATAATTTTGATATTTTAGTAGATGAAATTTATAAAGCTATTAAATATATATTTACAAATATAGATAAATTTCCAGATTTAAAAAATGTATTAATTCAACAAATTACTGAAGTTACAGAAAATATATTTAATAATATTGAAGATTATACTAATTTATATAATATATTTAAAGAATTAATAAAAGAAAATATTAATAATGTATTTAATAATATAAATGATTATACTAATCTTAAAAATTTAATTAATACAAATATATATAATCGAGTAGATTATATATTTAATAATATAGATGATTTTAAAGTTTTATTAAATAAAATTAATGTAGCTATTTTAAATAGAGTAGATTATATATTTAATAATATAAATAATTACCCTGAATTAAAACAATTAATTATTAATAGTTTACAAGCTAAACAATTATTTACTATTGAATTTAGTGTTAATGGAGATACATTGGATATTATAAATAAAGATGAATTAAATTCTTATATAGAAAATAATAATGTTAATAATAATGCTTTATTTACATTTATAGGTAAATTTTTTGATTCTTCTAATAATAAATTATTATATAATTTAGTTTTTACAGCGTTTGTTAATATAAATAGTAATTATTTAAATTTAGATAATTGTTACGGCGAAACATTAATTATAAATAATGGAAAATTATATAAATGTAAAATTAATTTTAATATAAATACTGAAACTGAAATGAGTAATCCTAATTGGATTACTTATGCAAGAAAATATGACGATATTCCTACTTTTGAATTTAATTATATTTCTACAAATATTTATAGTATAGTCGATATAGATGATTATAATAAATATGTAAATTCTTTTAAATATAATACTTTAGTTAGATTTATATTTAATGAAAGTAGTACTATAATTAATGAATATATTGGATATATTAGTAAAGTAGGTTCTACTTTAAGAATATTAATTTATCTACAAGAAAGTAATGATTTTGTTTATGATACTATTATATCTGGTATTATTGAAAATAATGAATTACGCATTAGTAGATTAACTAATAGTGATATATTAACGTATTTATATAATGCTAATAGTTCAGGCGGTGTAGTTTTATTAGATGATAATACTTTGATTCCTTCTAAATTTTTACCTTCTTATATAGACGACGTAATAGATTTACTTGGAGGAATAGTAGAGTCTACTCCTACTTCTGGAATGACTGCTGGATATAAATATTATGTTACTTCTACTAAAAAAATATTTACTGCTTCTTCTGCTACATCTGGTATTACTTCTGATCCTATTTCAGATGTTATATATGTAGTTCCTGATGATATTAATGGAGCAATTATGTATCGTTGGAGTGGTACTACTTTAGTAGAAATTGTTAATGGTGGAATAGTAATTGGTACTACAACCGGTACTGCATTTGATGGAGCTCGTGGTTTGAATAATGAAAATATATTAAAAAGTGTTCCTAATAAACTAATTACTGATGTATCTGTAATTGCTCGAGGTCTTAACGATGATGTTATAATTCGTACTACTTATTCAGAAAGAACTAATAATGATGGTAGTTATGTAGCTAATAAATATAGAGACTATCAACTTCCAGAAGCTCAACAAGGAAGAGCTGGTCTAATGTCAACTTCTGATAAAGTTAAATTAGATAGTATATATAATGAATATATTATAAATGATGAAAATTTCTTTAGTGTTTCTCAAGGACAAGCGTTTACATTAACTACTTGGGGAAAATCTAATTTTAATGCTTTTAGAGATGCTATTTTAAACGGTAAACAAGTACAATTATATTTATCTTCTTATGAAGATGGAGCTGAAGCTAATATTAATGTTCCTTGTGAAGTAGCTGTTAATGCTAAAACTTTAATTATTACTTACGTTATTCCAGATTTATTAAAACAAGTTAAAGCTACTTTAACTATTAATGACAATAATAATAATGTTTCTTGTTCTATTACTAATGTAATAAATTTAACTGGAGTAGGATCTGGATTAACTATTGGTACTACATCTGGAACAGCTTTTGAAGGTAATAGAGGTTTACAAGCTGAAAAAGATATTGATAAACTTCAATCTTATACTAATAATGGAGTAGTATCCAATGTAGAAAGTAGTAGTAATAGTAGTGGAGAACTTAAAGTAACTCGTCGAATTAATTCTGGAGGGGCTATTGTTACTTCTGAACAATATATTGCTTTACCGCAATCAAGTTCTTCTAAAGCTGGTCTAATGTCAGCTAACGATAAAACTAAATTAGATAATATAATTATAATCAAACTTACAGGAACTGATTTAACTTCTGTAAATGAAGATACTGATATTAACTCTGTAAAAAATACAAATATTGATATAACTGAATTTGATGGTATATTAGAATCTCTTAATTCTGATAAAAATGTAAAGATATATATTAATGAATATAATGATGCTGTAAAACAAACTTTTAATATTAATTGTGATATTGCTTTTAATTATAATTCAAAAGAAATTTTTATACAATATGATATATATGATGTAAATAAAAGAATTTATGCAAGTTTATATAAAGATGGCGATAGAGTAAGTTTAGAAATTCTTGCTGTAAAAAATAAATATACTAAATTTTATTATATAGATTCTAATATTTTATATAATCCTACTAAAGGCAAAAGTATTAATTTATCAGCTGCTCAATTTAGTATGCAACAATTTGATGAATTAGTAAGTGATATTCAAAAGAGAAAGGATTTTTGTGTTTATAGCACAGTATTTACTTCTAAAAATAGCGATGTAAAATATTATAGATATAATATTAATTGTATTGTAAACTCTAATACTCAATTATTGTGTAATTATATTAATCCTTTAGATAACACTTATATAAAATTTACAATGAATAAACTTACAACAGATGTTCAAATTGTTATAAATGAAAAATATAATATTATAAATACTGTAGATGTATTAAATACTATTATGTCTGGATTAGTTTTAAAACCTACTTCAGGTAATCAATTTGAAACTAATCAAAGATATTCTTCTTCTGATACTTTAATTCAATTAATAAATAAATTTATACAAAATAGTGGATATAATGATTTTAGAATTGTTCATTCTCCAACTACTATAAATTTTGTATTTGGAACTACTATTAATAATTCAAATCCTATTGTAAATGTATTATCATTTGCGAGTAATTTACTTGTAGGAGCTCCTGTATTAAGAATTTATTCTAAATCAATTGATTTTAGTGAAGTAGCTACATTAACTTATGCAGAATTAAATAATACTATTAGAGATGGTAGTTGGCGATCATTTGAATTAGATTTATCTAATATAGGTTCTGGTGGTTCTGGCTATACGTTACCTATTGCTTCTGCAACTACTTTAGGAGGTATTAAAATACCTGCAAATGGACAAATGACTATTGATAAGGATGGAAATTTATATCCTAATGCTGCAACTTCTAATAGTGCAGGAATTGTTAGACCCGGTGTTAGAAGTGGATTATTTATGAATGATTCTTCTATTAGTGTTACTTTAGGAAGAAAAGATATAAATTTAGGAACTCTTACTCCTGGAAGCACTATTAATGGAGGACGCTATTATATATATGATGATATAGTTGTAGGAAATGCAAGTCCTAAATTTAAGTTAAACAATAATATTAATAGTTGGGAAGATCCTTTAGCTATTATTATTGTTAATAGAAAAAATATTGGAGGAATGTATTTTGAGGGCACTAATATAAATATGCTAACGGCTACTAATGATTGTACTAAAATTGGTGCTATTTTTATAAGATATTTTCAAAATGGTAATGAAAATGGATATTTTGTATGGGCGGTTCCTAAAGCAATATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
6a7d4d3178f77e62784a254cbac9fb31eda70017ab75db18b894ccb1b01aa529
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,4740
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50