Genbank accession
UIS65938.1 [GenBank]
Protein name
tail fiber
RBP type
TF
Evidence GenBank
Probability 1,00
TF
Evidence RBPdetect
Probability 0,75
Protein sequence
MTDKLIRELLIDVKQKGATRTAKSIENVSDALENAAAASELTNEQLGKMPKTLYSIERAADRAAKSLTKMQASRGMLSVTKSINDIGAKLDDLAIQLIEVTDKLEMGFDGVSRSVKAMGNDVAAATEKVQDRLYDTNRALGGTSRGFNDTAGAAGRASRAIGNTSGSARGATRDFAAMAKIGGGLPILYAAIASNIYVLQSAFEQLKLGDQLNRLEQFGVIVGTQTGTPVQSLARSLQEAAGYAISFEEAMRQASTASAYGFDNEQLEQFGLIARRAAAVLGVDMTDALNRVIKGISKQEIELMDELGITIRLNDAYADYVKQLNAANTGITYNINSLTTFQKQQAYAKAAIAESTKQFGYLDEVLRATPWEQFAANADAALRTIQQAAAKYLGPVVDAINTVFYISQASISAEAARAQEKTNKQIDPTNVGAVALSLSASEEGYNKALDMYRESLDKRNKLKAEFDKRMSQADASTAAAIRLVGEGMPVGLAAGGFEVGGVRIGSSEANKQFVAETAAMGLQVARLDKEVADSTENLNAWKSAFQTAGAAVAKANPEFQKQINLQKDATDPDAVYDFNSAALKGLVEQQKAYNQTKKTSGDLANDFQNIASSTDTAAKTSATFEEVIRNVESLSAGTGKSADEYVKSLNLGFNTLSEMKTASQALSEYVKLTGNETKNQLAVQQKIADVYNQTKDKEKAQEAGRHLELQQLEEREAALRRVLQTNQGNKAVEKEIEKVQLEKLKLTNQDMEAKKKVKDYTDKILGVDREIALLNDRTMTTTQYRLAQLRLELQLEQEKTELYSKQADGQAKAEQSRRAQAQISRELWEAEKQATASHVSALMDALEVSQTQRNVTGQSQILTERLSILQQQLELSKDNTEEEIKYRNEIYKTSAALEQLKKQREDQKYKSVVSSLGGTFTPTYGLSGADKEFADFENRMSMYDQAIAKMSEVDSASTALANSIGNFSLAVVANAQDSLDSITTISAGMQMVGQMMAYSANQQISAIDQAIAAEQKRDGKSEESKAKIKKLEAEKTKIQQREAKKQIIISTAVAMMNAAATRPFLPLGLTMMATAAAAGALSLASASSASSIPSVDSGANTTSYLTLGERQKNIDVSMSANAGELSYIRGDKGIGGANSFVPRAEGGNMYPGVSYQMGEHGTEVVTPMVPMKATPNDELKTSSNSTSGRPIILNISAMDAASFREFASSNSGALRDAVELALNENGASLKTLGNS
Physico‐chemical
properties
protein length:1235 AA
molecular weight: 133043,92850 Da
isoelectric point:5,49039
aromaticity:0,05263
hydropathy:-0,39255

Domains

Domains [InterPro]
Coil
Unmapped
524–544
UIS65938.1
1 1235
Architecture
TAS
STR
TAS
TAS 1-81 | STR 82-1197 | TAS 1198-1233 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage PNJ1902
[NCBI]
2880888 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Escherichia coli
[NCBI]
562 cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
UIS65938.1 [NCBI]
Genbank nucleotide accession
OK254197.1 [NCBI]
CDS location
range 11386 -> 15093
strand +
CDS
ATGACTGATAAGCTAATACGAGAATTACTAATAGACGTTAAACAGAAGGGGGCAACTCGTACTGCAAAGTCTATTGAAAACGTATCTGATGCGTTAGAAAACGCTGCTGCTGCTTCCGAACTGACAAATGAGCAGTTAGGTAAAATGCCCAAAACCCTTTACTCCATTGAGAGGGCAGCAGATAGAGCAGCAAAAAGTCTTACTAAAATGCAAGCAAGCCGAGGTATGCTTAGTGTTACTAAATCTATAAATGATATAGGGGCTAAGTTAGATGACCTTGCTATCCAACTTATTGAAGTAACAGATAAACTAGAGATGGGATTCGATGGAGTTTCTAGATCTGTTAAAGCAATGGGTAATGATGTTGCAGCTGCAACAGAGAAAGTTCAAGATAGATTATATGATACTAATAGAGCATTAGGTGGCACATCTAGGGGTTTTAATGATACTGCTGGTGCCGCTGGTAGAGCTTCTAGAGCTATTGGTAATACTTCTGGTTCAGCACGTGGCGCCACTCGTGATTTTGCAGCAATGGCTAAGATCGGTGGTGGTTTACCTATACTATATGCAGCTATTGCTTCCAACATCTACGTTTTACAATCTGCATTCGAACAACTTAAACTAGGTGATCAGCTAAACAGATTGGAACAGTTTGGTGTTATAGTAGGTACTCAGACAGGTACTCCTGTTCAGTCCCTTGCTAGATCGCTACAAGAAGCTGCTGGATATGCAATCTCTTTTGAAGAAGCTATGCGTCAAGCATCTACTGCCTCCGCTTATGGATTTGACAATGAACAACTGGAGCAGTTTGGTTTGATAGCACGTCGTGCGGCTGCTGTTCTTGGTGTTGATATGACTGATGCACTTAACCGTGTAATTAAGGGTATATCTAAACAAGAAATCGAACTTATGGATGAACTTGGTATTACTATTCGTCTTAACGATGCTTATGCTGACTATGTTAAACAGCTAAATGCTGCTAACACGGGTATAACTTATAACATTAATAGTCTTACTACTTTCCAGAAACAGCAGGCATACGCTAAGGCTGCTATAGCAGAATCTACTAAACAATTCGGGTATCTAGATGAAGTTCTGCGTGCTACTCCGTGGGAGCAGTTTGCTGCTAACGCAGATGCTGCACTAAGAACAATACAACAAGCTGCTGCTAAGTATTTAGGGCCAGTAGTCGATGCCATCAATACGGTATTCTATATATCTCAGGCTTCTATATCTGCTGAAGCAGCTAGAGCTCAAGAAAAAACTAATAAACAGATAGATCCTACCAACGTTGGTGCTGTTGCTTTAAGTTTATCTGCTTCTGAAGAGGGGTATAATAAAGCTCTGGATATGTATAGAGAGTCTCTGGATAAACGTAACAAACTAAAGGCCGAGTTTGATAAACGTATGTCCCAAGCAGATGCTAGTACTGCAGCCGCTATTAGATTGGTGGGTGAGGGAATGCCTGTTGGGTTAGCTGCTGGAGGATTTGAAGTAGGAGGAGTGCGCATAGGTTCTTCCGAAGCTAACAAACAATTTGTAGCAGAAACTGCCGCTATGGGACTACAAGTAGCACGCTTAGATAAAGAAGTTGCAGATTCTACTGAAAACCTTAATGCTTGGAAATCAGCGTTTCAAACTGCCGGAGCTGCTGTTGCAAAAGCTAATCCAGAGTTCCAGAAACAGATTAATCTACAGAAAGATGCTACGGATCCTGATGCTGTATATGACTTTAACTCTGCTGCTCTAAAGGGTCTAGTAGAGCAACAAAAAGCATATAATCAAACTAAGAAAACTTCTGGTGATTTAGCTAATGACTTTCAAAATATAGCTAGTAGCACAGATACTGCTGCTAAAACTAGTGCAACTTTTGAAGAGGTAATTAGAAATGTAGAATCTCTCTCCGCAGGAACTGGTAAGAGTGCTGATGAGTACGTTAAAAGTCTCAACTTAGGGTTTAACACTCTATCTGAAATGAAAACTGCATCCCAGGCGCTATCTGAATACGTTAAATTAACTGGTAATGAAACTAAAAATCAGTTAGCAGTCCAACAGAAGATAGCTGACGTATACAACCAAACTAAAGATAAAGAAAAGGCACAGGAAGCCGGTAGGCATTTAGAACTCCAACAGTTAGAAGAGCGAGAAGCTGCTTTACGCCGTGTTCTTCAAACAAACCAGGGAAATAAAGCTGTTGAGAAAGAAATTGAAAAAGTTCAGCTGGAGAAACTTAAACTTACTAACCAGGATATGGAAGCTAAGAAGAAAGTTAAGGACTATACGGATAAAATTCTTGGTGTTGATCGTGAGATAGCTCTTCTGAATGACCGTACTATGACTACTACTCAGTATCGTTTGGCGCAGTTAAGACTAGAGCTACAGTTAGAGCAGGAAAAAACGGAATTATACTCTAAACAAGCGGATGGCCAAGCTAAAGCAGAACAGTCTAGACGTGCTCAAGCGCAAATAAGTAGAGAACTATGGGAAGCGGAGAAACAAGCTACTGCCTCGCATGTGTCAGCTCTCATGGATGCCTTAGAGGTTAGCCAAACGCAGAGAAATGTCACTGGTCAGTCCCAGATTCTCACTGAAAGGTTATCTATTCTGCAGCAACAGCTGGAGCTATCTAAAGATAATACTGAAGAAGAAATTAAATATCGTAATGAGATTTATAAAACTTCAGCAGCCTTAGAACAGCTTAAAAAGCAAAGAGAGGATCAAAAGTACAAATCAGTCGTATCCTCACTAGGGGGTACCTTCACTCCTACCTATGGATTATCTGGTGCTGATAAGGAGTTTGCTGATTTTGAGAATAGAATGTCTATGTATGATCAGGCTATAGCTAAGATGTCAGAAGTAGATTCTGCTTCTACAGCACTGGCTAACAGCATAGGTAATTTCTCCTTAGCAGTGGTGGCTAATGCACAAGATAGCTTGGATAGTATAACAACCATATCTGCAGGTATGCAGATGGTGGGACAGATGATGGCATATTCCGCTAACCAGCAAATAAGTGCAATAGACCAGGCTATTGCAGCAGAACAGAAGCGTGATGGTAAATCTGAGGAATCTAAAGCTAAAATCAAGAAGTTGGAGGCAGAAAAGACTAAGATACAGCAGCGAGAAGCTAAAAAGCAAATAATCATATCTACAGCCGTAGCTATGATGAACGCTGCAGCTACCCGTCCGTTCTTACCATTAGGGTTAACGATGATGGCCACTGCGGCTGCTGCAGGTGCACTATCCTTAGCCTCTGCTTCTAGTGCATCCTCTATACCCTCTGTGGATTCTGGAGCAAATACAACTAGTTACTTAACCTTAGGAGAGCGCCAAAAGAATATAGATGTGTCTATGTCTGCTAATGCTGGTGAATTATCTTATATTCGTGGCGATAAAGGCATAGGCGGTGCTAACTCTTTCGTTCCTCGTGCTGAGGGTGGTAATATGTACCCTGGGGTTAGCTATCAAATGGGTGAACATGGTACAGAAGTAGTTACCCCTATGGTTCCTATGAAAGCTACACCTAATGATGAGCTAAAAACTTCATCTAACTCAACTTCAGGAAGACCTATCATCCTGAATATTAGTGCTATGGATGCTGCAAGTTTTAGAGAGTTTGCTTCTAGTAATAGTGGTGCTCTAAGAGACGCAGTAGAATTAGCTCTGAATGAGAACGGTGCTAGTCTGAAAACATTGGGAAATTCTTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
3fb889f40f12f250e8c8c6ff29add15d735120c0446e08e4bd80a0d968d1a719
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,6259
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50