Genbank accession
UGL60107.1 [GenBank]
Protein name
long tail fiber distal subunit
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,74
TF
Evidence RBPdetect2
Probability 0,95
TF
Evidence GenBank
Probability 1,00
Protein sequence
MATLKQIQFKRSKVAGVRPAPTVLAEGELAINLKDRLLFTKDDTGAIIDLGFAKGGNIDGNVIHKGNYNQTGAYTIAGDISQTSGHFTTTGNITANGDITAKARLMTDNGEVLVRGTGTTHVRFQDLADARERGIIYSQNRTGDTKQILNVRVQDYTNSTSNIFAFNGDGLFYAPSISGGTSIKSPVIYTNTVDTGNKSALDYDISSLANNNPASSSATSINYLRISRHAVDGIRYRELNNVNGISWHSISTAGTAKYLWSFNADGDVKTSNSLSVGLPGDSSGYSTLGPSAIALGDNNTGLKWRQDGQFHIVNNGAYTLLTTPTEVTSLKQLVAGYSTNGSDLILPTAQNYPLVIVNTTNDKNGFGDGQTLLGYHQSGKYHHYFRGKGVTNVNTDGGLLVTPGNVEVRGGSVNIDGLSNASTVLFKGNTTGSSSVDNIELKVWGDTFNTVDGSRKNVMETSDATGWMHYIQRTTAGKVESYLNGTMNVIEGLTVNQDTSLKRNLYVSNEIKVRAASGLRIWNDKYGVIFRNSEDQLHIIPTNVNAGESGGLGPLRPLSITLDTGQVKIPNLAADQVSFIANSVLEFPAGNGASYANQNTTKAPLYQTLGAATQAFYPITKQKNTVSNVTITQGMDRATSEYRIVAQGDLLGDGDATGLKYWRFTKEGNFMAQNRLYAGTAYMNTDGNIAGSIWKKYSGATNLDAAVNTRVGKSGDTMTGRLTLNANSDAIVINSAATESGYMKGQKAGIDNWYVGNGGADNAVSIYSFQTNSGVNINADGDIALNPQGSATFNFNRDRLFINGSVWASHQAGDWGNQWKQEAPVFVDFGNVGNDSYYPIIKGKSGITNEGFISGVDFGMRRITNNWAQGIIRVGNQENGSDPQAIYEFHHNGVLYVPNMVKTGARLSAGGGDPVWTGPCLVIGDNDTGLVHGGDGRINMVANGAHIASWSSSYHIHEGLWDTHGALWTETGRAIISFGHLVQQSDAYSTYVRDVYVRSDIRVKKDLVKFENASQKLSKINGYTYMQKRGLDEEGNQKWEPNAGLIAQEVQSILPELVEGDPDGEALLRLNYNGVIGLNTAAINEHTAEIAELKSEIEELKALIKSLLK
Physico‐chemical
properties
protein length:1109 AA
molecular weight: 119340,04390 Da
isoelectric point:6,12312
aromaticity:0,08296
hydropathy:-0,35681

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage vB_EcoM_RZ
[NCBI]
2893954 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
UGL60107.1 [NCBI]
Genbank nucleotide accession
MW598459 [NCBI]
CDS location
range 166326 -> 169655
strand +
CDS
ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGTAAGGTTGCCGGCGTTCGTCCGGCGCCAACAGTTCTTGCTGAAGGTGAACTGGCTATCAACCTGAAAGACCGCTTACTTTTTACTAAAGATGACACCGGCGCCATCATCGACCTTGGCTTTGCTAAAGGTGGTAATATTGACGGTAACGTTATTCATAAAGGAAATTACAATCAAACCGGCGCCTATACTATAGCCGGAGATATTTCACAAACGTCTGGACATTTTACTACTACTGGTAATATAACAGCAAATGGTGATATTACTGCAAAAGCCCGTTTAATGACAGATAACGGTGAAGTTCTTGTACGAGGTACAGGAACCACTCATGTTCGATTCCAGGATTTGGCTGATGCTCGCGAAAGAGGTATAATTTATTCTCAAAACCGTACTGGGGATACCAAGCAAATCTTGAACGTTCGTGTCCAGGATTATACTAATTCAACATCTAATATTTTTGCATTCAACGGTGACGGTTTATTTTATGCTCCATCTATTTCCGGTGGAACATCAATAAAATCTCCGGTAATTTATACTAATACCGTTGATACCGGTAATAAATCAGCTCTTGATTATGATATATCTTCATTGGCAAATAATAATCCTGCAAGTTCAAGTGCAACATCTATTAACTATCTTAGAATAAGTAGACATGCTGTCGATGGAATTAGGTATCGTGAACTTAATAATGTAAATGGTATTTCATGGCATTCTATTTCTACAGCCGGAACAGCTAAGTATCTTTGGTCATTTAATGCAGATGGAGATGTCAAAACATCAAATTCTCTTTCCGTTGGCCTACCTGGGGATAGCTCAGGATACTCAACATTAGGTCCGTCTGCTATCGCACTTGGCGACAATAACACAGGTTTGAAATGGAGACAAGACGGCCAGTTCCATATAGTTAATAATGGAGCTTATACTTTACTTACAACTCCGACTGAAGTTACAAGCCTTAAACAGTTAGTTGCGGGTTATTCAACCAACGGTTCTGATTTAATTCTCCCTACAGCCCAAAACTATCCATTAGTTATTGTTAATACTACTAATGATAAAAACGGCTTCGGTGACGGTCAAACTCTTTTAGGATATCACCAAAGCGGCAAATATCACCATTATTTTCGTGGCAAAGGTGTAACAAACGTTAACACCGATGGTGGGTTGTTGGTTACTCCTGGTAACGTTGAAGTCCGTGGTGGTTCGGTTAATATTGATGGTCTCAGTAATGCTTCGACAGTGCTTTTTAAAGGAAATACAACAGGAAGTAGTTCAGTTGATAATATAGAGCTCAAAGTTTGGGGTGACACTTTTAATACGGTAGATGGTTCTCGTAAAAACGTAATGGAAACATCTGATGCTACCGGCTGGATGCATTATATTCAACGAACTACAGCAGGTAAAGTCGAATCCTATTTAAATGGTACCATGAATGTAATTGAAGGATTGACTGTCAATCAAGATACATCCTTAAAACGCAATCTGTATGTTTCCAATGAAATTAAAGTTCGCGCTGCTAGTGGTCTTCGTATTTGGAACGATAAGTACGGTGTTATTTTTCGAAATTCGGAAGACCAGCTGCATATTATCCCGACCAATGTTAATGCCGGCGAAAGTGGCGGATTAGGCCCATTACGCCCATTAAGTATTACGTTAGACACTGGTCAAGTTAAAATCCCTAATTTAGCGGCTGACCAAGTTTCTTTTATTGCTAACAGCGTATTAGAATTCCCTGCTGGTAATGGTGCATCTTATGCCAACCAGAATACGACTAAAGCTCCGTTGTATCAAACACTTGGTGCAGCAACCCAAGCATTCTATCCAATTACCAAGCAGAAAAATACAGTTTCTAATGTAACTATTACTCAAGGTATGGACCGCGCTACAAGCGAATACCGAATTGTTGCTCAAGGCGATTTGCTTGGTGATGGTGATGCTACAGGATTAAAATATTGGCGCTTTACCAAAGAAGGTAACTTCATGGCTCAGAACCGCTTATATGCCGGTACAGCTTATATGAATACCGATGGTAATATTGCAGGTTCTATTTGGAAAAAGTATAGCGGTGCTACTAACCTTGATGCAGCAGTGAATACTCGTGTCGGTAAAAGTGGTGACACAATGACCGGGCGTTTAACTCTTAATGCAAACTCGGATGCTATTGTTATTAACAGTGCTGCAACCGAATCTGGTTATATGAAAGGACAAAAAGCTGGTATTGATAACTGGTATGTAGGTAACGGCGGTGCCGATAATGCTGTATCAATTTATAGTTTTCAAACTAATTCAGGCGTAAATATTAATGCAGACGGCGATATTGCTTTAAACCCACAAGGTTCAGCCACTTTTAATTTTAATAGGGACCGTCTTTTTATTAATGGCTCTGTCTGGGCATCCCACCAGGCTGGCGATTGGGGAAACCAATGGAAGCAAGAAGCACCGGTATTTGTTGATTTTGGTAATGTTGGTAATGATAGTTATTATCCGATTATCAAAGGAAAATCTGGTATTACTAACGAAGGATTCATATCAGGTGTAGATTTCGGTATGCGTCGTATCACTAATAACTGGGCGCAAGGTATTATTCGTGTAGGTAACCAGGAAAACGGTTCTGACCCACAAGCTATCTATGAATTCCACCACAATGGAGTTCTGTATGTTCCTAACATGGTTAAAACTGGAGCAAGATTATCAGCTGGTGGTGGTGACCCTGTATGGACCGGTCCGTGTCTTGTTATTGGTGATAATGATACAGGATTAGTTCATGGTGGTGACGGCCGAATCAATATGGTTGCAAATGGTGCACATATTGCATCTTGGTCTAGCTCTTACCATATCCATGAAGGTCTTTGGGATACTCATGGTGCTTTGTGGACTGAAACAGGAAGAGCTATTATTTCTTTTGGTCATTTAGTCCAACAAAGTGATGCCTATTCTACATATGTTCGAGATGTTTATGTCCGTTCTGATATTCGTGTTAAAAAAGACCTTGTTAAATTTGAAAATGCTTCTCAGAAGCTTTCTAAAATTAACGGTTACACTTATATGCAGAAACGTGGCCTGGATGAAGAAGGTAATCAGAAATGGGAACCTAACGCTGGTTTAATTGCTCAAGAAGTTCAATCTATTTTACCTGAATTGGTTGAAGGCGACCCTGATGGCGAAGCTTTACTTCGTTTGAACTATAACGGTGTAATTGGTTTAAATACAGCTGCAATCAATGAGCATACTGCAGAAATTGCAGAACTTAAGTCAGAGATTGAAGAACTTAAAGCATTAATTAAATCATTGTTAAAATAA

Tertiary structure

PDB ID
aa07405728087bf7d5db070cdc81d0df47d823b50ea82f1a792c5ef288ccdeaa
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,5236
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50