Protein
View in Explore- Genbank accession
- WEW54170.1 [GenBank]
- Protein name
- putative long tail fiber proximal subunit
- RBP type
-
TFTF
- Protein sequence
-
MADIKRKFRAEDGLDAGGDKIVNVALADRTVGTDGVNVDFLVQENTVQVYDSTRGYNKGFVVLYDNRLYQAINDIVSPSGAFNLLQWRAVRTDAQWITVASGTCQLSSGESISVNTGAGNDMVFTLPNTPVDGDTVVLADIGGRTGTVKVQINASVQSILNFRGEQVRTVLMTRPRSQLLFVFSNRLWQMYITDYGKESITVTPATPYQAQANDFIVRRFTSAAPINITLPRNANNGDIISLVDLDRLNPLYHTIVKTFDDTTSIGEVGTHIAEGRNDSDAFFVFDAANSLWRIWEGDQKSRLRIIRADSNIRPNEEVLIFGTNNATTGTINLTLPTGILSGDTVKISMNYMRKGQTVKIKAAEGDTIASTVALLQFPKRSEYPPDAQWVSVTELEFNGTTSYVPVLELAYIEDTVAGTRYWVVQQNVPTVERVDAGTDATRARLGVIALATQAQANVDLENTPAKEVAITPETLANRTATEARRGIAKIATTAQVNQNSTATFVDDTIVTPKKLNERTATETRRGLAEIATQVETDAGLDDTTIITPKKLQARQGSETLSGIVKYVSTTSATPAATRGAAGTNVYNKDTTTLTISPKALDQYKATYAQQGAVILAVDSEVIAGQSQAGYSHAVVTPETLHKKTSTDGRIGLIEIATQAETNAGTDYTRAVTPKTLNDRKATEGLSGIAELATQVEFDTGTDDTRISTPLKIKTHFDSSDRTSVNSDSGLIEEGTLWNHYTLDISKANETQRGTLRVATQAESNAGTLDDVLITPKKLLGTKSTETSEGVIKVATRAETVTGTSANTAVSPKNLKWIVQSEPTWAATTAIRGFVKTSSGSITFVGNDTVGSTQPLESYEKNSYAISPYELNRVLANYLPLKAKAVDSNLLDGLDSSQFIRRDIAQTVNGSLTLTQQTNLSAPLVSSSTATFGGSVSANSTLTISNTGTATRLIFEKGPQTGTNPAQTMTIRVWGNEFGGGSDTTRSTVFEVGDETSNHFYSQRNKAGNITFSINGTVMPINVNASGTLNANGVATFGRSVTANGEFISKSANAFRVISGDYGFFIRNDGGSTYFMLTASGDQTGGFNGLRPLSINNKSGQITIGEGLIIANGATINSGGLTVNSRIRSQGTKTSDLYTRAPTSDNVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGALPSDNATIGNLTIRDFLRIGNVRIIPDPVNKSVKFEWIE
- Physico‐chemical
properties -
protein length: 1291 AA molecular weight: 139369,52830 Da isoelectric point: 5,43491 aromaticity: 0,07281 hydropathy: -0,30496
Domains
Domains [InterPro]
DC_1986
ATT
15–140
ATT
15–140
IPR048390
ATT
981–1094
ATT
981–1094
DC_1209
STR
1001–1274
STR
1001–1274
1
1291
Architecture
ATT 15-140 | STR 343-980 | ATT 981-1094 | STR 1095-1140 | ATT 1141-1239 | STR 1240-1274 |
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage 55 [NCBI] |
3018029 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host |
Escherichia coli BW25113 [NCBI] |
679895 | Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Escherichia > Escherichia coli |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
WEW54170.1
[NCBI]
Genbank nucleotide accession
OQ599310
[NCBI]
CDS location
range 76816 -> 80691
strand -
strand -
CDS
ATGGCCGACATCAAACGTAAGTTCAGAGCCGAAGACGGTCTGGACGCCGGTGGCGACAAGATTGTTAACGTAGCATTAGCCGACCGTACAGTAGGTACTGATGGCGTAAACGTTGACTTCCTGGTACAAGAAAACACCGTTCAAGTATATGATTCTACGCGTGGATATAACAAAGGATTTGTTGTTCTTTATGACAACCGTTTATATCAAGCAATAAATGATATCGTGTCTCCTTCCGGGGCATTTAACCTTTTACAATGGCGTGCAGTTCGTACTGATGCACAATGGATAACTGTCGCTTCTGGGACTTGTCAACTTTCTTCAGGTGAATCGATTTCGGTTAACACTGGTGCCGGCAATGATATGGTTTTTACATTGCCAAATACTCCAGTTGATGGTGATACTGTTGTTTTGGCTGATATTGGTGGACGAACCGGGACAGTTAAAGTACAGATTAACGCGTCTGTACAGAGTATTTTAAACTTTAGAGGTGAACAAGTTCGTACGGTTTTAATGACGCGCCCACGTTCACAACTATTGTTTGTGTTTAGTAATCGTTTGTGGCAGATGTATATTACCGATTATGGTAAAGAATCAATCACTGTTACACCTGCGACACCATATCAAGCACAAGCAAATGATTTTATCGTTCGTCGTTTTACTAGTGCAGCACCAATCAACATTACACTTCCACGTAATGCTAACAATGGTGATATAATCAGCCTAGTCGATTTAGATAGATTAAACCCACTGTATCATACAATTGTTAAAACATTTGATGATACAACGTCTATTGGTGAAGTCGGGACTCATATTGCCGAAGGCAGAAATGACTCTGACGCGTTTTTTGTTTTTGATGCTGCAAATAGTTTATGGCGTATATGGGAAGGCGACCAGAAATCGCGTCTTCGTATTATCCGTGCGGATTCAAATATTCGTCCAAATGAAGAAGTTCTTATCTTTGGCACAAATAACGCTACAACCGGAACTATTAATCTTACGCTGCCTACCGGAATTTTGAGTGGTGACACTGTTAAAATTTCAATGAACTACATGCGTAAAGGCCAAACAGTAAAAATTAAAGCTGCCGAAGGTGATACAATTGCTTCCACTGTTGCATTGCTTCAGTTCCCTAAACGTTCTGAATATCCACCTGATGCTCAATGGGTCTCTGTTACTGAACTAGAATTCAATGGCACTACTTCATATGTTCCTGTATTAGAATTAGCGTATATCGAAGACACCGTTGCTGGTACACGTTATTGGGTTGTGCAACAGAATGTCCCTACGGTAGAACGTGTTGATGCTGGAACTGATGCTACACGAGCTCGTTTAGGTGTTATTGCTCTTGCTACTCAAGCGCAAGCAAATGTTGATTTAGAGAATACTCCAGCTAAAGAAGTGGCTATTACTCCTGAAACATTGGCAAATCGTACAGCAACTGAAGCTCGACGTGGTATCGCTAAAATTGCTACAACAGCACAAGTTAACCAGAATTCCACAGCAACATTTGTAGATGATACTATTGTTACGCCTAAAAAACTAAATGAGCGTACAGCAACTGAAACTCGTCGCGGTCTTGCTGAAATTGCTACTCAGGTTGAAACAGATGCTGGTCTTGATGACACAACGATTATTACACCTAAGAAATTACAGGCACGTCAGGGTTCTGAAACACTATCTGGTATAGTTAAATATGTATCAACTACTTCTGCTACACCTGCCGCGACTCGTGGAGCTGCAGGCACTAATGTTTATAATAAAGACACAACCACGTTAACTATTTCTCCTAAAGCCCTTGACCAATATAAAGCAACTTATGCTCAACAAGGTGCAGTAATTTTAGCTGTTGATAGTGAAGTAATTGCTGGTCAATCACAAGCAGGTTATTCTCACGCTGTAGTAACTCCTGAAACACTACATAAGAAAACTTCTACTGATGGACGTATTGGTTTAATTGAAATTGCTACGCAAGCAGAAACTAATGCTGGGACTGATTATACACGTGCAGTAACGCCTAAGACATTAAATGATAGGAAAGCTACGGAAGGATTATCCGGCATAGCCGAACTTGCTACGCAAGTTGAATTTGATACTGGAACTGACGATACTCGTATCTCAACTCCACTGAAAATTAAAACTCATTTTGATTCTTCTGACCGTACCAGTGTTAATTCTGATTCCGGACTTATTGAAGAAGGAACCTTGTGGAACCATTATACTCTTGATATTTCTAAAGCAAATGAAACACAACGTGGTACGCTTCGCGTAGCGACCCAGGCAGAATCTAATGCAGGAACTTTAGATGATGTTCTTATTACTCCTAAAAAGCTTTTAGGGACTAAGTCCACTGAAACGTCTGAAGGCGTAATTAAGGTTGCTACTCGGGCTGAAACTGTAACAGGAACTTCTGCTAATACTGCTGTATCTCCTAAGAATTTAAAATGGATTGTCCAGTCTGAACCAACATGGGCTGCTACTACGGCGATTCGTGGATTCGTTAAAACTTCATCTGGTTCTATTACATTCGTTGGTAATGATACAGTTGGTTCAACACAACCTTTAGAATCATATGAAAAAAATAGCTATGCTATATCTCCATATGAATTAAACCGTGTACTTGCTAACTATTTGCCATTGAAAGCTAAAGCCGTAGATAGTAATTTATTAGATGGTCTAGATTCATCTCAGTTCATTCGTAGGGACATTGCACAGACGGTTAATGGTTCACTAACCTTAACCCAACAAACGAATCTGAGTGCCCCTCTTGTATCATCTAGTACTGCTACGTTTGGTGGTTCAGTTTCGGCAAATAGTACATTAACTATTTCTAATACTGGAACGGCAACTCGTCTGATTTTTGAGAAAGGACCTCAAACTGGAACAAATCCTGCTCAAACGATGACTATCAGAGTTTGGGGAAATGAATTTGGTGGTGGTTCAGATACAACGCGTTCTACTGTATTTGAAGTCGGCGATGAAACATCTAATCACTTTTATTCTCAACGTAATAAAGCTGGGAATATAACGTTTAGTATCAATGGTACTGTGATGCCAATAAATGTTAACGCTTCAGGCACGTTAAATGCGAATGGCGTTGCAACATTTGGTCGTTCAGTTACAGCCAATGGTGAATTCATTAGCAAGTCTGCAAATGCTTTCAGAGTAATTAGTGGTGATTACGGATTCTTTATTCGCAATGATGGCGGCAGCACATATTTTATGCTTACTGCATCTGGTGATCAGACTGGTGGATTTAATGGATTACGTCCATTATCAATTAATAACAAATCCGGTCAGATTACAATTGGTGAAGGCTTAATCATTGCCAATGGTGCTACTATAAATTCTGGCGGTTTGACTGTTAACTCGAGAATTCGTTCTCAGGGTACTAAAACATCCGATTTATATACCCGTGCGCCAACATCTGATAATGTAGGATTCTGGTCAATCGATATTAACGATTCAGCCACTTATAACCAGTTCCCGGGTTATTTTAAAATGGTTGAAAAAACTAATGAAGTGACTGGGCTTCCATATTTAGAACGTGGTGAAGAAGTTAAATCTCCTGGTACTTTGACTCAATTTGGTAATACGCTTGATTCTCTTTACCAAGATTGGATTACTTATCCAACGACACCGGAAGCACGTACAACCCGTTGGACTCGTACATGGCAGAAAACTAAAAATTCTTGGTCAAGTTTTGTTCAGGTATTTGATGGTGGAAACCCTCCTCAACCTTCTGATATTGGTGCTTTACCTTCTGATAATGCAACAATCGGAAACTTGACAATAAGGGATTTCTTAAGGATTGGTAATGTCCGCATTATTCCAGACCCTGTGAATAAATCTGTTAAATTTGAGTGGATTGAATAA
Genome Context
Genome Context
Tertiary structure
PDB ID
6760d1081c6de9cc81e4bda82a6eafc3128e3df3d2f39fbb2fcb094a4f7db7df
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| Complete Genome Assembly and Annotation of Escherichia coli Bacteriophage 55 | Burmeister,A.R. | — | — | GenBank |