Protein
View in Explore- Genbank accession
- WPK28662.1 [GenBank]
- Protein name
- long tail fiber
- RBP type
-
TFTFTF
- Protein sequence
-
MADIKRKFRAEDGLDAGGDKIVNVALADRTVGTDGVNVDFLVQENTVQVYDSTRGYNKGFVVLYDNRLYQAINDIVSPSGAFNLLQWRAVRTDAQWITVASGTYQLSSGESISVNTGAGNDMVFTLPNTPVDGDTVVLADIGGRTGTVKVQINASVQSILNFRGEQVRTVLMTRPRSQLLFVFSNRLWQMYITDYGKESITVTPATPYQAQANDFIVRRFTSAAPINITLPRNANNGDIITLVDLDKLNPLYHTIVKTFDDTTSIGEVGTHIAEGRNDSDAFFVFDASNSLWRIWEGDQKSRLRIIRADSNIRPNEEVLIFGTNNATAGTINLTLPSGILSGDTVKISMNYMRKGQTVKIKAAEGDTIASSVALLQFPKRSEYPPDAQWVSVTELEFNGTTSYVPVLELAYIEDTVAGTRYWVVQQNVPTVERVDAGTDATRARVGVIALATQAQANVDLENTPAKEVAITPETLANRTATESRRGIAKIATTAQVNQNSTATFVDDTIVTPKKLNERTATETRRGLAEIATQAETDAGLDDTTIITPKKLQARQGSETLSGIVKYVSTTSATPAETRGAAGTNVYNKTVNNLTISPKALDQYKATYAQQGAVILAVDSEVIAGQSQAGYSHAVVTPETLHKKTSTDGRIGLIEIATQTETNAGTDYTRAVTPKTLNDRKATEGLSGIAELATQVEFDTGTDDTRISTPLKIKTHFDSSDRTSVNSDSGLIEEGTLWNHYTLDISKANETQRGTLRVATQAESNAGTLDDVLITPKKLLGTKSTETSEGVIKVATRAETVIGTSANTAVSPKNLKWIVQNEPTWAATTAIRGFVKTSSGSITFVGNDTVGSTQPLESYEKNSYAISPYELNRVLANYLPLKAKAVDSNLLDGLDSSQFIRRDIAQTVNGSLTLTQQTNLSAPLVSSSTATFGGSVSANSTLTISNTGTATRLIFEKGPQTGTNPAQTMTIRVWGNQFGGGSDTTRSTVFEVGDETSNHFYSQRNKDGNIAFSINGTVMPINVNASGTLNANGVATFGRSVTANGEFISKSANAFRAISGDYGFFIRNDGGSTYFMLTASGDQTGGFNGLRPLSINNQSGQITIGEGLIIAKGATINSDGLTVNSRIRSQGTKTSDLYTRAPTSDTVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGALPSDNATIGNLTIRDFLRIGNVRIIPDPVNKSVKFEWIE
- Physico‐chemical
properties -
protein length: 1291 AA molecular weight: 139528,60340 Da isoelectric point: 5,39109 aromaticity: 0,07359 hydropathy: -0,31789
Domains
Domains [InterPro]
DC_1946
ATT
1–203
ATT
1–203
IPR048390
ATT
981–1094
ATT
981–1094
DC_1209
STR
1000–1275
STR
1000–1275
1
1291
Architecture
ATT 1-203 | STR 343-980 | ATT 981-1094 | STR 1095-1140 | ATT 1141-1239 | STR 1240-1275 |
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Escherichia phage vB_EcoM_EP32a [NCBI] |
3090671 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host | No host information | ||
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
WPK28662.1
[NCBI]
Genbank nucleotide accession
OR544954.1
[NCBI]
CDS location
range 29142 -> 33017
strand -
strand -
CDS
ATGGCCGACATCAAACGTAAGTTCAGAGCCGAAGACGGTCTGGACGCCGGTGGCGACAAGATTGTTAACGTAGCATTAGCCGACCGTACAGTAGGTACTGATGGCGTAAACGTTGACTTCCTGGTACAAGAAAACACCGTTCAAGTATATGATTCTACGCGTGGATATAACAAAGGATTTGTTGTTCTTTATGACAACCGTTTATATCAAGCAATAAATGATATCGTGTCTCCTTCCGGGGCATTTAACCTTTTACAATGGCGTGCAGTTCGTACTGATGCACAATGGATAACTGTCGCTTCTGGGACTTATCAACTTTCTTCAGGCGAATCGATTTCGGTTAACACTGGTGCCGGCAATGATATGGTTTTCACATTGCCAAATACGCCGGTTGATGGTGATACTGTTGTTTTGGCTGATATTGGTGGAAGAACCGGGACAGTTAAAGTACAGATTAACGCGTCTGTGCAAAGTATTTTAAACTTTAGAGGTGAACAAGTTCGTACAGTTTTAATGACGCGTCCACGTTCACAACTATTGTTTGTGTTTAGTAATCGTTTGTGGCAGATGTATATTACTGATTATGGTAAAGAATCAATCACTGTTACACCTGCGACACCATATCAAGCACAAGCAAATGATTTTATCGTTCGTCGTTTTACTAGTGCAGCACCAATCAACATTACACTTCCACGTAATGCTAACAATGGCGATATAATCACCCTAGTCGATTTAGATAAATTAAACCCACTGTATCATACAATTGTTAAAACATTTGATGATACAACGTCTATTGGTGAAGTCGGGACTCATATTGCCGAAGGCAGAAATGACTCTGACGCGTTTTTTGTTTTTGATGCTTCAAATAGTTTATGGCGTATATGGGAAGGCGACCAGAAATCGCGTCTTCGTATTATCCGTGCGGATTCAAATATTCGTCCAAATGAAGAAGTTCTTATTTTTGGCACAAATAACGCTACAGCCGGAACTATTAATCTTACGCTGCCTTCCGGAATTTTGAGTGGTGACACTGTTAAAATTTCAATGAACTACATGCGTAAAGGCCAAACAGTAAAAATTAAAGCTGCCGAAGGTGATACAATTGCTTCTTCTGTTGCATTGCTTCAGTTCCCTAAACGTTCTGAATATCCACCTGATGCTCAATGGGTCTCTGTTACTGAACTAGAATTCAATGGCACTACTTCATATGTTCCTGTATTAGAATTAGCGTATATCGAAGACACCGTTGCTGGTACACGTTATTGGGTTGTGCAACAGAATGTCCCTACGGTAGAACGTGTTGATGCTGGAACTGATGCTACACGAGCTCGTGTAGGTGTTATTGCTCTTGCTACTCAAGCGCAAGCAAATGTTGATTTAGAGAATACTCCAGCTAAAGAAGTTGCTATTACTCCTGAAACGTTGGCAAATCGTACAGCAACTGAATCTCGACGTGGTATCGCCAAAATTGCTACAACAGCGCAAGTTAACCAGAATTCCACAGCAACATTTGTGGACGATACTATTGTTACGCCTAAAAAACTAAATGAGCGTACAGCAACTGAAACTCGTCGTGGTCTTGCTGAAATTGCTACTCAGGCTGAAACTGATGCTGGTCTTGATGACACAACGATTATTACACCTAAGAAATTGCAGGCACGTCAGGGTTCTGAAACACTATCTGGTATAGTTAAATATGTATCAACTACTTCTGCTACTCCTGCTGAAACTCGTGGGGCCGCAGGCACTAACGTTTATAATAAAACCGTAAATAATTTAACTATTTCTCCTAAAGCCCTTGACCAATATAAAGCAACTTATGCTCAACAAGGTGCAGTAATTTTAGCTGTTGATAGTGAAGTAATTGCTGGACAATCTCAAGCAGGTTATTCTCACGCTGTAGTAACTCCTGAAACACTACATAAGAAAACTTCTACCGATGGACGTATTGGTTTAATTGAAATTGCTACGCAAACAGAAACTAATGCTGGGACTGATTATACACGTGCAGTAACGCCTAAGACGTTAAATGATAGGAAAGCTACGGAAGGATTATCCGGCATAGCCGAACTTGCTACGCAAGTTGAATTTGATACTGGAACTGATGATACTCGTATCTCGACTCCACTGAAAATTAAAACTCATTTTGATTCTTCTGACCGTACCAGTGTTAATTCTGATTCCGGACTTATTGAAGAAGGAACCTTGTGGAACCATTATACTCTTGATATTTCTAAAGCAAATGAAACACAGCGTGGTACACTTCGCGTAGCGACCCAGGCAGAATCTAATGCAGGAACTTTAGATGATGTTCTTATTACTCCTAAAAAGCTTTTAGGGACTAAGTCCACTGAAACGTCTGAAGGCGTAATTAAGGTTGCTACTCGGGCTGAAACTGTAATAGGAACTTCTGCTAATACTGCTGTATCTCCTAAGAATTTAAAATGGATTGTCCAGAACGAACCGACATGGGCTGCTACTACGGCGATTCGTGGATTCGTTAAAACTTCATCCGGTTCTATTACATTTGTTGGTAATGATACAGTTGGTTCAACACAACCTTTAGAATCATATGAGAAAAATAGCTATGCTATATCCCCATATGAATTAAACCGTGTACTAGCTAACTATTTGCCATTGAAAGCTAAAGCCGTAGATAGTAATTTATTAGATGGCCTAGATTCATCTCAGTTCATTCGTAGGGACATTGCACAGACGGTTAATGGTTCACTAACATTAACTCAACAAACGAATCTGAGTGCCCCTCTTGTATCATCTAGTACTGCTACGTTTGGTGGTTCAGTTTCGGCAAATAGTACATTAACTATTTCTAATACGGGAACAGCTACTCGACTGATTTTTGAAAAAGGACCTCAGACTGGAACTAACCCAGCACAGACGATGACTATCAGAGTTTGGGGAAATCAGTTTGGTGGCGGATCAGATACAACACGTTCTACTGTATTTGAAGTTGGTGATGAAACGTCTAATCATTTTTATTCTCAACGTAATAAAGATGGGAATATAGCGTTTAGCATTAATGGTACTGTGATGCCAATAAATGTTAACGCTTCAGGCACGTTAAATGCGAATGGTGTTGCAACATTTGGTCGTTCAGTTACAGCCAATGGTGAATTCATTAGCAAGTCTGCAAATGCTTTCAGAGCAATTAGTGGTGATTACGGATTCTTTATTCGCAATGATGGAGGCAGCACATATTTTATGCTTACTGCATCAGGTGATCAGACTGGTGGATTTAATGGATTACGTCCATTATCAATTAATAACCAATCCGGTCAGATTACAATTGGTGAAGGCTTAATCATTGCCAAAGGTGCTACTATAAATTCAGATGGTTTGACTGTTAACTCGAGAATTCGTTCTCAGGGTACTAAAACGTCTGATTTATATACCCGTGCACCAACATCTGATACAGTCGGATTCTGGTCAATCGATATTAACGATTCAGCCACTTATAACCAGTTCCCAGGTTATTTTAAAATGGTTGAAAAAACTAATGAAGTGACTGGGCTTCCATATTTAGAACGTGGTGAAGAAGTTAAATCTCCTGGTACATTGACTCAGTTTGGTAACACACTTGATTCACTTTACCAAGATTGGATTACTTATCCAACGACACCGGAAGCGCGTACCACTCGCTGGACTCGTACATGGCAGAAAACTAAAAATTCTTGGTCAAGTTTTGTTCAAGTATTTGATGGTGGAAACCCTCCTCAACCTTCTGATATTGGTGCTTTACCTTCTGATAATGCAACAATCGGAAACTTGACGATAAGGGATTTCTTAAGGATTGGTAACGTCCGCATTATTCCAGACCCTGTGAATAAATCTGTTAAATTCGAGTGGATTGAATAA
Genome Context
Genome Context
Tertiary structure
PDB ID
4f4fc11ac924b8f8806183f4ef6d578c80d6dc711812434d66f6f442fdae05e5
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| Whole genome sequencing of NWU_EP_32a | Oluwarinde,B.O., Montso,P.K. and Ateba,C.N. | 2024-10-22 | — | GenBank |