Protein
View in Explore- Genbank accession
- AXH71602.1 [GenBank]
- Protein name
- tail fiber
- RBP type
-
TFTFTF
- Protein sequence
-
MANSFLEYTGNGSTTAFSITFDYLDASHIACTVDGVSTSFTLSNGGTTATLAAAPANGAAIRFTRTTSQATRLTDYVAGSVLTETDLDTDSKQAFFMGQEGLDTIGTKMGQSISTFQFDALNKRITNVADPTSAQDAATKNYLENTWLSSTDKATLNSVNANIANINAVNSNSSNINSAVSNATNINTVATNIGSVNTVAADITKVVAVANDLAEAVSEVETVADDLNEATSEIDTVANAITNVDNVGNNIANVNSVASNATNINAVAGNATNINAVNSNSANINTVAGQNANITTLAGINANITTVAGIAANVTSVAGNETNINAVNSNSANINTVAGANSNITSVAGSIANVNTVATNLASVNSFANTYRISSSAPTTSLDVGDLYFDTTANELKVYKSSGWAAAGSTVNGTAQRYTYNITGTPTTVSGSDANGNTLAYDAGYADVYLNGIRMSSADITITSGTSVVFASALANGDVVDVVAYGTFNVASINAANIDAGTLNNARLPSTISDKTIEATALTAKGDGSSADGKITLNCSQNSHGVAIQSPAHSAGQSYTLILPTSVGSNGQVLATAGSNTNQLTWVDAQETKPTVANVSQTIAPATATTITITGTNFVSIPHVEFVKTDGSVTIANTVSFTSSTSLSVNVTLASGNYYVRIENPDGNAGRSTQNIITASTAPSFTTSAGSLGTIAGNFSGTVATIAGTSDSAITFSETTSVLTTANVTLNTSTGALTTTDFGGSSTTPTTYNFTIRITDAEGQTADRNFSLTSSFGATGGGQFN
- Physico‐chemical
properties -
protein length: 785 AA molecular weight: 79507,36670 Da isoelectric point: 4,22435 aromaticity: 0,05605 hydropathy: -0,00420
Domains
Domains [InterPro]
DC_1263
ATT
1–325
ATT
1–325
IPR005604
ATT
3–107
ATT
3–107
1
785
Architecture
ATT 1-325 | STR 326-785
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Pelagibacter phage HTVC200P [NCBI] |
2283023 | Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes |
| Host |
Candidatus Pelagibacter sp. FZCC0015 [NCBI] |
2268451 | Pseudomonadota > Alphaproteobacteria > Candidatus Pelagibacterales > Candidatus Pelagibacteraceae > Candidatus Pelagibacter > |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AXH71602.1
[NCBI]
Genbank nucleotide accession
MH598801.1
[NCBI]
CDS location
range 27791 -> 30148
strand +
strand +
CDS
ATGGCTAATTCATTTTTAGAGTATACAGGTAACGGCAGCACAACTGCCTTTTCGATCACATTTGATTATTTAGACGCATCACATATTGCGTGTACAGTTGATGGTGTATCTACATCATTTACTTTAAGTAATGGTGGTACTACAGCTACTCTTGCAGCAGCACCAGCAAACGGAGCTGCAATTAGATTTACAAGAACTACATCACAAGCAACAAGATTAACAGATTATGTAGCAGGTTCAGTTTTAACTGAAACAGATTTAGATACAGATAGTAAACAAGCTTTCTTTATGGGACAAGAAGGTCTTGATACTATTGGTACTAAAATGGGTCAAAGTATTTCAACTTTTCAATTTGATGCCCTTAATAAAAGAATTACAAATGTTGCTGATCCGACGTCAGCGCAAGATGCAGCTACTAAAAATTATTTAGAAAATACTTGGTTATCAAGTACAGATAAAGCTACATTAAATAGTGTTAATGCTAATATAGCTAATATTAATGCAGTAAATTCAAACTCATCTAATATTAATTCAGCAGTTTCAAATGCTACAAATATAAACACTGTTGCAACTAACATTGGTTCAGTTAATACAGTTGCAGCTGATATTACAAAAGTTGTAGCTGTTGCTAATGATTTGGCAGAAGCAGTTTCAGAAGTTGAGACTGTAGCTGATGATTTAAACGAAGCAACTTCAGAAATTGATACAGTTGCAAACGCTATAACTAATGTTGATAATGTTGGTAATAATATTGCCAATGTTAATTCTGTAGCAAGCAATGCCACAAATATTAATGCAGTTGCAGGTAATGCTACTAACATTAATGCAGTAAATTCTAACAGTGCAAATATCAATACAGTTGCGGGTCAAAATGCTAATATTACTACACTAGCAGGTATTAACGCTAATATTACTACCGTTGCAGGAATTGCAGCAAATGTAACTTCAGTAGCAGGAAACGAAACAAATATTAATGCTGTAAATTCTAACAGTGCAAATATTAATACTGTTGCAGGAGCAAATTCAAATATTACTTCTGTTGCAGGTTCAATAGCAAACGTAAACACTGTTGCTACAAATTTAGCTTCAGTAAATAGTTTTGCTAATACGTACAGAATTTCAAGTAGTGCCCCGACGACTTCATTAGATGTTGGTGACCTCTATTTCGATACTACAGCAAACGAATTAAAAGTTTACAAATCTAGTGGCTGGGCTGCAGCTGGTTCGACAGTTAATGGCACTGCACAAAGGTACACTTATAATATTACTGGTACACCAACAACTGTATCAGGCAGTGACGCAAACGGAAATACACTTGCGTATGACGCAGGGTACGCTGACGTTTATCTAAATGGTATTCGTATGTCATCAGCAGATATTACAATTACATCTGGTACATCAGTTGTATTTGCGTCTGCGTTAGCAAACGGAGATGTTGTAGATGTAGTTGCATACGGAACATTTAATGTAGCTTCTATTAATGCGGCTAACATAGATGCAGGAACACTTAACAATGCAAGATTACCAAGTACAATATCTGACAAAACTATTGAAGCAACTGCACTTACAGCTAAAGGTGATGGTTCTTCAGCAGATGGTAAGATTACTTTAAATTGTTCACAAAATTCACATGGTGTAGCTATTCAATCACCTGCACACTCAGCAGGTCAAAGTTACACTTTAATATTACCTACAAGCGTAGGAAGTAATGGACAGGTATTAGCTACAGCAGGTTCTAACACTAACCAATTAACTTGGGTAGATGCACAAGAAACTAAGCCTACAGTAGCTAACGTATCTCAAACAATTGCTCCTGCTACTGCTACAACAATTACAATTACAGGAACTAATTTTGTATCAATTCCTCATGTAGAGTTTGTAAAAACAGATGGCTCAGTTACGATTGCTAATACTGTATCATTTACAAGTTCAACATCTTTATCAGTAAATGTTACTTTAGCATCTGGTAACTACTATGTAAGAATTGAAAATCCTGATGGTAACGCAGGTAGAAGTACACAAAATATTATTACTGCATCTACTGCTCCATCATTTACTACTTCAGCAGGTTCTCTAGGAACTATCGCAGGTAACTTCTCAGGAACAGTAGCAACAATCGCAGGTACTTCAGATAGTGCTATTACTTTCTCTGAAACTACTTCAGTATTAACTACAGCAAATGTAACTTTAAATACATCAACAGGAGCATTAACAACAACAGATTTCGGTGGGTCGTCTACGACACCTACTACTTATAACTTTACAATCAGAATAACTGATGCCGAAGGTCAAACAGCAGATAGAAACTTTAGTCTGACTTCTAGCTTCGGTGCAACAGGTGGAGGACAATTTAACTAA
Genome Context
Genome Context
Tertiary structure
PDB ID
d21d785dde785e6d821f43588c44d5f14ef02653a848aa0ef1c051e051adea71
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50