Genbank accession
UWJ04048.1 [GenBank]
Protein name
putative tail fiber
RBP type
TF
Evidence RBPdetect
Probability 0,88
Protein sequence
MTVSTTIIKNSHNGNGSTTNFAYQFKILQDSDLTVIIRSSTGTETTKSLSTHYTVAGAGDASGGSITFTSGNTPASGETVVIRRNVPQTQAIDYIANDPFPAETHEEGLDRATMVAQQVSEEADRSIKLSRTNTMTSTEFTVGATARASKVLGFDANGELTVTQELGTNRGNWSSGTDYSARDIVKDTSTNNIFLVNTAHTSSGSQPLTSNANSAKYDLIVDAATATAAASTATAQATISTTKAGEAATSASTATTQANTATTKASEAATSATSAASSFDSFDDRYLGAKSSDPSVDNDGDALITGALYFNSSDNVMKNYTGSAWQTLKPTSSEQTNINTLSASAVVTDMSILATTDVVADMNTLASADIVADMNTLATADVVSDMNTLATADIISDMNTLATADVVSDMNTLGTADVVSDMNTLGTSTNVTNMATVATNITGVNSFAERYRVASSDPTSSLDEGDLAFNTTDNNLKFYNGTAWTSISPGIANVVDDSTPQLGGNLDVQTNQIVTTSNRNVKVYPNGTGVLEVGGDGSSNDGTIQLNCSQNSHGVKIASPAHSAGQSYTLILPTSVGSANQVLASNGNSTNQLSWIDAAETKPTVADVSQTIAPATATTINITGSNFVSIPQVQFINGSTGAITNANTVSFTNATTLSVNVTLASGNYFVRIENPDGNAGRSTNNILTASTAPSFTTAAGSLGTIAGDFSGTVATVTGSSDSAISFSEVTSGGNVLTASSGANCTLATNGVITTSDFGGTSTAATLYNFTLRITDAEGQTVDRDFSLQSSFGATGGGQFN
Physico‐chemical
properties
protein length:800 AA
molecular weight: 81889,85980 Da
isoelectric point:4,23584
aromaticity:0,05375
hydropathy:-0,16062

Domains

Domains [InterPro]
DC_0055
ATT
8–131
DC_2153
STR
675–793
UWJ04048.1
1 800
Architecture
ATT
STR
RBD
STR
ATT 8-131 | STR 148-424 | RBD 445-674 | STR 675-793 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Pelagibacter phage Skadi-2 EXVC102P
[NCBI]
2971100 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Candidatus Pelagibacter ubique HTCC1062
[NCBI]
335992 Bacteria > Proteobacteria > Alphaproteobacteria > Pelagibacterales > Pelagibacteraceae > Candidatus Pelagibacter

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
UWJ04048.1 [NCBI]
Genbank nucleotide accession
OP131299 [NCBI]
CDS location
range 28935 -> 31337
strand +
CDS
ATGACAGTATCAACTACAATTATTAAGAATTCCCACAATGGCAATGGCAGTACCACTAACTTTGCCTATCAATTTAAAATTTTGCAGGACAGCGATCTAACAGTAATTATTAGATCATCTACAGGTACAGAGACAACTAAAAGTCTATCTACACACTATACAGTAGCTGGTGCGGGTGATGCTAGTGGAGGTTCAATTACTTTCACTTCTGGTAACACTCCGGCTTCTGGTGAAACTGTAGTAATTAGAAGGAATGTCCCGCAAACTCAAGCGATAGATTATATTGCTAATGATCCATTCCCTGCGGAGACACATGAAGAGGGTTTGGATCGTGCTACTATGGTTGCACAACAAGTATCTGAAGAAGCTGATAGATCAATAAAATTATCAAGAACAAATACTATGACTTCTACAGAATTTACTGTAGGTGCTACTGCAAGAGCTAGTAAAGTTTTAGGATTTGATGCTAATGGTGAATTAACAGTTACACAAGAACTTGGTACAAATAGAGGAAACTGGTCATCTGGTACAGATTATAGTGCTAGAGATATAGTTAAAGATACCTCAACAAATAATATTTTTTTAGTAAACACAGCTCACACATCTTCTGGCTCACAACCACTAACATCAAATGCTAATTCAGCAAAATATGATTTAATTGTAGACGCAGCAACTGCCACAGCCGCAGCCTCAACTGCTACAGCTCAAGCAACAATCTCAACCACAAAGGCTGGTGAAGCTGCAACATCTGCATCAACTGCTACAACACAAGCAAACACAGCGACTACAAAAGCTAGTGAAGCCGCAACCTCTGCAACATCTGCAGCATCTTCTTTTGACAGTTTTGATGACAGATATTTAGGTGCTAAATCTTCTGATCCTTCAGTAGATAATGATGGGGATGCTTTAATAACTGGAGCATTATACTTTAATTCTTCAGATAATGTAATGAAAAATTACACAGGTTCTGCTTGGCAAACTTTAAAACCTACTTCTTCTGAACAAACAAATATTAATACTTTATCTGCTAGTGCAGTAGTTACTGATATGTCAATATTAGCTACAACAGATGTTGTTGCTGATATGAATACTTTAGCTTCAGCAGACATTGTTGCAGACATGAATACTTTAGCAACTGCTGATGTAGTTTCGGATATGAATACTCTTGCAACAGCAGACATTATATCTGATATGAACACTCTTGCTACTGCAGATGTTGTAAGTGATATGAACACATTAGGAACTGCGGATGTTGTATCTGATATGAATACTTTGGGTACATCAACTAATGTAACTAACATGGCAACTGTTGCTACAAACATTACAGGAGTTAATTCTTTTGCAGAAAGATATAGAGTTGCTAGTTCTGATCCCACTTCTAGTTTAGATGAGGGTGATCTTGCTTTTAATACGACAGATAATAATTTAAAATTTTATAATGGAACAGCTTGGACATCTATATCTCCGGGTATAGCAAATGTTGTTGATGATTCTACTCCACAACTAGGTGGTAATTTAGATGTACAAACCAATCAGATTGTAACAACAAGTAATAGAAATGTTAAAGTTTATCCTAATGGTACAGGTGTTTTAGAGGTAGGTGGTGATGGTTCATCTAATGATGGTACTATTCAATTAAACTGTTCTCAAAATTCTCATGGTGTTAAGATTGCTTCACCAGCTCACTCTGCTGGACAATCATACACTTTAATTTTACCAACGTCAGTTGGATCAGCAAATCAAGTTTTAGCTAGTAATGGTAATTCTACAAACCAATTATCTTGGATTGATGCAGCAGAAACTAAACCAACTGTAGCAGACGTATCTCAAACTATTGCTCCAGCTACAGCTACAACTATAAATATTACAGGTTCAAATTTTGTTTCAATACCACAAGTACAATTTATTAATGGTTCTACTGGTGCTATTACAAATGCTAACACAGTTTCATTTACAAATGCTACAACACTTTCAGTTAATGTAACTTTAGCATCTGGAAATTATTTTGTAAGAATAGAAAATCCAGATGGTAATGCTGGAAGATCAACAAACAATATTTTAACAGCATCTACTGCACCATCATTTACAACTGCTGCAGGATCATTAGGTACGATTGCAGGAGACTTTAGTGGTACAGTTGCAACAGTTACAGGCTCATCAGATAGTGCTATATCATTTAGTGAAGTTACATCTGGTGGAAATGTTTTAACTGCATCATCTGGTGCTAATTGCACTTTAGCTACAAATGGTGTAATAACTACAAGTGATTTTGGTGGAACTTCTACAGCAGCAACTTTGTATAATTTCACATTAAGAATTACAGATGCTGAAGGTCAGACAGTAGACAGAGATTTCTCTTTACAATCTAGCTTTGGTGCAACAGGTGGAGGACAATTTAACTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
46e3d94ce4926856d31dda26025f5dbce2ab7324a26a5b9ae6da709bae1729f9
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,7174
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50