Protein

View in Explore

Genbank accession

UWJ04048.1 [GenBank]

Protein name

putative tail fiber

RBP type

Evidence RBPdetect

Probability 0,88

Protein sequence

MTVSTTIIKNSHNGNGSTTNFAYQFKILQDSDLTVIIRSSTGTETTKSLSTHYTVAGAGDASGGSITFTSGNTPASGETVVIRRNVPQTQAIDYIANDPFPAETHEEGLDRATMVAQQVSEEADRSIKLSRTNTMTSTEFTVGATARASKVLGFDANGELTVTQELGTNRGNWSSGTDYSARDIVKDTSTNNIFLVNTAHTSSGSQPLTSNANSAKYDLIVDAATATAAASTATAQATISTTKAGEAATSASTATTQANTATTKASEAATSATSAASSFDSFDDRYLGAKSSDPSVDNDGDALITGALYFNSSDNVMKNYTGSAWQTLKPTSSEQTNINTLSASAVVTDMSILATTDVVADMNTLASADIVADMNTLATADVVSDMNTLATADIISDMNTLATADVVSDMNTLGTADVVSDMNTLGTSTNVTNMATVATNITGVNSFAERYRVASSDPTSSLDEGDLAFNTTDNNLKFYNGTAWTSISPGIANVVDDSTPQLGGNLDVQTNQIVTTSNRNVKVYPNGTGVLEVGGDGSSNDGTIQLNCSQNSHGVKIASPAHSAGQSYTLILPTSVGSANQVLASNGNSTNQLSWIDAAETKPTVADVSQTIAPATATTINITGSNFVSIPQVQFINGSTGAITNANTVSFTNATTLSVNVTLASGNYFVRIENPDGNAGRSTNNILTASTAPSFTTAAGSLGTIAGDFSGTVATVTGSSDSAISFSEVTSGGNVLTASSGANCTLATNGVITTSDFGGTSTAATLYNFTLRITDAEGQTVDRDFSLQSSFGATGGGQFN

Physico‐chemical properties

protein length:	800 AA
molecular weight:	81889,85980 Da
isoelectric point:	4,23584
aromaticity:	0,05375
hydropathy:	-0,16062

Domains

Domains [InterPro]

DC_0055
ATT
8–131

DC_0055 DC_2093 DC_1556

DC_2153
STR
675–793

DC_2153

UWJ04048.1

1 800

Architecture

ATT

STR

RBD

STR

ATT 8-131 | STR 148-424 | RBD 445-674 | STR 675-793 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0055	ATT	DC_0055	8	131	Novel HMM	DC_0055	N-terminal	Low	Positional only	56 proteins / 56 hits
DC_2093	STR	DC_2093	148	424	Novel HMM	DC_2093	Central	Low	Positional only	75 proteins / 75 hits
DC_1556	RBD	DC_1556	445	699	Novel HMM	DC_1556	C-terminal	Low	Positional only	21 proteins / 21 hits
DC_2153	STR	DC_2153	675	793	Novel HMM	DC_2153	Central	Low	Positional only	21 proteins / 21 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pelagibacter phage Skadi-2 EXVC102P [NCBI]	2971100	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Candidatus Pelagibacter ubique HTCC1062 [NCBI]	335992	Bacteria > Proteobacteria > Alphaproteobacteria > Pelagibacterales > Pelagibacteraceae > Candidatus Pelagibacter

Coding sequence (CDS)

Genbank protein accession

UWJ04048.1 [NCBI]

Genbank nucleotide accession

OP131299 [NCBI]

CDS location

range 28935 -> 31337
strand +

CDS

ATGACAGTATCAACTACAATTATTAAGAATTCCCACAATGGCAATGGCAGTACCACTAACTTTGCCTATCAATTTAAAATTTTGCAGGACAGCGATCTAACAGTAATTATTAGATCATCTACAGGTACAGAGACAACTAAAAGTCTATCTACACACTATACAGTAGCTGGTGCGGGTGATGCTAGTGGAGGTTCAATTACTTTCACTTCTGGTAACACTCCGGCTTCTGGTGAAACTGTAGTAATTAGAAGGAATGTCCCGCAAACTCAAGCGATAGATTATATTGCTAATGATCCATTCCCTGCGGAGACACATGAAGAGGGTTTGGATCGTGCTACTATGGTTGCACAACAAGTATCTGAAGAAGCTGATAGATCAATAAAATTATCAAGAACAAATACTATGACTTCTACAGAATTTACTGTAGGTGCTACTGCAAGAGCTAGTAAAGTTTTAGGATTTGATGCTAATGGTGAATTAACAGTTACACAAGAACTTGGTACAAATAGAGGAAACTGGTCATCTGGTACAGATTATAGTGCTAGAGATATAGTTAAAGATACCTCAACAAATAATATTTTTTTAGTAAACACAGCTCACACATCTTCTGGCTCACAACCACTAACATCAAATGCTAATTCAGCAAAATATGATTTAATTGTAGACGCAGCAACTGCCACAGCCGCAGCCTCAACTGCTACAGCTCAAGCAACAATCTCAACCACAAAGGCTGGTGAAGCTGCAACATCTGCATCAACTGCTACAACACAAGCAAACACAGCGACTACAAAAGCTAGTGAAGCCGCAACCTCTGCAACATCTGCAGCATCTTCTTTTGACAGTTTTGATGACAGATATTTAGGTGCTAAATCTTCTGATCCTTCAGTAGATAATGATGGGGATGCTTTAATAACTGGAGCATTATACTTTAATTCTTCAGATAATGTAATGAAAAATTACACAGGTTCTGCTTGGCAAACTTTAAAACCTACTTCTTCTGAACAAACAAATATTAATACTTTATCTGCTAGTGCAGTAGTTACTGATATGTCAATATTAGCTACAACAGATGTTGTTGCTGATATGAATACTTTAGCTTCAGCAGACATTGTTGCAGACATGAATACTTTAGCAACTGCTGATGTAGTTTCGGATATGAATACTCTTGCAACAGCAGACATTATATCTGATATGAACACTCTTGCTACTGCAGATGTTGTAAGTGATATGAACACATTAGGAACTGCGGATGTTGTATCTGATATGAATACTTTGGGTACATCAACTAATGTAACTAACATGGCAACTGTTGCTACAAACATTACAGGAGTTAATTCTTTTGCAGAAAGATATAGAGTTGCTAGTTCTGATCCCACTTCTAGTTTAGATGAGGGTGATCTTGCTTTTAATACGACAGATAATAATTTAAAATTTTATAATGGAACAGCTTGGACATCTATATCTCCGGGTATAGCAAATGTTGTTGATGATTCTACTCCACAACTAGGTGGTAATTTAGATGTACAAACCAATCAGATTGTAACAACAAGTAATAGAAATGTTAAAGTTTATCCTAATGGTACAGGTGTTTTAGAGGTAGGTGGTGATGGTTCATCTAATGATGGTACTATTCAATTAAACTGTTCTCAAAATTCTCATGGTGTTAAGATTGCTTCACCAGCTCACTCTGCTGGACAATCATACACTTTAATTTTACCAACGTCAGTTGGATCAGCAAATCAAGTTTTAGCTAGTAATGGTAATTCTACAAACCAATTATCTTGGATTGATGCAGCAGAAACTAAACCAACTGTAGCAGACGTATCTCAAACTATTGCTCCAGCTACAGCTACAACTATAAATATTACAGGTTCAAATTTTGTTTCAATACCACAAGTACAATTTATTAATGGTTCTACTGGTGCTATTACAAATGCTAACACAGTTTCATTTACAAATGCTACAACACTTTCAGTTAATGTAACTTTAGCATCTGGAAATTATTTTGTAAGAATAGAAAATCCAGATGGTAATGCTGGAAGATCAACAAACAATATTTTAACAGCATCTACTGCACCATCATTTACAACTGCTGCAGGATCATTAGGTACGATTGCAGGAGACTTTAGTGGTACAGTTGCAACAGTTACAGGCTCATCAGATAGTGCTATATCATTTAGTGAAGTTACATCTGGTGGAAATGTTTTAACTGCATCATCTGGTGCTAATTGCACTTTAGCTACAAATGGTGTAATAACTACAAGTGATTTTGGTGGAACTTCTACAGCAGCAACTTTGTATAATTTCACATTAAGAATTACAGATGCTGAAGGTCAGACAGTAGACAGAGATTTCTCTTTACAATCTAGCTTTGGTGCAACAGGTGGAGGACAATTTAACTAA

Genome Context

Tertiary structure

PDB ID

46e3d94ce4926856d31dda26025f5dbce2ab7324a26a5b9ae6da709bae1729f9

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7174

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence