Protein

View in Explore

Genbank accession

AGM11828.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Protein sequence

MALEPIGDIGVAALTEQVGSETLTWATAAEWDANVSETGVVHEDFGDRDATRIELGFPSTDPVNSGLAYYYPLDEASGPATDATGNGPNGSLSGSTSLGNSGTLGTTCIDFPGGGGDTLDFPDDPVWDITGDITVVHAIYWRGGNDSSSWQGLTSKGGNSSPWAIAYVDGYYVQFQVDGTRYDTGYDLRNTQNTWALHAYQLDSGSIRHQVNGGNEHDTTNSAEAINNTTSDEFVLGARKSGGDEVNALVDDFFVFDYAISDTRLTDLYDAWSTGTLTTATKTVSSSGQPDLQNLVYSLNGESITLDVIGSPGTASEETVTQALDGSSSYTLTWADSHTDFRVRAELTTSDPTVSPTVSQIELVT

Physico‐chemical properties

protein length:	365 AA
molecular weight:	38661,98380 Da
isoelectric point:	4,05003
aromaticity:	0,09041
hydropathy:	-0,36110

Domains

Domains [InterPro]

DC_2317
ATT
1–65

DC_2317 IPR013320 DC_1945

G3DSA:2.60.120.200
STR
60–272

G3DSA:2.60.120.200

IPR013320
STR
62–271

IPR013320

PF13385
LEC
114–263

PF13385

AGM11828.1

1 365

Architecture

ATT

STR

RBD

ATT 1-65 | STR 66-272 | RBD 273-365

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2317	ATT	DC_2317	1	65	Novel HMM	DC_2317	N-terminal	Low	Positional only	3 proteins / 3 hits
G3DSA:2.60.120.200	STR	G3DSA:2.60.120.200	60	272	Merged direct domain	G3DSA:2.60.120.200	Central	Low	Positional only	153 proteins / 153 hits
IPR013320	STR	IPR013320	62	271	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
IPR013320	STR	IPR013320	65	265	Merged direct domain	Concanavalin A-like lectin/glucanase domain superfamily	Central	Low	Positional only	237 proteins / 237 hits
PF13385	LEC	DC_0004	114	263	InterPro cluster	PF13385	C-terminal	Medium	Text match	334 proteins / 417 hits
DC_1945	RBD	DC_1945	265	365	Novel HMM	DC_1945	C-terminal	Low	Positional only	3 proteins / 3 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Haloarcula californiae tailed virus 2 [NCBI]	1273747	No lineage information
Host	Haloarcula californiae [NCBI]	244363	Archaea > Euryarchaeota > Halobacteria > Halobacteriales > Halobacteriaceae > Haloarcula

Coding sequence (CDS)

Genbank protein accession

AGM11828.1 [NCBI]

Genbank nucleotide accession

KC292028.1 [NCBI]

CDS location

range 35997 -> 37094
strand +

CDS

ATGGCCCTGGAACCCATCGGTGACATCGGCGTGGCAGCCCTCACCGAGCAGGTGGGCAGCGAGACGCTGACGTGGGCCACGGCTGCCGAGTGGGACGCGAACGTGAGCGAGACGGGCGTGGTCCACGAGGACTTCGGGGACCGCGATGCCACCCGCATCGAACTGGGCTTCCCATCCACGGACCCGGTAAACAGCGGCCTCGCGTATTACTACCCGCTGGACGAGGCCTCGGGGCCTGCGACCGACGCCACCGGGAACGGCCCGAACGGGTCGCTGTCCGGCAGCACCAGCCTGGGGAACAGCGGCACCCTCGGCACCACCTGCATCGACTTCCCTGGTGGTGGTGGCGACACGCTGGACTTCCCAGACGACCCGGTGTGGGACATCACGGGCGACATCACCGTGGTCCACGCGATTTACTGGCGCGGGGGTAACGATTCGTCCTCCTGGCAGGGCCTCACGTCAAAGGGCGGGAACAGTTCGCCCTGGGCCATCGCGTACGTGGACGGGTACTACGTGCAGTTCCAGGTGGACGGCACCCGGTACGACACCGGGTACGACCTGCGAAACACGCAGAACACCTGGGCGCTGCACGCTTATCAACTGGATTCGGGCAGCATCCGGCACCAGGTGAACGGCGGGAACGAACACGACACCACGAACAGCGCCGAGGCCATCAATAACACCACCTCGGACGAGTTCGTGCTGGGCGCTCGGAAATCCGGGGGCGACGAGGTGAACGCACTGGTGGACGACTTCTTCGTATTCGACTATGCCATCAGCGACACGCGCCTGACCGACCTGTACGATGCCTGGAGTACGGGCACCCTCACGACGGCCACGAAAACCGTGTCGTCCTCGGGGCAGCCGGACCTCCAGAACCTGGTGTACTCGCTGAACGGCGAGTCCATCACGCTGGACGTAATCGGCAGTCCCGGCACGGCCAGCGAGGAAACGGTCACGCAGGCGCTGGACGGGTCGTCCTCGTACACGCTGACCTGGGCCGACAGCCATACGGACTTCCGGGTGCGGGCCGAACTGACCACGAGCGACCCCACGGTGTCCCCCACCGTCTCGCAGATAGAACTGGTGACGTAG

Genome Context

Tertiary structure

PDB ID

4e070f09b217ce39080e04fa8d4142ce5806c3ba85a0a96862a53cbbadbc779b

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,8436

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence