Protein

View in Explore

Genbank accession

AUS02120.1 [GenBank]

Protein name

WD40/YVTN repeat-like-containing domain protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,73

Protein sequence

MTLKVVDPINITEAVLTASDIPEPDASVGEVEWQDPTILGRFGNLPDVQYAVALGSDGFLYSFGRAGAVVKIDPDTSTMTTFGSYNVGRVYAAALAGDGNIYAVGSGGTVLKLEVSTQTLSTFGSYPGTCESATLAPNGDIYCVSTNGFVLKIDVSAQSVSQFGSYGSGYKTSSLGGDGNIYCAGLQGDVLKIDVNEQTVSTFGSVTGKYYGSATGVDGNVYCVGYSGNVLKINVSNQSVSTFGSCVGAFESAALDGNGRIKCVASSSTTSNGDILEIDTASESIYRFGSYTDDFFSIALAPNGKMFAVGNNVGGSTGVIEILDTYSPGDRVILESEHLVYQCLSVTYQNPKDGATDDAAATWIVVGPTNKWAMFDGLQNTKTSNSTDFTVTLKPVTYVNTLAMFGFSGVESLRIEVDNSLDVNIYDKTYSMSDFSAIYDHYTYVFYQIASLDDFIATDLPPLPNTTIRVTFSGSAMKIGELVTGFAIDIGQLVAENTKSDRFRYREQAYNEFGYPTGNAPIVVELNTYDVLVPKLNNQAIQKLLDTLTGENTLWFGDIGGGQSLVTYGFFERSPIPYAMPNHINYQITVRASV

Physico‐chemical properties

protein length:	594 AA
molecular weight:	63405,85650 Da
isoelectric point:	4,31081
aromaticity:	0,10943
hydropathy:	0,00370

Domains

Domains [InterPro]

DC_2002
ATT
1–50

DC_2002 DC_1523 DC_1523

IPR015943
STR
14–346

IPR015943

IPR051344
Unmapped
25–299

IPR051344

SSF101898
RBD
46–261

SSF101898

AUS02120.1

1 594

Architecture

ATT

STR

ATT 1-50 | STR 51-594

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2002	ATT	DC_2002	1	50	Novel HMM	DC_2002	N-terminal	Low	Positional only	4 proteins / 4 hits
IPR015943	STR	IPR015943	14	346	Merged direct domain	WD40/YVTN repeat-like-containing domain superfamily	Central	Low	Positional only	5 proteins / 5 hits
IPR051344	Unmapped	-	25	299	InterPro	Virginiamycin B lyase	-	-	-	-
SSF101898	RBD	SSF101898	46	261	Merged direct domain	SSF101898	C-terminal	Low	Positional only	15 proteins / 15 hits
DC_1523	STR	DC_1523	50	175	Novel HMM	DC_1523	Central	Low	Positional only	6 proteins / 6 hits
DC_1523	STR	DC_1523	181	594	Novel HMM	DC_1523	Central	Low	Positional only	6 proteins / 6 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AUS02120.1

1 594

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	287	287	0,6318
Central domain	288	486	200	0,1450
C-terminal	487	594	107	0,1637

Note: Constraints were applied during segmentation.
Fixed 9 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-287

Central
288-486

C-terminal
487-594

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 2.095.A._10N.286.46.E10 [NCBI]	1881403	No lineage information
Host	Vibrio sp. F12 [NCBI]	2070776	Pseudomonadota > Gammaproteobacteria > Vibrionales > Vibrionaceae > Vibrio >

Coding sequence (CDS)

Genbank protein accession

AUS02120.1 [NCBI]

Genbank nucleotide accession

MG592664 [NCBI]

CDS location

range 26482 -> 28266
strand +

CDS

ATGACTTTAAAGGTAGTTGACCCAATTAACATTACGGAGGCGGTATTAACCGCTTCTGACATACCAGAGCCTGATGCTAGTGTGGGCGAAGTCGAGTGGCAAGACCCTACCATTCTAGGTAGGTTTGGCAACTTACCAGACGTACAGTATGCAGTGGCGCTTGGTAGCGATGGGTTCTTATATTCTTTCGGCAGGGCAGGTGCTGTTGTTAAAATTGACCCAGACACTAGTACAATGACAACTTTCGGAAGTTACAATGTAGGCAGGGTTTATGCTGCCGCTCTCGCTGGTGATGGAAACATCTACGCCGTCGGCAGTGGAGGCACTGTACTTAAACTGGAAGTGTCAACACAAACTCTATCAACGTTCGGCAGTTATCCGGGGACTTGTGAATCAGCAACTTTAGCCCCTAATGGTGATATCTACTGCGTATCAACAAATGGATTTGTTCTCAAAATAGATGTTAGCGCTCAATCTGTATCTCAATTTGGAAGTTATGGATCGGGATATAAAACGTCATCACTTGGTGGTGATGGCAATATTTACTGTGCAGGTCTTCAGGGTGACGTGCTTAAAATAGACGTTAACGAGCAAACCGTCTCTACATTTGGCAGTGTTACCGGCAAGTATTACGGCTCGGCTACTGGTGTTGACGGTAACGTTTACTGCGTAGGTTATTCTGGCAACGTTCTAAAAATAAACGTATCAAATCAATCTGTATCGACATTTGGCTCTTGTGTTGGTGCATTTGAATCCGCCGCGCTAGATGGTAACGGTAGAATCAAGTGCGTAGCGTCATCTAGCACCACGTCAAATGGTGATATTCTAGAGATAGACACAGCATCTGAAAGCATATACAGGTTCGGAAGTTACACTGATGACTTTTTTTCCATAGCTCTCGCGCCAAATGGGAAAATGTTTGCAGTTGGTAACAATGTTGGAGGTTCGACGGGCGTTATTGAGATTCTAGATACTTACTCACCTGGTGACAGGGTTATCCTTGAGTCTGAGCATTTGGTCTACCAGTGCTTAAGTGTTACATACCAAAACCCAAAAGATGGCGCAACAGATGACGCAGCAGCAACTTGGATTGTGGTTGGCCCAACAAATAAATGGGCCATGTTTGATGGACTGCAAAACACAAAAACTTCCAACTCAACGGATTTTACGGTAACACTAAAACCAGTCACTTATGTAAATACACTGGCGATGTTTGGATTTAGTGGTGTCGAGTCGTTAAGAATAGAAGTTGACAATAGTCTTGACGTAAATATTTATGATAAAACATATTCAATGTCTGACTTCTCAGCAATCTATGACCACTACACCTATGTGTTTTACCAGATAGCTAGCTTGGACGACTTCATAGCTACCGACTTGCCACCACTGCCAAATACAACAATAAGAGTTACATTCTCAGGCTCAGCAATGAAAATAGGCGAACTTGTCACTGGCTTTGCAATTGACATTGGCCAACTAGTAGCCGAAAACACCAAGTCAGACAGATTTAGATACAGAGAGCAGGCATATAACGAGTTTGGCTATCCAACCGGCAACGCTCCGATAGTTGTTGAATTAAACACTTACGATGTGCTGGTTCCAAAACTAAACAACCAGGCAATTCAGAAACTTTTAGATACACTAACTGGAGAAAACACGCTTTGGTTCGGTGATATCGGAGGAGGACAAAGTCTAGTTACATACGGATTCTTTGAGCGTAGCCCTATTCCTTATGCAATGCCAAATCATATTAACTATCAAATCACTGTACGCGCATCCGTGTGA

Genome Context

Tertiary structure

PDB ID

55c6d2f0978ce1f4ee99ec787f7cadb665d693203596e954783229a5bc5b21a0

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8777

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
A major lineage of nontailed dsDNA viruses as unrecognized killers of marine bacteria	Kauffman,K.M., Hussain,F.A., Yang,J., Arevalo,P., Brown,J.M., Chang,W.K., VanInsberghe,D., Elsherbini,J., Cutler,M.B., Kelly,L. and Polz,M.F.	2018-01-24	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature