Protein

View in Explore

Genbank accession

AUR96749.1 [GenBank]

Protein name

head-closure protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MTKLHDSFPFFGGLDVNTPYLQRNPGSLINSLNYEPDPDGGYRRIRGYERYDGQPSPTDSGVTAIPVSAVITPAPTLGDVLTGSDSGATGNYLDQDADLLLVYVTNINGTYTSVDTVSGATVTGDSTNAIQLIDNADFVALRRSAREYNRTQIQEVPGTGPVHAVYEHDNVVYAIRNAADGLSANIYKDSGAGWQLVDLSNNFIVSFDNGTGGSDDPFAIGNVVTGATSGATGTVTAVGVQSSDRQGGYISLKSVTGTFQDDENLNVGSTMVATVNGAPQAVSLNPNGKYRIVSYNFFGGLDTFSMYITNGVQTALQFDGESVAPIFTGLDIADDTPNDVIVHYDHLFLAFDNGLLQHSVIGEPLNWRGEFGAFQFALGSNITNLIVSPRALVVTTSDNVQVIYGQGTDNWEKAFITEKGIGVIGSGQYLSVPLVLDRAGVLALDRVEAFGNFQDSIISENVRSIVNRLYTNVTGSMVDKLNNHYILFSSTGENLLTGFSRGSFIGYFPINFGRVVLFASSHEDRMFFTDTVGGYVYLMRKGTSFDGGDIESIFQSSYAFQGEPQRKKRYRRVTISLKSFLPTLALSFAFSFGKGDAQIRSSTFNSNTLGGGGRWDVDNWDEFFWDGQDVPEIISDIDGVGTDISTLLYSNSAEIDSYVIEDITIQYSPRSLKR

Physico‐chemical properties

protein length:	674 AA
molecular weight:	72956,81130 Da
isoelectric point:	4,49673
aromaticity:	0,10979
hydropathy:	-0,13813

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

AUR96749.1

1 674

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	90	90	0,9585
Central domain	91	289	200	0,0558
C-terminal	290	674	384	0,0776

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-90

Central
91-289

C-terminal
290-674

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage 1.232.O._10N.261.51.E11 [NCBI]	1881454	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Vibrio tasmaniensis [NCBI]	212663	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

AUR96749.1 [NCBI]

Genbank nucleotide accession

MG592596 [NCBI]

CDS location

range 10618 -> 12642
strand +

CDS

ATGACTAAATTACACGACTCGTTCCCATTCTTTGGTGGATTAGATGTAAATACGCCATATCTACAAAGAAACCCTGGTTCCTTAATTAACTCATTAAACTATGAGCCTGATCCCGATGGTGGCTACAGACGCATTAGAGGGTATGAACGTTATGATGGTCAGCCTTCACCAACTGACAGCGGTGTTACTGCTATCCCGGTAAGCGCAGTTATCACCCCTGCACCTACTCTTGGTGATGTTTTAACGGGGTCAGATTCCGGTGCAACGGGCAACTACCTAGATCAAGACGCCGATCTGTTGCTGGTTTACGTGACCAATATAAACGGAACCTACACCAGCGTCGACACGGTAAGCGGTGCAACGGTAACGGGCGACTCAACTAATGCAATTCAGTTAATCGATAATGCTGATTTTGTAGCGTTACGCCGATCGGCAAGGGAATATAATCGAACTCAAATACAAGAAGTACCGGGTACCGGGCCAGTACATGCAGTCTATGAGCATGACAATGTTGTGTATGCGATTCGAAATGCTGCTGACGGATTATCCGCAAACATTTACAAAGACTCCGGCGCTGGTTGGCAACTGGTTGATTTATCTAACAATTTCATTGTTTCATTCGATAATGGTACGGGTGGTAGTGATGATCCCTTTGCTATCGGTAATGTGGTTACTGGTGCAACTTCCGGCGCAACGGGTACCGTAACTGCCGTGGGCGTTCAGTCTTCTGATAGACAAGGCGGTTACATATCGCTTAAAAGCGTCACAGGAACGTTTCAGGACGATGAAAACCTAAACGTAGGCTCGACTATGGTTGCAACGGTTAACGGAGCACCTCAAGCCGTATCTCTGAATCCTAACGGTAAATACAGAATAGTCAGTTATAACTTCTTTGGTGGCTTAGACACCTTCAGCATGTATATAACCAACGGAGTACAAACGGCACTTCAATTTGATGGTGAGTCAGTCGCCCCAATCTTTACCGGATTAGACATTGCAGACGACACGCCTAATGATGTGATAGTCCACTACGATCATTTGTTCTTAGCCTTTGATAATGGATTACTACAGCACAGCGTGATCGGTGAGCCTTTAAACTGGCGCGGTGAGTTTGGAGCATTCCAATTTGCTTTAGGTTCCAACATTACAAACCTGATCGTATCTCCAAGGGCTTTAGTTGTAACCACCTCAGATAACGTTCAGGTTATTTACGGGCAAGGTACAGATAACTGGGAAAAAGCGTTTATTACTGAAAAAGGCATAGGCGTTATTGGTAGTGGTCAATACTTGTCGGTACCGCTTGTTTTGGATAGGGCTGGCGTTTTGGCCCTAGATCGAGTTGAAGCGTTTGGTAACTTCCAGGATTCAATCATTAGTGAGAATGTACGTTCGATAGTGAACAGGCTTTACACCAATGTAACCGGGTCGATGGTCGATAAGCTTAACAACCATTACATATTGTTTAGCTCAACGGGTGAGAACCTATTAACGGGATTCTCAAGGGGATCGTTTATTGGCTACTTCCCTATTAACTTTGGTCGAGTTGTACTGTTTGCTAGTTCCCATGAAGATCGAATGTTTTTCACTGACACGGTAGGCGGTTACGTTTACTTGATGAGAAAAGGGACGAGCTTTGATGGTGGTGATATAGAGTCGATCTTTCAAAGCTCTTACGCGTTCCAAGGTGAACCGCAGAGGAAAAAGAGATACAGACGGGTTACAATTAGTCTTAAATCATTCCTTCCAACACTGGCTTTAAGTTTTGCGTTTTCGTTTGGTAAAGGTGACGCCCAGATCCGAAGCTCTACGTTTAACAGCAATACTCTTGGTGGTGGCGGTCGATGGGATGTAGACAATTGGGACGAGTTCTTTTGGGATGGTCAAGACGTACCTGAAATTATTAGTGATATAGACGGCGTAGGCACTGACATTTCAACGTTGCTTTATTCAAATTCAGCCGAGATTGATAGTTATGTAATTGAAGATATAACGATCCAATACTCTCCTAGATCTCTAAAGAGGTAG

Genome Context

Tertiary structure

PDB ID

84984393ee231e9031cee8b8e25f433a8c6e9f1ff71baabf836e6da40211c86c

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8480

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
A major lineage of nontailed dsDNA viruses as unrecognized killers of marine bacteria	Kauffman,K.M., Hussain,F.A., Yang,J., Arevalo,P., Brown,J.M., Chang,W.K., VanInsberghe,D., Elsherbini,J., Cutler,M.B., Kelly,L. and Polz,M.F.	2018-01-24	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature