Protein

View in Explore

Genbank accession

UYL93777.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,69

Evidence RBPdetect2

Probability 0,92

Protein sequence

MIHIVDGRTDRILDYIPLGEFWDDWHRKSLKDTLETFDFVTFGDRRYSQHLTKRNRVIIPDDDGRFVEFIIENTRKYRDTDGSLIIEVYTVASYLELTKAKVIEPQTLASQTPSTAVAHALAGTEWLPGNIQGDGTRTFHIEEYTNPYSFTQTIAAEFELERNFRIEHDGNRVTGRFLDLVERIGQWQGREVEFAKDLAGIERKEDMSGIVTALIGLGPEREDGTRLEVFVEDEDALQRWGRPHPQTGQLMHLVETYEPESSDQDMTIERLTELTRNELEKRINSVVEYSADVVDLEKVPGLQNKVIRFGDTIKIKDLGFSPPLYLEARVHTQERSLSDPANKRVILGDFIEYTEEEVQEIWRQLQAQIANKIEISDVLAVTYTKPEIDAKDASVYQDSTYYADNVSETKKQEAIIVAADDATQKANQAKQEAIQQSIAEVEQRVNQARAELENEIATKVDAEWVNGQLVLKENVITKSNTAPTNPTTGQLWLDTSVVPNVLKRWDGSTWVKVTPTAAGEVGAYTKTEVDNALNSKVSIAQYTADMDGVVTRLNSAESRITQNEQEIAAKVSNTTYQQDKTTINNNISQLQTRMSNAEAQLTIQADQIATKVSRTEFESLQIGGRNLLTDTEKTWESTGTASGSTYGIYRNNLNDLFASLVGKEVTFSFDVKIDTTDGTPGQVRMYCTNGNPKYTFPLKIFSGITDQYQRVTYTTTITEIPGNTGQARIEFWGIDSKTTKIYIRRFKLERGNRATDWTPAPEDVDTQISGLNTRVSIAESSITQLADEIELRVEKNGVISAINQTAEQIKIQASKVDLSGYVTFTNLSTPGQTTIDGGNIKANSVTANKLNVSSLSAISANLGTVTAGTITGVTINGSTINSRLDARNYTTIANNRIHSEGEWNDTVYGLGNMYGIFDVNNGNISLEVGQVLNGTRQTSQAVKIDFTMLGMVIKSGTSGGFYINNIGAISWGDWYDSGNARGAIYTSYEPDAYNTLRWGVKVESPYVNITQIIAEGNARQVAIRERDNNNKQWHIEVNNGDFFISETNVATRLTLTTGGGLLINWMNATGDINFSDYTGRLVNDGGYGYLQTTGSEYRVTKYKSTTYIPIRASSFPTASLAEYKQDIHVWEESALEKIRSATIYEYRLKSEVEAGKNRWRQGLVIGDGFSTPEGVIDGDGVEQYLMNAWSWKAIQELDSKQMNHEDRISWLELENQYLKQKVSQLETRIAELEAKIA

Physico‐chemical properties

protein length:	1237 AA
molecular weight:	138506,36110 Da
isoelectric point:	4,89977
aromaticity:	0,08327
hydropathy:	-0,49701

Domains

Domains [InterPro]

DC_0109
STR
1–777

DC_0109 IPR030392

IPR007119
Unmapped
26–344

IPR007119 Coil G3DSA:1.20.5.340 Coil

IPR010572
ENZ
95–351

IPR010572 Coil DC_1931

UYL93777.1

1 1237

Architecture

STR

STR 1-1236 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0109	STR	DC_0109	1	777	Novel HMM	DC_0109	Central	Low	Positional only	88 proteins / 88 hits
IPR007119	Unmapped	-	26	344	InterPro	Phage tail spike protein, N-terminal domain	-	-	-	-
IPR010572	ENZ	DC_0675	95	351	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
Coil	Unmapped	-	431	458	Coils	Coil	-	-	-	-
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	488	618	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits
Coil	Unmapped	-	580	607	Coils	Coil	-	-	-	-
DC_1931	STR	DC_1931	611	1236	Novel HMM	DC_1931	Central	Low	Positional only	3 proteins / 3 hits
IPR030392	CHP	DC_0088	1119	1229	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1215	1235	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Geobacillus phage vB_GthS_NIIg9.7 [NCBI]	2985562	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Geobacillus thermodenitrificans [NCBI]	33940	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

UYL93777.1 [NCBI]

Genbank nucleotide accession

OP341624.1 [NCBI]

CDS location

range 12325 -> 16038
strand +

CDS

ATGATTCACATTGTCGATGGAAGAACAGATCGCATTTTGGATTATATCCCTCTGGGTGAATTTTGGGATGACTGGCATCGGAAGTCACTAAAGGATACACTAGAAACCTTCGACTTTGTGACATTCGGCGACAGGCGTTATTCCCAACACCTAACGAAACGAAACCGGGTGATTATCCCCGACGATGACGGGCGGTTCGTTGAGTTCATCATCGAGAACACGCGCAAATACCGCGACACAGACGGTAGTTTAATCATCGAGGTTTATACTGTCGCGTCGTATCTTGAATTGACGAAAGCTAAGGTAATCGAACCGCAAACGTTGGCAAGTCAAACGCCTAGCACGGCAGTAGCTCATGCGTTGGCCGGAACAGAATGGCTGCCCGGGAATATCCAAGGGGATGGAACCCGGACATTTCACATCGAGGAATACACCAACCCCTATTCATTTACACAGACAATTGCCGCTGAATTTGAGTTGGAGCGGAACTTCCGCATAGAGCATGATGGGAATAGGGTGACAGGGAGATTTCTCGACTTGGTTGAACGGATTGGCCAATGGCAGGGGCGTGAGGTGGAGTTCGCGAAAGACTTGGCCGGCATTGAACGAAAAGAGGATATGTCCGGCATTGTAACCGCGCTTATCGGGCTTGGTCCGGAACGGGAGGATGGCACGAGATTAGAAGTTTTTGTTGAAGACGAAGACGCCTTGCAACGGTGGGGGCGACCGCATCCGCAAACCGGACAACTCATGCATTTGGTCGAAACATACGAGCCGGAAAGCTCCGACCAAGACATGACGATTGAACGGCTCACAGAATTAACAAGAAATGAACTAGAAAAGCGTATTAATTCCGTCGTGGAATACAGTGCGGATGTGGTGGACTTAGAAAAAGTGCCGGGGCTGCAAAACAAGGTCATTCGCTTCGGTGATACGATTAAAATTAAAGATTTAGGATTTAGCCCTCCTTTGTATCTTGAAGCGCGTGTTCATACGCAAGAACGGTCTTTGAGCGACCCTGCTAATAAAAGGGTAATCCTTGGCGATTTCATTGAGTACACCGAGGAAGAAGTACAGGAAATATGGCGTCAGCTACAAGCGCAGATCGCCAATAAGATTGAAATAAGCGACGTTTTAGCGGTCACCTATACCAAGCCGGAAATCGACGCGAAAGACGCATCGGTGTACCAAGATAGCACGTACTATGCCGACAATGTGTCAGAGACGAAAAAGCAAGAAGCGATAATAGTAGCGGCCGATGACGCCACGCAGAAGGCGAATCAAGCGAAACAAGAAGCCATTCAGCAATCCATCGCGGAAGTTGAGCAAAGGGTGAACCAAGCGAGGGCTGAACTTGAAAACGAGATCGCGACCAAGGTTGACGCTGAATGGGTAAACGGCCAGCTAGTATTGAAGGAAAATGTCATTACGAAGTCAAATACAGCGCCAACCAATCCGACAACAGGCCAGTTGTGGTTAGATACGTCCGTGGTGCCGAATGTTTTAAAGCGTTGGGACGGTTCGACATGGGTAAAGGTGACACCAACGGCAGCGGGAGAGGTTGGCGCATACACAAAAACAGAAGTAGACAACGCGCTAAATAGCAAGGTATCCATCGCGCAGTACACAGCGGATATGGACGGCGTTGTCACACGCCTAAACAGCGCCGAATCCCGTATCACACAGAACGAGCAAGAGATTGCAGCGAAAGTCAGCAACACGACCTATCAGCAGGACAAAACAACGATCAACAACAACATTTCACAGCTCCAGACAAGAATGTCTAACGCCGAAGCGCAATTGACAATTCAGGCTGACCAAATCGCGACGAAGGTGAGCCGAACGGAGTTCGAGAGTTTGCAGATCGGCGGGCGGAACCTATTAACAGATACGGAGAAGACTTGGGAATCAACAGGGACTGCGTCGGGTTCTACTTATGGGATTTATAGAAATAACCTAAATGATTTATTCGCCAGCCTTGTAGGAAAAGAAGTGACTTTTAGTTTTGATGTAAAAATCGACACAACAGACGGAACGCCCGGACAAGTTAGGATGTATTGTACGAATGGTAATCCGAAATATACATTTCCGTTAAAAATTTTTTCTGGTATTACAGACCAGTACCAACGGGTTACCTATACAACCACTATCACAGAAATTCCCGGGAACACCGGCCAAGCAAGGATAGAATTTTGGGGCATTGACTCAAAAACGACAAAAATTTATATCAGACGCTTTAAACTCGAAAGAGGTAACCGCGCCACCGACTGGACGCCAGCGCCAGAGGATGTAGATACGCAAATCAGCGGACTTAATACACGCGTTTCCATTGCCGAATCAAGTATCACACAACTCGCCGACGAGATCGAACTTAGGGTAGAGAAAAACGGTGTAATTTCAGCGATCAATCAGACGGCTGAACAGATCAAAATCCAAGCATCGAAGGTTGACCTGTCCGGGTATGTGACGTTTACAAACTTAAGCACACCGGGACAGACAACGATTGACGGCGGGAATATCAAAGCGAATTCCGTTACGGCGAACAAATTGAATGTTTCGTCGCTTTCCGCTATTTCTGCCAATCTCGGAACGGTAACGGCGGGGACGATAACAGGCGTCACAATCAACGGGTCGACGATTAATTCACGATTAGATGCACGGAATTATACAACAATAGCTAACAACCGCATTCACTCTGAGGGCGAATGGAACGACACTGTATATGGATTAGGAAACATGTATGGGATTTTTGATGTAAACAACGGAAATATATCGCTTGAAGTCGGTCAAGTGTTGAATGGAACAAGGCAGACAAGCCAAGCCGTCAAGATTGACTTCACAATGCTAGGCATGGTTATTAAAAGCGGAACAAGTGGCGGATTCTATATCAATAATATCGGTGCGATTTCATGGGGTGATTGGTACGATTCGGGAAATGCGCGAGGGGCTATTTACACAAGCTATGAACCGGACGCCTATAATACGTTAAGATGGGGCGTGAAAGTCGAATCTCCGTATGTGAACATCACGCAGATTATTGCCGAAGGAAACGCTCGTCAGGTTGCTATCCGCGAGCGTGACAATAACAATAAACAATGGCACATTGAAGTGAACAACGGCGATTTCTTTATATCAGAAACAAATGTTGCGACACGCCTTACGCTTACAACCGGCGGAGGGTTGCTGATTAACTGGATGAACGCAACGGGAGATATAAACTTCAGCGATTACACCGGTCGCCTTGTCAACGACGGCGGATATGGCTATTTGCAGACGACGGGTTCTGAATACAGGGTCACAAAATACAAAAGCACGACGTATATCCCGATTCGCGCGTCGTCTTTCCCGACCGCGTCGCTTGCCGAATACAAACAAGACATTCATGTGTGGGAAGAATCGGCGCTTGAGAAAATCCGGAGCGCAACCATCTATGAGTACCGGCTGAAATCAGAAGTAGAGGCAGGAAAAAATCGCTGGCGTCAAGGACTTGTCATCGGCGACGGATTCAGCACACCGGAGGGTGTTATTGACGGCGACGGAGTAGAACAGTACCTCATGAACGCATGGAGTTGGAAGGCGATTCAGGAGCTAGATTCAAAACAAATGAATCATGAAGACAGAATCTCTTGGCTCGAATTGGAAAATCAATATTTGAAACAAAAAGTATCTCAATTAGAAACTAGAATTGCAGAACTGGAGGCGAAAATAGCATGA

Genome Context

Tertiary structure

PDB ID

923d820208656c1455c49cbc9b4d426ec5ac95be6478abe97c3823e30602ec23

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6067

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Complete genome sequence of Geobacillus bacteriophage vB_GthS_NIIg9.7	Simoliunas,E., Simoliuniene,M. and Kvederaviciute,K.	—	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature