Protein

View in Explore

UniProt accession

A0A193GZG3 [UniProt]

Protein name

Tail fiber protein

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,79

Evidence RBPdetect2

Probability 0,96

Protein sequence

MADYAIYTKNGSSIVQLAGKGIPETNTKKLTVNGPSALNDTVTVAEGKTITFTNADLSGGMVRHITGKNALNDGWYIGSGGESNKGFLEIGTIDDGDEEIRFVSRGSGDTVRRTLKLIDSGGNTRVPGNIYIDEAMGGGGSAFISKNKAYFGAGGADIYMRNTAGGATNQLTITDGGELLFQAKPVYWDGRKPTLTELGIGRVENARQMQQDNWPITTGNETRWVKVALLKDPGSGHSRLQLMVTNGGNYGSTRGSFDFIDCSARSMPSTLTAANIRSYLQIRRLGDPAMDDTNQMRYSLVRTSEGLELWFTQRSFIGSTKIALLSTAGVTEYYIPSGYTSQTTAPDGLIESKPIRIYDEMNKPSLDDGTDGILSVAKGGTGASTAAAARTNLGLGTAATRDVGTGSGQVMLVGAYGLGGKGTSYSIANARDFLKQLRTDGSQFMRNTLGTDINYGMGASFYSSVSDVHAVISVDWNTGRVKVGATNDTNLNSDTGRINFQELYGTAFKPTPDDVGAVARAGDTMSGDLTISKVSPGFHLNAESGNSVIWFKYKGVESGAVWALPNTASSGEVRIRARTSGGTTGGEFSFKSDGTFTSPGNINITSGAFNGKSVNTQYANFNNTSSTTTEQTVSISGSQHTPLLLNRPTNSNLSIGFKLSGMNMKRLGIDVNGDIRYGEAENQTQNAWLLTSDTINRWSVNFGRDINVAGVVNSTGGFTGPVTAYDLTGVTQDLDALTLNNAEPGHIKVYSCRSMGGGDNITNKPSGVGGNFIVIVECLRKVGDTDYTNRQVLRASDNKRSWERWFTVSGTAKAWTPWRMNVVSGNDDDVSFKSVTTTTGNLNSGNDLIVANNARVGGNLGLGGASSTTYTDKGVVIGNGSALLESTDGRMIIGSSGAGRAVELRPGGPTQTNNGIKVTATSGSGGDTAIEYAQGVKIRANNGGALIISAKAGQTIYLRPQGDTSSTNETRIDSSGNMIVNGNISANGNMSATGTLTVSGATTLNNTLTVNNVGPIEKRGIRTYTEGSVTVNETDGITMFGNGTIHGTMRLVERVNNTTFIGLQTSINDTTNGWFEFHHTGKFKSNNIEASGNIVSLTGSIGAVGALTVTAPSSDNGTDHIWFRNSDGSERGVIYMPGNANIGGFRVRGVEWQFDGGASQFIGPGARWRIHPDGNIQADVFSGYLNNYINDRFNACAQWVRTGAQQDFGQIGRPAPGLTVPAGWVLVGLNANGNEANQNMQLIGGRLQVWKNNVQWVDSAT

Physico‐chemical properties

protein length:	1261 AA
molecular weight:	133321,12190 Da
isoelectric point:	6,87009
aromaticity:	0,07454
hydropathy:	-0,34449

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

A0A193GZG3

1 1261

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	289	289	0,0206
Central domain	290	499	211	0,2881
C-terminal	500	1261	761	0,6463

Note: Constraints were applied during segmentation.
Fixed 29 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-289

Central
290-499

C-terminal
500-1261

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage phT4A [NCBI]	1852638	Uroviricota > Caudoviricetes > Pantevenvirales > Slopekvirus > Slopekvirus pht4A
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

ANN86512.1 [NCBI]

Genbank nucleotide accession

KX130727 [NCBI]

CDS location

range 155032 -> 158817
strand +

CDS

ATGGCTGATTATGCCATTTACACGAAAAATGGTTCTTCGATCGTTCAGTTAGCGGGTAAAGGTATCCCAGAAACAAATACCAAAAAATTAACAGTAAATGGGCCTAGTGCTCTTAATGATACCGTTACCGTAGCGGAAGGTAAAACTATTACTTTCACCAACGCGGATTTGAGCGGGGGTATGGTTCGTCATATCACTGGTAAAAACGCGCTTAATGATGGTTGGTACATCGGTTCTGGTGGTGAGAGCAATAAAGGGTTTTTAGAAATCGGTACAATTGATGACGGTGATGAAGAGATCCGTTTCGTTTCCCGTGGTTCTGGTGATACTGTTCGTCGTACTCTGAAACTTATTGATTCCGGTGGTAACACTCGCGTACCAGGTAACATCTATATTGATGAAGCTATGGGCGGTGGTGGTTCTGCTTTTATTTCAAAAAACAAAGCATATTTCGGTGCTGGCGGTGCTGATATCTATATGCGTAACACTGCTGGCGGTGCGACAAATCAGTTAACGATCACTGATGGCGGTGAATTGCTGTTTCAAGCAAAACCTGTATACTGGGACGGTCGTAAACCGACTTTAACCGAATTGGGGATCGGGCGGGTTGAAAACGCGCGTCAAATGCAGCAAGACAATTGGCCTATAACTACAGGTAATGAAACCCGATGGGTTAAAGTTGCTCTTTTAAAAGATCCTGGCTCAGGTCATAGTCGCTTGCAACTGATGGTGACTAACGGCGGTAACTATGGTTCTACACGCGGATCGTTCGATTTTATCGATTGTTCTGCTCGTAGTATGCCTTCAACATTAACGGCTGCAAATATTCGTTCTTATCTGCAAATTCGTCGATTGGGCGATCCGGCAATGGATGACACTAACCAGATGCGTTATAGTTTGGTTCGCACATCCGAAGGTTTGGAATTGTGGTTTACTCAAAGATCGTTCATCGGTAGTACAAAAATTGCTCTGTTATCTACGGCTGGCGTGACTGAATATTATATTCCTAGTGGATATACATCACAAACAACCGCTCCGGATGGTTTGATCGAGAGTAAGCCTATTCGTATCTATGACGAAATGAACAAACCTAGCCTTGACGATGGTACTGATGGTATTCTGTCTGTTGCTAAAGGTGGTACAGGCGCAAGTACAGCGGCTGCTGCTCGCACAAACTTAGGTTTGGGTACTGCTGCAACCCGTGATGTTGGTACAGGTTCCGGACAAGTAATGCTTGTTGGTGCTTACGGTTTAGGCGGTAAGGGTACATCATATAGCATCGCAAATGCTCGCGACTTCCTGAAACAACTGCGTACTGATGGTTCTCAGTTCATGCGAAATACGCTTGGTACTGACATTAACTATGGTATGGGCGCAAGTTTTTATAGTTCCGTATCAGATGTTCATGCAGTGATCTCGGTTGATTGGAATACTGGTCGCGTTAAAGTTGGTGCAACTAATGATACTAACCTTAACTCAGATACAGGAAGAATCAACTTCCAGGAACTGTACGGTACTGCATTTAAACCGACTCCGGATGACGTAGGGGCTGTTGCACGTGCTGGTGATACGATGTCTGGTGATCTGACGATCTCTAAAGTGTCGCCTGGTTTCCATTTGAATGCTGAGAGCGGAAACTCCGTAATTTGGTTTAAGTATAAAGGGGTTGAAAGTGGTGCTGTGTGGGCGTTGCCTAATACTGCCTCTTCTGGTGAAGTTCGCATTCGTGCCAGAACGTCGGGCGGAACGACTGGGGGCGAATTCTCATTTAAATCAGACGGTACATTTACATCACCTGGTAATATCAATATTACTAGCGGCGCTTTCAACGGTAAAAGTGTCAATACTCAGTATGCGAACTTTAATAACACAAGTTCAACAACAACCGAACAAACCGTTTCTATTAGTGGTTCGCAGCACACTCCTCTGTTACTGAATAGACCGACTAACTCGAACTTGTCTATCGGGTTTAAACTTTCCGGAATGAACATGAAACGTTTGGGTATCGATGTAAACGGTGATATTCGTTACGGTGAAGCCGAAAACCAGACACAAAACGCATGGCTGTTGACTTCGGATACCATAAACAGATGGAGTGTTAACTTCGGGCGTGATATTAACGTTGCAGGTGTAGTTAATTCAACTGGTGGATTTACTGGCCCTGTTACTGCATATGATTTGACCGGGGTAACTCAGGATCTTGATGCTTTAACATTGAACAATGCCGAACCAGGACATATTAAAGTTTATTCGTGCCGTAGTATGGGTGGCGGTGATAACATCACCAATAAACCTTCCGGCGTAGGTGGTAACTTTATTGTTATCGTTGAATGTCTCCGTAAAGTCGGCGATACTGATTACACTAACCGTCAAGTATTACGCGCATCGGACAATAAACGCAGTTGGGAACGTTGGTTTACTGTTAGCGGTACTGCTAAAGCCTGGACACCGTGGAGAATGAACGTTGTTAGCGGAAACGATGACGATGTATCATTTAAATCTGTTACCACAACTACAGGAAACCTGAACAGTGGAAACGATCTGATTGTTGCGAACAACGCTCGCGTAGGTGGCAACTTAGGGTTAGGTGGTGCTTCTTCCACGACATACACTGATAAAGGTGTTGTGATTGGTAACGGTAGTGCGCTGTTAGAATCCACTGATGGTCGCATGATTATTGGTAGTTCTGGTGCTGGTCGTGCTGTTGAATTGCGTCCTGGTGGCCCAACTCAAACCAACAACGGGATCAAAGTGACTGCTACCTCTGGAAGTGGTGGTGATACTGCGATCGAGTATGCGCAAGGGGTGAAAATCCGGGCAAATAACGGTGGTGCGTTGATTATTTCTGCTAAAGCTGGACAAACGATTTATCTACGTCCTCAAGGAGATACATCCAGCACAAACGAAACAAGGATTGATTCTAGTGGTAACATGATAGTTAATGGTAATATCAGTGCAAACGGAAATATGTCTGCTACTGGTACGTTAACTGTTTCTGGTGCTACTACATTAAACAACACATTAACGGTTAATAATGTAGGGCCAATCGAGAAACGGGGGATCAGGACGTATACAGAAGGTTCTGTTACTGTCAACGAAACCGACGGCATTACGATGTTTGGTAATGGCACAATTCATGGCACAATGCGATTAGTTGAGAGAGTGAATAATACTACTTTCATCGGTCTGCAAACTTCCATTAATGACACTACAAACGGTTGGTTTGAATTCCACCACACAGGAAAATTCAAATCAAACAATATCGAAGCCTCTGGTAATATTGTTAGTTTGACTGGTTCCATTGGTGCTGTTGGTGCATTGACTGTAACGGCTCCTTCTTCTGATAACGGTACTGACCATATTTGGTTCCGTAACTCTGATGGATCTGAACGTGGTGTTATCTATATGCCAGGCAATGCTAATATTGGCGGTTTCCGCGTTCGTGGTGTGGAATGGCAATTTGATGGCGGTGCTAGTCAGTTTATCGGCCCTGGTGCTCGTTGGCGTATTCACCCTGATGGTAATATTCAGGCTGATGTTTTTAGCGGTTATCTGAATAACTACATCAATGATCGGTTTAACGCGTGTGCTCAGTGGGTTCGTACTGGTGCTCAACAGGACTTTGGTCAGATCGGTCGTCCTGCTCCTGGTTTAACAGTTCCTGCTGGTTGGGTTTTAGTTGGTCTTAACGCCAACGGTAACGAAGCTAACCAGAACATGCAGTTAATCGGTGGTCGTTTGCAGGTATGGAAGAATAACGTTCAATGGGTTGATTCTGCAACTTGA

Genome Context

Tertiary structure

PDB ID

5fa01dde3fe56acdaf8ad4648f2bdad18523a41de3e1886a0fda8c4787227f0a

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5123

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence