Protein

View in Explore

UniProt accession

A0AAF0GD68 [UniProt]

Protein name

Tail fiber

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Protein sequence

MTDKLIRELLIDVKQKGATRTAKSIENVSDALENAAAASELTNEQLGKMPKTLYSIERAADRAAKSLTKMQASRGMLSVTKSINDIGAKLDDLAIQLIEVTDKLEIGFDGVSRSVKAMGNDVAAATEKVQDRLYDTNRALGGTARGFNDTAGAAGRASRAIGNTSGSARGATRDFAAMAKIGGSLPIMYAALASNIFVLQSAFEQLKLGDQLNRLEKFGVIVGTQTGTPVQTLARSLQEAAGYAISFEEAMRQASSASAYGFDAEQLNKFGLVARRAAAVLGVDMTDALNRVIKGVSKQEIELLDELGVTIRLNDAYADYVKQLNAANTGITYNVNSLTTFQKQQAYANAVIAESTKRFGYLDEVLRATPWEQFAANADAALRKIQQAAAKYLGPVIDAINTVFYTSQASISAEAARAQEKTNRQIDPTNVGAVALSLAASEEGYNKALDMYKESLDKRNKLKSEFDKRMEQADFYTKLAIRQVGEGIPVGLAAAGASEANKQFVAETAAMGLQVTRLGKEVEDSTENLNAWKSAYQAAGAAAAKANPEFQKQINLQRDTTDPDAVYDFNSTVLKGLTEQQKAYNQTKKTASDLANDIQNVAQNTDTAAKTSATLADAIKNIESLSLGTGKSADEYVKNLNLGYNTLSEMKTASQALSEYVKLTGNETKNQLAVQQKIADVYNQTKDKEKAQEAGRRLELQQLEEQEAALRRVLQTNQGNKAVEKEIEKIQLEKLKLTNQGMEAQKKVKDYTDKILGVDREIALLNDRTMTTTQYRLAQLKLELTIEKEKYEWYTKQADKQKEAEQSRRAQAQISRELWEAEKQATATHVSALMDALEVSQTQRNVTGQSQILTERLSILQQQLELSKGNTEEEIKYRNEIYKTSAALEQLRKQRDSQMQQQVGSSVGAVYTPTTGLSGEDKDFADMQNRMASYDQAISKLSELNSEATAVAQSMGNLTNAMIQFSQGSLDTTSMIASGMQTVASMIQYSTSQQVSAIDQAIAAEQKRDGKSEASKAKLKKLEAEKLKIQQDAAKKQIIIQTAVAVMQAATAVPYPFSIPLMVAAGLAGALALAQASSASGMSSIADSGADTTSYLTLGERQKNIDVSMSANAGELSYIRGDQGIGSANSFVPRAEGGNMYPGVSYQMGEHGTEVVTPMVPMKATPNDELKTSSNSTSGRPIILNISAMDAASFREFASSNSSALRDAVELALNENGASLKTLGNS

Physico‐chemical properties

protein length:	1226 AA
molecular weight:	132505,37450 Da
isoelectric point:	5,64811
aromaticity:	0,05220
hydropathy:	-0,41794

Domains

Domains [InterPro]

IPR056207
TAS
1–81

IPR056207 DC_0073 IPR056208

Coil
Unmapped
686–745

Coil Coil

A0AAF0GD68

1 1226

Architecture

TAS

STR

TAS

TAS 1-81 | STR 82-1188 | TAS 1189-1224 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR056207	TAS	DC_0547	1	81	InterPro cluster	Tape measure protein PB2, N-terminal	N-terminal	High	Text match	97 proteins / 97 hits
DC_0073	STR	DC_0073	82	1188	Novel HMM	DC_0073	Central	Low	Positional only	97 proteins / 97 hits
Coil	Unmapped	-	686	745	Coils	Coil	-	-	-	-
Coil	Unmapped	-	1012	1039	Coils	Coil	-	-	-	-
IPR056208	TAS	DC_0881	1189	1224	InterPro cluster	Tape measure protein PB2, C-terminal	C-terminal	High	Text match	95 proteins / 95 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage phC17 [NCBI]	3038310	Uroviricota > Caudoviricetes > Demerecviridae > Tequintavirus > Tequintavirus phC17
Host	Salmonella enterica subsp. enterica [NCBI]	59201	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Salmonella

Coding sequence (CDS)

Genbank protein accession

WGG14761.1 [NCBI]

Genbank nucleotide accession

OQ680481 [NCBI]

CDS location

range 96037 -> 99717
strand +

CDS

ATGACTGATAAGCTAATACGAGAACTACTAATAGACGTTAAACAGAAGGGGGCAACTCGTACTGCAAAGTCTATTGAAAACGTATCTGATGCGTTAGAAAACGCTGCTGCTGCTTCCGAACTGACAAATGAGCAGTTAGGTAAAATGCCCAAAACTCTTTATTCCATTGAGAGGGCAGCGGATAGAGCAGCGAAAAGTCTTACTAAAATGCAAGCAAGCCGAGGTATGCTTAGTGTTACTAAATCTATAAATGATATAGGAGCTAAGTTAGATGATCTTGCTATCCAACTTATTGAAGTAACAGATAAGCTAGAAATTGGATTCGATGGAGTTTCTAGATCTGTTAAAGCAATGGGTAATGATGTTGCAGCTGCAACAGAAAAAGTCCAAGATAGATTATATGATACTAATAGAGCATTAGGTGGCACAGCTAGGGGTTTTAATGACACTGCTGGTGCCGCTGGTAGAGCTTCTAGAGCTATTGGTAATACTTCTGGTTCAGCACGCGGTGCAACTCGTGATTTTGCAGCAATGGCTAAGATAGGTGGTAGTTTACCTATTATGTACGCAGCTCTTGCTTCCAACATCTTCGTTTTGCAATCTGCATTCGAACAACTTAAACTAGGTGACCAGCTAAATCGTCTAGAAAAATTTGGTGTTATAGTAGGTACTCAGACAGGTACTCCTGTTCAGACCCTTGCTAGATCACTACAAGAAGCTGCTGGATATGCTATTTCTTTTGAGGAAGCAATGAGACAGGCATCTTCAGCATCTGCTTATGGGTTTGATGCTGAACAACTTAATAAATTTGGTTTAGTAGCTCGTCGTGCTGCTGCTGTTCTTGGTGTTGATATGACTGATGCACTTAACCGTGTAATTAAGGGCGTATCTAAACAAGAAATCGAACTTCTGGATGAACTTGGTGTCACCATCCGTCTTAATGACGCATATGCTGATTATGTTAAACAGTTAAATGCTGCAAACACAGGTATAACATATAATGTTAATAGTCTTACCACTTTCCAGAAACAACAAGCATACGCTAACGCGGTAATTGCTGAATCTACTAAGCGGTTTGGCTACCTAGATGAAGTACTACGTGCAACTCCATGGGAGCAATTTGCTGCTAATGCAGATGCTGCACTAAGAAAAATACAACAAGCTGCTGCTAAGTATTTAGGGCCAGTAATTGATGCTATCAACACAGTATTTTATACATCTCAGGCTTCTATATCTGCTGAGGCAGCTAGAGCTCAAGAAAAAACTAATAGACAGATAGACCCTACCAACGTTGGTGCTGTTGCTTTAAGTTTAGCTGCTTCTGAAGAAGGCTATAATAAAGCTCTAGATATGTATAAGGAATCTCTTGATAAGCGTAATAAGCTAAAATCTGAGTTCGATAAACGAATGGAACAAGCAGATTTCTATACAAAACTAGCTATACGTCAAGTTGGTGAAGGTATTCCTGTTGGTCTTGCAGCAGCAGGTGCTTCGGAGGCCAATAAGCAATTTGTAGCAGAAACTGCAGCTATGGGTCTACAAGTAACTAGACTTGGTAAGGAAGTAGAGGATTCTACAGAGAACCTCAATGCTTGGAAATCAGCGTATCAAGCTGCTGGAGCTGCTGCTGCAAAAGCTAACCCCGAGTTTCAGAAGCAAATTAATCTACAGAGAGATACTACTGATCCTGATGCTGTATACGATTTTAACTCTACTGTATTAAAAGGACTAACTGAGCAGCAGAAAGCGTACAATCAGACTAAGAAAACTGCTAGTGACTTAGCTAATGATATACAGAACGTTGCTCAGAATACAGATACTGCTGCTAAAACTAGTGCTACTTTAGCAGATGCTATAAAAAACATAGAATCTCTATCTCTAGGTACTGGTAAGAGTGCTGATGAATATGTTAAAAATCTTAACCTAGGCTACAACACTCTGTCTGAAATGAAAACTGCGTCTCAGGCCTTATCTGAGTACGTTAAACTAACTGGTAATGAGACTAAGAACCAGTTAGCAGTTCAACAGAAGATAGCTGATGTATATAACCAAACTAAGGATAAAGAAAAAGCACAGGAAGCCGGTAGGCGTTTAGAACTCCAACAGTTAGAAGAGCAAGAAGCTGCTTTACGCCGTGTTCTTCAAACAAACCAGGGAAATAAAGCTGTTGAGAAAGAAATTGAGAAAATTCAGCTGGAGAAACTTAAACTTACCAATCAGGGTATGGAGGCCCAGAAGAAGGTTAAGGATTACACAGATAAAATTCTTGGTGTAGATCGTGAGATAGCTCTTCTGAATGACCGCACTATGACTACTACTCAATATAGATTAGCTCAGCTAAAACTAGAACTAACTATAGAGAAAGAGAAGTACGAATGGTATACAAAACAAGCGGACAAACAAAAAGAGGCAGAACAGTCTAGACGTGCTCAAGCACAGATAAGTAGAGAGTTATGGGAAGCAGAGAAACAAGCTACTGCTACTCATGTATCTGCCCTTATGGATGCCTTAGAAGTTAGCCAAACGCAGAGAAATGTCACTGGTCAGTCCCAGATTCTCACTGAAAGGTTATCTATTCTGCAGCAGCAGCTGGAGCTGTCTAAAGGTAATACTGAAGAAGAAATTAAATATCGTAATGAGATTTATAAAACTTCAGCAGCCTTAGAACAGCTTAGAAAACAGAGAGATAGCCAGATGCAGCAACAGGTAGGGTCTTCTGTAGGTGCTGTGTACACCCCTACAACTGGATTATCTGGGGAAGATAAAGATTTTGCTGATATGCAAAATAGAATGGCTTCTTATGATCAGGCAATCTCTAAACTATCTGAGCTAAACTCTGAAGCAACCGCTGTAGCTCAAAGCATGGGTAACCTAACCAATGCTATGATTCAATTCTCTCAGGGATCTTTAGATACTACATCTATGATTGCTTCCGGTATGCAGACCGTAGCCTCTATGATTCAATATAGTACTAGTCAACAGGTTAGTGCAATTGATCAGGCTATTGCAGCAGAACAGAAACGTGACGGTAAATCAGAAGCATCTAAAGCTAAGTTGAAGAAGTTGGAAGCTGAAAAGCTGAAGATTCAACAAGACGCAGCTAAGAAGCAGATTATCATCCAAACTGCAGTAGCTGTAATGCAGGCAGCCACTGCTGTTCCATATCCGTTCTCTATTCCACTAATGGTTGCGGCAGGTTTAGCGGGTGCATTGGCATTAGCACAAGCATCTTCTGCATCTGGTATGTCAAGTATTGCAGATTCTGGAGCGGATACAACTAGTTACCTAACCTTAGGAGAACGTCAGAAGAATATAGATGTGTCCATGTCTGCTAATGCAGGTGAACTGTCTTATATTCGTGGCGATCAAGGTATAGGTAGCGCTAACTCTTTCGTTCCTCGTGCTGAGGGTGGTAATATGTACCCTGGGGTTAGCTATCAAATGGGTGAGCATGGTACAGAAGTAGTTACCCCTATGGTTCCTATGAAAGCTACACCTAATGATGAGCTAAAAACTTCATCTAACTCAACTTCAGGAAGACCTATCATCTTGAATATTAGTGCTATGGATGCTGCAAGTTTTAGAGAGTTTGCTTCTAGTAATAGTAGTGCTCTAAGAGACGCAGTAGAATTAGCTCTGAATGAGAACGGTGCTAGTCTGAAAACATTAGGAAATTCTTAA

Genome Context

Tertiary structure

PDB ID

59126c08ae888740de6761969c07d1a431637fada84b9ffc458f40a316503254

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6057

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence