Protein

View in Explore

Genbank accession

YP_010742498.1 [GenBank]

Protein name

tail fibers protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,87

Evidence RBPdetect2

Probability 0,97

Protein sequence

MAAGTLSVTNNSKAVVGVGTTFTAFKAGDFLTLVVGQVPYTVAIASIESATALTLVLPFDGPTATGLAWDGVKRDTMSLATMGVTVQAQKALRLMIADENNWRAIFGEEEEISVTLPNGQVVQGMSWGYLSKLLKDVDPVELQAIADQTITAKNQAQGFRNEAEGFKNTANTAKTAAEAAQGKAETAKTAAESAKTAAETAKSQAVTAKSQAVTAKDQAKGFRDEAEGFANSADASQKVPYAGVTVNAPTGVRDMLKRLRDAVKGGFWRVDDISQFQAGEMTPFRYGPGVCGGAGDTFFAINVDWQTSRVKVFSGNNAAINGSSGRVSAIELAKLGSNGDVAIGDGGTGASNDQGARANLQAMHERRATLVSEDLNDLQGDKAGFYYTGLSANATPERNYPFQEAGCLLVQRTGANDPKSCVQTYTLYRNGRRWIRWLDNAATGIWSQWYELYNAGSSPTFSGVITGSAVRASVDGKIITIKPGAKDVFVHNSASNKYFQLRDNGELAYDNNLIAYNGLAASGTFAMTVPSIKVITANGGFRIDGTASTNDQPLHVTGYNSAGTRLWFLGKDTGTNALFLNDITSCKVELIKDGVVLGTKNFAGKAYVQAASLEINRPSGKYFKMQNDGNSSHPATFKLWGNGAGRPSVIEFGLDDGPGWLFYAQYNSNGTRQMSVNGTVNCTTVNQSSDRELKDNIKPIENARAGLAKMGGYTYTLKKDGMPYAGVIAQEVMDVVPEAVSTFEDHEYLAGPTQDGEELVGRQRFFQVDYGAIAAYAVQVCKEQEEELVSLRSELEELKAAVAALSKA

Physico‐chemical properties

protein length:	808 AA
molecular weight:	86127,26690 Da
isoelectric point:	5,54853
aromaticity:	0,08540
hydropathy:	-0,26510

Domains

Domains [InterPro]

DC_0162
STR
1–340

DC_0162 cd19958 IPR030392

DC_0613
RBD
380–808

DC_0613

IPR030392
CHP
689–740

IPR030392 Coil

YP_010742498.1

1 808

Architecture

STR

RBD

STR 1-340 | STR 366-453 | RBD 454-808

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0162	STR	DC_0162	1	340	Novel HMM	DC_0162	Central	Low	Positional only	123 proteins / 123 hits
cd19958	STR	DC_0464	366	453	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_0613	RBD	DC_0613	380	808	Novel HMM	DC_0613	C-terminal	Low	Positional only	34 proteins / 34 hits
IPR030392	CHP	DC_0088	689	795	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	689	740	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	781	808	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage PC2 [NCBI]	2936919	Uroviricota > Caudoviricetes > Dhillonvirus >
Host	Escherichia sp. [NCBI]	1884818	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_010742498.1 [NCBI]

Genbank nucleotide accession

NC_073088.1 [NCBI]

CDS location

range 8458 -> 10884
strand -

CDS

ATGGCAGCGGGTACTCTATCCGTAACGAATAACAGCAAGGCGGTTGTAGGGGTAGGCACAACGTTTACCGCGTTTAAAGCTGGTGACTTCTTAACGCTGGTGGTAGGACAAGTCCCCTACACCGTAGCGATCGCGTCCATTGAAAGCGCAACCGCGCTCACGCTGGTGTTGCCGTTCGACGGCCCAACGGCAACCGGCCTTGCGTGGGATGGCGTTAAGCGCGATACCATGTCGCTGGCGACGATGGGCGTAACCGTCCAGGCGCAAAAAGCGCTGCGATTGATGATCGCAGATGAGAACAACTGGCGCGCAATCTTCGGAGAAGAAGAGGAAATCTCGGTCACGCTGCCGAACGGTCAAGTAGTGCAGGGCATGTCGTGGGGCTACCTGTCTAAACTGCTTAAAGATGTAGACCCGGTTGAATTGCAGGCTATCGCAGACCAGACCATCACGGCTAAAAACCAGGCGCAAGGCTTCCGTAACGAGGCGGAAGGATTCAAGAACACCGCGAATACAGCTAAAACAGCGGCGGAGGCCGCACAGGGCAAAGCCGAGACAGCTAAGACGGCAGCCGAGTCCGCAAAGACTGCCGCGGAGACAGCTAAGTCGCAGGCCGTAACTGCTAAGTCGCAGGCCGTAACTGCTAAAGATCAGGCAAAAGGATTCCGCGACGAGGCAGAAGGCTTTGCGAACAGCGCGGACGCCTCGCAGAAAGTGCCGTATGCGGGCGTCACCGTAAACGCTCCGACTGGCGTGAGGGATATGCTAAAGCGGTTGCGCGATGCGGTCAAAGGCGGTTTTTGGCGCGTTGATGATATTTCGCAGTTCCAAGCCGGTGAGATGACCCCTTTCAGATACGGACCCGGTGTATGTGGCGGCGCGGGGGATACATTCTTTGCAATCAACGTTGACTGGCAAACCTCGCGCGTTAAAGTTTTCTCGGGAAACAATGCCGCGATTAACGGATCGTCTGGAAGGGTTAGCGCTATTGAGCTTGCGAAGCTGGGGTCAAATGGGGACGTGGCGATCGGAGACGGTGGGACAGGTGCGTCAAACGACCAGGGCGCGCGCGCCAATCTTCAGGCAATGCACGAGCGCCGGGCAACGTTGGTAAGCGAAGACCTTAACGACCTTCAGGGTGATAAGGCCGGATTTTATTATACTGGCCTGAGTGCCAACGCAACGCCGGAGCGTAATTATCCCTTTCAGGAAGCAGGTTGCCTACTTGTTCAGCGCACTGGCGCTAACGACCCGAAGAGTTGCGTACAGACGTACACATTATACCGCAACGGGCGGCGCTGGATTCGATGGCTAGACAACGCGGCTACTGGAATATGGTCGCAGTGGTACGAGTTGTATAACGCAGGGTCGTCGCCGACTTTTTCTGGAGTAATTACTGGATCTGCGGTGCGCGCTTCCGTTGACGGAAAGATCATAACTATTAAACCTGGCGCCAAAGATGTATTTGTTCACAACTCGGCATCTAATAAATACTTTCAACTTCGTGACAACGGCGAACTGGCGTATGACAACAATCTGATCGCGTATAACGGGCTTGCAGCCAGCGGCACATTTGCTATGACCGTACCCAGCATTAAAGTTATAACCGCTAATGGCGGATTTCGTATCGACGGAACAGCGTCAACAAACGACCAACCACTGCACGTAACAGGGTACAACTCCGCAGGCACACGTCTTTGGTTTTTAGGGAAAGACACTGGGACGAACGCCTTATTCCTGAACGATATTACATCGTGTAAGGTTGAGCTGATCAAGGACGGCGTTGTGCTTGGTACAAAGAATTTTGCGGGTAAAGCATACGTTCAGGCCGCAAGTTTAGAGATCAACCGTCCGAGTGGCAAGTATTTCAAAATGCAGAACGACGGCAACTCGTCACACCCAGCAACCTTCAAATTGTGGGGTAACGGGGCAGGTCGCCCGTCGGTTATTGAGTTTGGGCTTGACGATGGTCCGGGGTGGCTTTTTTACGCCCAGTATAACAGCAACGGCACGCGCCAGATGAGCGTTAACGGGACGGTAAACTGCACGACGGTAAACCAGTCATCGGACCGCGAGTTGAAGGACAACATCAAGCCGATCGAGAACGCTCGCGCGGGCCTTGCTAAGATGGGCGGTTACACCTACACCCTGAAAAAAGACGGTATGCCTTACGCCGGGGTTATTGCGCAGGAAGTAATGGACGTTGTGCCGGAAGCAGTGAGCACGTTTGAGGACCACGAATACCTCGCAGGGCCAACGCAAGACGGAGAGGAGCTGGTGGGTCGTCAGCGCTTCTTTCAGGTCGACTATGGCGCTATTGCCGCTTATGCAGTGCAGGTGTGCAAAGAGCAGGAAGAAGAACTGGTGTCGTTGCGTAGTGAACTGGAGGAATTGAAAGCTGCCGTAGCGGCGCTGTCTAAAGCATAA

Genome Context

Tertiary structure

PDB ID

93f56e53a969045258227871c72ff5936973958f5605f05472823a10ba2c0fde

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6804

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence