Protein

View in Explore

Genbank accession

WAE77162.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,95

Protein sequence

MYSIKTDLDITGAGTVGKDLLVKGNAVIKNNLRVDGSISFANATFTAIETETAIINSTLDVGGKATLSGGLDITGNTTIGSADGGSDTVTINSSATFNGTVSVGSDFSQTAGSTTLQSTKVKSLEVVGETTLKGDLSAEVGTTAAFDKITSNSAEITTITATDITSTGTAEFQDVNISGTLGGEFNLSDLNAETLNVTGASNQKGAVTFGANVTGINSTATFKDIRIGTDSESQTSRLSFPYSAPDKRPTVILQNEIQSELMSPAKLTVLTSATFGNASLSSYGITGNGLNKLDYLTVSGNDTQSPDTPLLEVTKGKTKVADFEVTGTATIPDIESTGTANFNNINVSGTFGGDFQLDDIDANTLNIKGASSLVGGVTLGSNITGLNGTASFKAISLGQNSQDSAVKLGFAYTAQDKRPTVILPNEVQSELVSPATLKVLKTATFGNASLSSYGITGNGLNKLDYLTITGNDTQDPSTPYLTVGGKAILNDVEFTGTVTGLTVDVSGQDLTPNSVVAAANIKGATLESTGNTTVGAKLTVTGDIAGTTATLSGALSAGSVSSGTITGTTSVSAPTISASTEVTAPTITASGTVSGQTINGTNISATNLTAPTISGDTNFTENVDITGSLTVGSLDLSTTDINAKSITTTAGATIGGDLVVQGSFDLSAANLNVKSLTTSGIVKSNDLVNANVLPVLNSTTITTTTVNADDITVTGSANLGTIYSSSSVLVGSTLTVTGETTTASLVTPTISNASGVTISNNTNVTGDLTVTGAVIPGSIDLATTDVNAKSITTTAGATIGGNLTVNGTVDLTTADVTVKSLTSTGAIVSNESSIASVLPKLESTDGTITTLGSTTANITNLKVTGASTVADMTSSGKVKAVTIETPTISNDDGVSISNDTTVTGNLTVSGTVSPGAIDLSNTEVNAKSITTTEGANIGGDLVVSGTVNLSGADVSVKSLTSSGIITVNSKDGINALPKVKSTEITTTTLNATNAVVAGDISAASANITGEMNGISLTLSGEETALTVTNNATIGGALTAGSITSASETVSITKNTAITGNLAVSGTLTAGVIDLSKTDVSVKTLNSLGDATVHGNLTVDGTINLSSANIVGVTLESTGSTTVGTELVLTTGDITGNPSISGNISVAGTTTLTGATTISSTLNTAEKLTVNAGGIDVVAGDVQVVKGSITAPSANISGSSTLNSATVTTTLDVTGAASMNGGLTASTLDVTGDSTVQQLTVKGNFIPEGGLDLSGADLTVNSVSAAKTLSVTGTSTLSGGVTTTTVNASGKVTAKDLSTGTLEVTTNGTVGGTLGVTGKTTVGSLESGAISATSGTFSTTLDVTGAATFGNNVNITGTLTPGALDLTGADVIANSLSVATTIHSDGNATVGGTLDVTGKATAPSITLNGEGTALAVTNNATVGGTLGVTGKATVGSLTTSGAVKTGSNVIVGTQVGEHTETVQIFPNTYIAGSLRVDGGINADIDVSGQTIEPYAVVAANNISAAGNITAGAELISKSATIGDVGSQNNNLTINGNVVNNGDFTVTGTLNAKLNQANSDVAVKSLTATNTVSAGTSITAGTSITATELLKGNTLEVITTGSFGGAVTMSGGASVTGDLVVDGKLTATGATTLEAASVTTITTSGAATLASASVTGNATIGGTLTVSGLMTASGSVVLGNTNTDTLTVNSTPTFKENAVFDKEVTVTGKLTTTNAELATTTVTTKKYDVIPSKVTSSVIAPNGTWTPDGTSNVYFITLDQDTTLAPITGLIGGGKASSVYIYVKQDATGNRNFTTDGTYAVVDGTLNKTANSVTIYQVIYDGVSSVADMFIAQRTA

Physico‐chemical properties

protein length:	1834 AA
molecular weight:	181435,06650 Da
isoelectric point:	4,26624
aromaticity:	0,02781
hydropathy:	0,14406

Domains

Domains [InterPro]

DC_0092
STR
130–331

DC_0092 DC_0092 DC_0062 DC_0931

DC_0092
STR
313–595

DC_0092 DC_0092 IPR058970

WAE77162.1

1 1834

Architecture

STR

RBD

STR 130-859 | STR 875-1194 | RBD 1424-1834

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0092	STR	DC_0092	130	331	Novel HMM	DC_0092	Central	Low	Positional only	72 proteins / 72 hits
DC_0092	STR	DC_0092	313	595	Novel HMM	DC_0092	Central	Low	Positional only	72 proteins / 72 hits
DC_0092	STR	DC_0092	561	699	Novel HMM	DC_0092	Central	Low	Positional only	72 proteins / 72 hits
DC_0092	STR	DC_0092	683	859	Novel HMM	DC_0092	Central	Low	Positional only	72 proteins / 72 hits
DC_0062	STR	DC_0062	875	1194	Novel HMM	DC_0062	Central	Low	Positional only	50 proteins / 50 hits
DC_0931	RBD	DC_0931	1424	1834	Novel HMM	DC_0931	C-terminal	Low	Positional only	65 proteins / 65 hits
IPR058970	RBD	DC_0552	1743	1822	InterPro cluster	Putative phage tail fibre, C-terminal domain	C-terminal	Low	Positional only	292 proteins / 292 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage ph0011 [NCBI]	2995639	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WAE77162.1 [NCBI]

Genbank nucleotide accession

OP557969.1 [NCBI]

CDS location

range 155242 -> 160746
strand -

CDS

ATGTACTCAATAAAAACTGACTTAGATATTACTGGTGCTGGAACAGTTGGTAAGGATCTATTAGTCAAAGGTAATGCAGTAATCAAGAATAACCTAAGAGTAGATGGTAGTATCTCTTTTGCAAACGCAACATTTACTGCTATTGAAACTGAAACAGCTATCATCAACTCTACTTTAGATGTTGGTGGTAAAGCAACATTAAGTGGTGGCCTTGATATTACTGGAAATACCACAATCGGCAGTGCAGATGGTGGTTCTGATACAGTAACAATCAATTCAAGTGCTACGTTTAACGGTACTGTGTCGGTGGGTAGTGATTTTTCACAAACTGCTGGTTCAACCACACTACAATCAACTAAAGTAAAAAGCTTAGAAGTTGTGGGAGAAACAACACTTAAAGGGGACTTATCTGCTGAGGTTGGTACAACCGCTGCTTTTGATAAAATTACTTCCAATTCCGCAGAAATTACAACTATTACCGCAACTGACATTACTAGTACTGGCACTGCTGAGTTTCAAGATGTGAATATTAGTGGTACACTAGGTGGCGAGTTTAATCTTTCTGATTTAAACGCTGAAACATTGAATGTTACTGGTGCATCTAATCAAAAAGGTGCGGTAACTTTTGGTGCTAACGTAACTGGTATTAATAGCACTGCTACATTTAAAGATATCCGTATCGGAACCGACTCTGAATCACAAACCTCCAGATTGAGCTTCCCTTACAGTGCTCCTGATAAACGTCCAACAGTAATTCTACAAAATGAAATTCAATCTGAATTAATGTCACCTGCTAAATTGACAGTTTTAACTTCTGCTACTTTTGGTAATGCATCATTGTCTTCTTATGGTATTACTGGTAATGGTCTAAACAAACTAGATTATCTAACCGTTTCTGGTAACGATACACAATCACCTGACACCCCACTTCTAGAAGTGACAAAAGGTAAAACTAAAGTTGCTGATTTTGAGGTTACTGGAACAGCAACCATTCCAGATATTGAAAGTACTGGTACTGCTAATTTTAATAATATTAATGTTTCCGGTACATTTGGTGGTGATTTCCAACTTGATGATATTGATGCAAACACTTTAAATATAAAGGGTGCGTCTTCTTTAGTTGGTGGTGTTACACTAGGATCTAATATTACTGGTTTAAACGGTACTGCTTCTTTTAAAGCTATTAGTTTAGGTCAAAATTCACAAGATTCTGCTGTGAAACTAGGTTTTGCGTATACCGCACAAGATAAACGTCCAACCGTTATTTTACCTAATGAAGTTCAATCTGAGTTGGTTTCCCCAGCAACATTGAAAGTACTTAAAACTGCTACCTTTGGTAATGCATCACTATCTTCTTATGGTATTACTGGTAACGGCCTAAACAAACTAGATTATCTAACTATCACTGGTAACGATACTCAAGACCCAAGTACACCATACCTTACAGTTGGTGGTAAGGCAATTCTTAATGATGTTGAATTTACTGGAACAGTAACTGGACTAACTGTTGATGTTAGTGGTCAAGATCTAACACCTAATTCTGTTGTCGCGGCAGCAAATATTAAAGGTGCAACACTTGAAAGTACTGGTAACACTACCGTGGGTGCTAAACTAACTGTTACTGGTGATATTGCTGGTACAACTGCAACTCTTTCTGGTGCATTATCCGCTGGTTCAGTAAGTTCTGGTACTATTACTGGTACAACTTCTGTATCTGCACCAACAATTAGTGCATCTACTGAAGTAACGGCTCCTACTATCACTGCGAGTGGAACTGTAAGTGGGCAAACAATTAACGGTACTAATATTAGTGCAACAAATCTTACTGCACCAACTATTAGTGGTGATACTAACTTCACCGAAAATGTTGATATTACTGGTAGCTTAACTGTTGGTTCTCTAGACTTGAGCACTACCGATATTAATGCTAAATCAATCACTACTACTGCTGGTGCAACTATTGGTGGTGATTTAGTAGTTCAAGGCTCTTTTGATTTATCAGCAGCCAACCTTAATGTTAAATCATTAACTACTTCTGGTATTGTTAAAAGTAATGATCTTGTTAATGCTAACGTACTTCCAGTACTTAATAGTACTACCATAACGACAACTACTGTTAATGCTGATGATATAACTGTTACCGGATCTGCTAATTTGGGTACAATTTACTCAAGCTCATCTGTTCTAGTTGGGTCAACTTTAACTGTAACTGGTGAAACTACAACTGCATCGTTGGTTACCCCAACCATTTCAAATGCAAGTGGTGTCACTATTTCCAATAATACAAATGTAACTGGTGACCTAACCGTTACTGGTGCAGTTATTCCAGGTTCTATCGATCTAGCAACAACTGATGTTAATGCTAAATCCATTACTACTACTGCTGGTGCAACTATTGGTGGTAACCTAACTGTTAATGGTACAGTAGATCTTACTACGGCTGATGTTACTGTCAAATCTTTAACTAGTACTGGTGCAATTGTTAGTAACGAATCTTCTATTGCTAGTGTTCTTCCTAAACTAGAAAGTACTGATGGTACGATTACTACACTTGGCTCAACTACTGCAAATATTACTAATCTAAAGGTCACTGGTGCATCTACTGTTGCTGACATGACTTCTTCTGGTAAAGTTAAAGCTGTTACAATTGAAACCCCAACAATTAGCAATGATGATGGCGTATCTATTTCTAATGATACTACAGTTACTGGTAATCTCACAGTTTCTGGAACTGTATCACCTGGTGCAATTGATTTGAGTAACACTGAAGTTAATGCAAAATCAATCACTACAACAGAAGGAGCTAATATTGGTGGCGATCTAGTTGTTTCTGGTACAGTTAACTTAAGTGGTGCAGATGTTTCTGTTAAATCTCTAACAAGTTCTGGTATTATTACAGTTAATAGTAAAGATGGTATCAACGCACTACCTAAAGTGAAAAGTACTGAAATTACCACAACAACCCTAAACGCAACAAATGCGGTAGTTGCTGGTGATATTTCTGCGGCATCGGCAAATATTACTGGTGAAATGAATGGTATTTCTTTAACACTATCTGGTGAAGAAACAGCGTTAACCGTAACTAACAATGCAACCATTGGTGGGGCACTTACTGCTGGCTCCATTACGTCAGCATCAGAAACAGTATCTATTACTAAAAATACAGCAATAACTGGTAATTTGGCAGTATCTGGAACACTTACTGCGGGTGTAATTGACCTTAGTAAAACTGATGTTTCAGTGAAAACATTAAATTCACTTGGTGATGCGACCGTTCACGGTAACTTAACTGTTGATGGTACTATTAACCTAAGTTCTGCAAACATCGTTGGTGTAACACTAGAAAGTACTGGTTCTACTACTGTAGGTACTGAATTGGTTCTCACTACTGGTGACATTACAGGTAATCCATCTATCTCTGGAAACATAAGTGTAGCTGGAACTACAACCTTAACTGGTGCAACAACAATTTCAAGTACGTTGAATACTGCTGAAAAACTAACAGTTAATGCTGGTGGTATTGATGTTGTTGCGGGTGATGTACAAGTTGTAAAAGGATCTATTACTGCACCTAGTGCTAATATTTCCGGTAGCTCCACACTAAACAGTGCAACTGTAACAACTACACTAGATGTTACTGGTGCAGCAAGTATGAATGGTGGTTTGACTGCTTCTACACTAGATGTAACTGGTGACAGTACTGTTCAACAACTAACAGTTAAGGGTAATTTTATTCCTGAAGGTGGTTTAGACCTATCAGGTGCTGATCTTACTGTAAACAGCGTTAGTGCAGCAAAAACACTCAGTGTTACTGGGACAAGCACCCTAAGTGGTGGTGTTACAACAACAACTGTTAACGCATCTGGTAAAGTGACAGCAAAAGATCTAAGTACTGGAACACTAGAAGTTACAACAAATGGAACAGTTGGTGGTACACTGGGTGTAACTGGAAAAACCACTGTTGGTTCACTTGAATCTGGTGCAATCTCTGCAACTTCTGGTACATTTAGCACTACACTAGATGTAACTGGTGCAGCAACCTTTGGTAATAATGTTAACATTACTGGTACATTAACACCAGGTGCATTGGATTTGACTGGTGCGGATGTAATTGCAAACAGTCTTTCTGTTGCAACAACAATACATTCAGATGGTAATGCAACTGTTGGTGGTACACTAGATGTAACTGGTAAAGCAACTGCTCCATCAATTACACTGAATGGTGAAGGAACAGCATTGGCAGTAACTAATAATGCAACTGTTGGCGGTACACTAGGTGTTACTGGCAAAGCAACAGTAGGTTCTCTAACAACTTCTGGTGCAGTGAAAACTGGATCTAATGTTATTGTTGGTACACAGGTCGGTGAACACACTGAAACTGTTCAGATTTTCCCTAATACATATATTGCTGGTTCTTTGCGTGTTGATGGTGGTATTAACGCAGATATTGATGTTAGTGGTCAAACAATTGAACCTTATGCAGTTGTTGCAGCAAACAATATCAGTGCTGCTGGCAACATTACCGCTGGTGCTGAGTTAATTTCTAAATCAGCAACAATTGGTGATGTCGGTTCACAAAATAACAATCTAACTATCAATGGTAATGTTGTTAACAACGGTGACTTCACAGTAACAGGTACTCTAAATGCTAAACTTAACCAAGCTAACTCTGATGTAGCTGTGAAGTCCTTAACTGCAACTAATACTGTTTCTGCGGGTACAAGCATTACCGCTGGTACAAGTATCACAGCAACTGAATTACTAAAAGGTAACACACTTGAAGTAATTACAACTGGTTCATTCGGTGGGGCAGTAACAATGTCCGGTGGTGCATCCGTAACTGGTGATCTAGTAGTTGATGGTAAACTTACCGCAACTGGTGCAACCACACTAGAGGCAGCATCTGTTACAACAATAACTACATCTGGTGCAGCTACACTTGCTAGTGCATCAGTAACTGGTAATGCAACTATTGGTGGTACACTAACTGTTTCTGGTTTGATGACAGCAAGTGGTAGTGTGGTTTTAGGTAATACTAATACTGACACACTAACTGTTAATTCAACACCAACTTTCAAAGAAAATGCGGTGTTTGATAAAGAAGTAACTGTTACTGGTAAGTTAACTACAACCAACGCAGAACTCGCCACTACAACCGTAACTACCAAAAAGTATGATGTTATTCCAAGTAAAGTAACTTCCTCTGTTATTGCACCGAATGGTACTTGGACCCCTGACGGTACTAGCAACGTATACTTCATCACTCTTGATCAAGATACTACTCTAGCACCAATCACTGGTCTAATCGGTGGTGGAAAAGCATCATCAGTATACATTTATGTTAAACAAGATGCAACTGGTAATAGAAACTTTACTACTGATGGTACATATGCTGTTGTTGATGGGACTCTAAATAAAACTGCAAACTCTGTAACTATCTATCAGGTAATTTACGATGGTGTAAGTTCAGTAGCAGATATGTTTATTGCTCAACGTACCGCTTAA

Genome Context

Tertiary structure

PDB ID

5166dd4cc6b87aeb0a82c8331ec2f24245a8625e22d0dd0cbe0c838e2b9c409e

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,4755

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence