Protein

View in Explore

Genbank accession

AXQ67485.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Protein sequence

MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRENNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFLDGQVDTPIVINIYGKTDDQQQLTRTDFTAADDSIESIQQELWNTFNLYPSMTYENVDGRGNREVTFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPDAPTVLYVHQSVYDNHRTTFFVKADGTFRLGSRHINGGGITYQELKPDGSYSIVKKNDTQNPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVFVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYYIDTAEIEAKVKEMKDNARKSKDSLQKSIEELVKYIANEVNTNPITDANKLQISKLLDDIDNKKITLDGAAQTILLDPFLTDEQKVAVKKWFDKLNSDHTALKTTVMAAMQDGNLSAQDKKDISTAAETYLNDLTSWLTEMDKAADASYEQRIVDAFENAVNYANKESLHQSAVITQLYNMVSIKVSSEQVTQQFLDLNMKIEKTQEETATALDDIQTQIDSTVKNLPYKVEVTSSNGLIFVNGGVNSTIAAKVTKGTEDVTSTIAVADFIWTRVSNNTAGDTAWNNAHKNVGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQNKWVEINRFDVNIRNLLIGSRDYGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGTPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLASSGLLDVGDMVTYVCYVRTVGGTSPDKGVPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGAPVSIRATQQWRMVWGTFPVTQLFLDTANDPNSTSKTVRVEPTSFTDIGAGGQLEVKSHMVVKGVIPSDWVPAPEDTKRDSDNTNWNMDALGSDNYLTRFERGLVKTKLADITGESLSGAQDMKTSSQLDADAWGKGQFYAIRKQARDIAIDPVNDAAYKNLTTSYDALRTYLRALKTGAGRNTVYPWDTSSDTVMDVVRTAWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNAEIGKISKTGQHSTTDLRVPTTSISPKVTTIALPSFKGNTKNNLEVGGINLLDGTINPAEIVGDGTSNQTKNIYAFHGGNSTEMINSQTVVGFYWSITPNGNNPVAGKMYLQGSNPYPSLIPTITFTPDKLSGVELFTRSPIGGSTFTHVNMRVDGLSGTLRVWNMMIAKGVTEETIEYSPRLDDKDASGNTVYYNRNRAIAGVTLPTFYTAKNGTTDTARSSMTIQEVFHGDGTIRDEFYWTEDGQPTKVNRFADVLLDTGYSIAIQNQNVSLGGKRYIQVQLNNFADKPILNNGTVRMANGKGVELSRLVTGNFTQPDQFKVDYANANISFLVSADEMNVTSTYQVKGQDVAFFLRGWKLFQGEPVQQTAPSGATIFTFPPYNATSGVAPNFTPIGYTQKDLAIINRGEIAATDTYKRPVEIAPPIKSKQTGQQWQIVYALNSQYDSYCSFTGAIDLIGDPEGVSPTVIRYAYVDWTPTFFDKDGTFMYGNNLATAQEDTRYLIPVLERRIANAETKVETDSIKSVVFSSREYELGLQDKANVTDLQGKADKGDLTDLATKDELAQKDAEQKKALEDAMKNIDFTPYVLKSEIEQLDRSWTAAFYASGGMNIVKNSIGFDKSVSPILKKETFTFWDAVSNTAYNLPESIQTNALDALGFTSGFMFNAATNNTATVIGQVLNVIPNQPYTISYFLQKMTAGDSTYRFNIELQRPTVDNPTNDSHWVTISGGQLADNSSIKHSAFMPSYFEFTPTTSKVRLLLTASPKCTAQISGIMVNIGKKPIKWTMATGENYNTNVRMNLNGIRVSQVDKDGNEIGYTVITPEKFAGYYIKDGKPEEIFRLDGDETWTKKLRAENEINMGPIKILRVENANNAGWAFISNY

Physico‐chemical properties

protein length:	2001 AA
molecular weight:	221156,46020 Da
isoelectric point:	5,09479
aromaticity:	0,08896
hydropathy:	-0,47096

Domains

Domains [InterPro]

DC_0209
STR
9–919

DC_0209 DC_0015

Coil
Unmapped
375–395

Coil Coil Coil

AXQ67485.1

1 2001

Architecture

STR

STR 9-919 | STR 956-2001

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0209	STR	DC_0209	9	919	Novel HMM	DC_0209	Central	Low	Positional only	123 proteins / 123 hits
Coil	Unmapped	-	375	395	Coils	Coil	-	-	-	-
Coil	Unmapped	-	552	572	Coils	Coil	-	-	-	-
DC_0015	STR	DC_0015	956	2001	Novel HMM	DC_0015	Central	Low	Positional only	187 proteins / 187 hits
Coil	Unmapped	-	1680	1700	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage OmnioDeoPrimus [NCBI]	2301686	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AXQ67485.1 [NCBI]

Genbank nucleotide accession

MH638311.1 [NCBI]

CDS location

range 55472 -> 61477
strand +

CDS

ATGGTAGAATTTGAACCTTTAGAAACAATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGTAAATATAAGGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTACAAATATAATACAGTTGACGTTATCACGGTAAGAGAAAACAACTCTACAGCTAAAAACCCTAACGATAACGGTAAGTACTCAGCTATGCTTCCAACACACATGTCTGGTCGTACAGCTAATGGTAATATCTACGGTTCTACTACGCTAGTAACTGTAGGTACGCGTGTACTAATCGGATTCCTTGATGGTCAGGTTGATACACCAATTGTAATCAACATCTACGGTAAGACTGATGACCAACAACAGTTAACACGTACAGACTTCACAGCAGCAGATGATTCAATCGAGTCTATCCAGCAAGAACTCTGGAACACTTTCAATCTATACCCATCGATGACTTATGAAAATGTCGATGGTCGAGGTAACCGTGAAGTAACATTCTCTGGTAAAACATTCTTAATCTCTACAGACCGTGACCAAGAGAACATGTACGTACAAGATGCACATTTCGATTATATGGACCTTCCACATTCTCGCTATGCAAACGGAGAGCTTATCGAACCAGAATCTCCTGATGCACCGACAGTACTGTACGTTCACCAAAGCGTATATGATAACCATCGTACAACTTTCTTCGTGAAAGCAGACGGTACGTTCCGATTAGGTTCACGTCATATTAATGGCGGAGGTATTACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGCAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGCGTATTTGTAAATGGTAAGCCAATCGGTTCTGGTGGTTCTGGTGGAGGTATCTCCCCTGAGTTAGAGAATATCATAAAACAGATTAATAATCAATTCTCTTTATTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAGGTAGAGAAAGACACTTACTACATTGACACTGCTGAGATTGAAGCCAAAGTTAAAGAGATGAAAGACAACGCTCGTAAGAGCAAAGATAGCCTACAAAAGTCTATCGAGGAACTAGTAAAATACATTGCTAACGAAGTCAACACGAATCCTATAACCGATGCTAACAAACTGCAAATATCGAAGCTACTAGATGACATTGATAACAAGAAAATAACATTAGATGGTGCCGCACAAACGATTCTACTAGACCCATTCTTAACGGATGAGCAAAAAGTAGCTGTTAAAAAGTGGTTCGACAAACTTAACTCCGACCACACTGCATTGAAGACTACTGTCATGGCGGCTATGCAAGACGGAAACCTATCAGCACAAGACAAGAAAGATATCTCAACTGCCGCAGAGACATACCTAAACGACCTTACTTCTTGGTTAACGGAGATGGATAAAGCAGCTGATGCTAGTTACGAACAGCGTATTGTTGATGCATTCGAGAACGCGGTAAACTACGCGAACAAGGAATCACTACATCAAAGCGCAGTAATTACTCAGCTATACAACATGGTCTCTATCAAGGTTAGCTCTGAGCAAGTAACGCAGCAGTTCCTTGATTTGAACATGAAGATTGAGAAGACACAAGAAGAGACAGCGACAGCATTAGACGATATCCAAACTCAGATTGATAGTACAGTTAAAAACTTACCATACAAGGTAGAAGTAACATCATCTAATGGTTTGATATTCGTAAATGGTGGAGTTAACTCTACCATTGCAGCTAAGGTTACTAAAGGTACAGAAGATGTAACAAGTACAATAGCTGTAGCAGATTTCATCTGGACTCGCGTTTCTAACAACACAGCAGGAGATACAGCTTGGAATAACGCTCATAAAAATGTTGGTCGCTCATTCAACATTAATGCTGCTGACGTAATTGATAGAGCAACATTCTTCTGTGATTACAAGAATCCTCCAGTAGCTACAGGTAGTGTTACAATCGCGAACATCCAAGATATTACAGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCTTTATGGTACGACCGTGGAACAGGTATCGTGTGGATGTGGCAGCAAAACAAATGGGTGGAGATTAATAGATTTGATGTTAACATTCGTAACTTATTAATCGGTTCTCGTGACTACGGCGCACAGAACTCTAACAATCCAACAGACCCTAACAACTCAACTCCTCAAGGCAACATATCAGGCGCATGGGTTATGTCAGGTGACACATCAGGAACACCACCTAAGACAGGGGTTAAACCTTCACCACAGAACGCTACGAATCAAGATACATGGATATCTTATACGCAAAGTCAATGGGGCGGAGTGAAATACAAATCTAGTAAGCTTGCTAGCAGTGGTCTATTAGACGTTGGTGATATGGTTACTTACGTGTGTTATGTACGAACAGTAGGTGGAACTAGTCCTGATAAAGGCGTACCTATTAGATTGTATGTAACAGATAATAGGGATGGTGGTACTGGTACAATTGGTTTCGAAATGAAAGATAAAGAGACAGATGGAAAACCAGTCACTGGAGCACCTGTATCGATTAGAGCTACGCAGCAGTGGAGAATGGTATGGGGAACATTCCCTGTAACTCAACTGTTCTTAGATACAGCTAACGACCCTAATAGCACATCAAAAACTGTTCGTGTAGAACCGACAAGCTTTACAGACATTGGAGCCGGAGGACAACTAGAAGTTAAGTCTCACATGGTTGTTAAAGGTGTTATTCCTAGCGACTGGGTTCCTGCTCCAGAAGATACGAAACGTGACTCAGACAACACTAACTGGAACATGGATGCTCTTGGTAGTGACAACTACCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAATTAGCAGACATTACAGGTGAATCTCTATCAGGCGCTCAGGATATGAAGACATCATCTCAGTTAGATGCAGATGCATGGGGTAAAGGTCAATTCTACGCTATCCGTAAACAGGCTAGGGACATCGCTATAGACCCTGTAAACGATGCGGCGTACAAAAACCTAACTACATCTTACGATGCACTTAGAACGTATCTGAGAGCCCTTAAAACAGGTGCTGGTAGAAATACGGTTTACCCATGGGATACTTCTTCTGATACAGTTATGGATGTAGTACGTACTGCATGGGATAAAGCGTGGGCGGATTATGAGAATGCATATGCATCATTAACTGTACTAGTTCAACAGAAACAGAAAACCTACACGGATGATAGAATCAAAGATGTTAATGCAGAAATTGGTAAGATTAGTAAAACAGGACAACACTCGACTACTGACTTACGAGTTCCGACCACTTCGATATCACCTAAAGTTACAACGATAGCTTTACCAAGTTTCAAAGGAAACACAAAGAATAACTTAGAAGTTGGTGGTATTAACCTTCTTGATGGCACTATAAATCCGGCAGAAATAGTTGGTGATGGTACTTCTAACCAAACTAAAAACATCTATGCTTTCCATGGAGGAAACTCTACAGAAATGATAAATAGCCAAACAGTAGTAGGGTTCTACTGGAGTATCACTCCAAACGGTAATAACCCAGTAGCGGGTAAAATGTATCTTCAAGGTAGCAACCCATACCCTTCGTTAATTCCTACTATCACGTTTACTCCAGATAAACTGAGTGGCGTAGAGCTATTTACAAGAAGCCCTATAGGAGGTAGCACATTCACCCACGTCAACATGAGGGTAGATGGTCTATCGGGAACACTAAGAGTCTGGAACATGATGATTGCAAAAGGTGTTACAGAGGAAACAATTGAGTACTCACCTCGTCTGGATGATAAAGATGCAAGCGGTAATACCGTGTACTATAACCGAAATAGAGCTATTGCAGGTGTAACATTACCCACATTCTACACAGCTAAGAATGGAACTACAGACACAGCACGTTCGTCAATGACAATACAGGAAGTATTCCATGGTGACGGTACTATTCGAGATGAGTTCTACTGGACAGAGGACGGGCAACCTACTAAGGTTAATAGATTCGCAGATGTATTGCTAGACACAGGTTACTCTATTGCCATCCAAAACCAAAACGTATCTCTTGGCGGAAAACGATACATTCAAGTACAGCTAAACAACTTTGCAGATAAACCTATACTAAATAACGGTACGGTTCGTATGGCTAATGGTAAAGGTGTAGAGCTTAGTCGTTTAGTTACAGGTAACTTTACGCAACCAGACCAGTTCAAAGTAGATTACGCTAACGCGAATATATCATTCTTGGTATCTGCTGATGAAATGAATGTCACTAGCACATATCAGGTAAAAGGTCAAGACGTAGCATTCTTCTTACGTGGATGGAAGTTATTCCAAGGGGAACCAGTTCAACAAACAGCACCTAGTGGAGCTACTATTTTCACCTTCCCACCTTATAACGCTACTAGTGGAGTTGCACCTAACTTCACTCCAATAGGGTATACTCAAAAGGACTTAGCGATTATAAACAGAGGAGAGATTGCTGCTACAGATACGTACAAGAGACCAGTTGAGATAGCACCTCCTATAAAGTCAAAGCAAACAGGACAGCAATGGCAAATCGTTTACGCGCTTAACTCACAGTACGATTCTTATTGCTCATTTACTGGAGCTATTGATTTAATAGGAGACCCAGAAGGCGTGTCACCTACAGTTATCCGTTACGCGTACGTAGACTGGACTCCTACGTTCTTTGATAAAGACGGTACATTTATGTATGGTAACAATCTAGCTACCGCTCAAGAGGACACTAGGTACCTTATACCTGTACTAGAACGTCGTATAGCTAATGCAGAAACGAAAGTAGAGACAGACTCTATTAAGAGTGTTGTATTTAGTTCCCGTGAATATGAGTTAGGCTTACAAGATAAAGCCAATGTTACAGACCTGCAAGGTAAAGCGGATAAGGGTGACTTGACTGACTTAGCTACAAAAGACGAGTTAGCCCAAAAAGACGCTGAACAGAAGAAAGCGTTAGAGGATGCAATGAAGAACATCGATTTCACACCGTATGTTCTAAAGTCTGAGATTGAACAGTTAGACCGTTCATGGACAGCCGCATTCTACGCATCGGGCGGTATGAACATTGTTAAGAACTCTATCGGTTTTGACAAGTCTGTTAGCCCTATATTAAAGAAGGAGACGTTCACATTTTGGGATGCAGTGTCTAACACAGCTTACAACTTACCAGAAAGTATCCAAACTAACGCTCTTGACGCATTAGGGTTTACAAGTGGATTCATGTTTAATGCAGCTACTAATAACACAGCTACAGTAATTGGTCAAGTACTAAATGTTATCCCGAACCAACCGTACACTATCAGCTACTTCTTACAGAAGATGACAGCGGGAGATAGTACGTACAGGTTCAACATCGAGCTTCAAAGACCTACTGTAGACAACCCAACTAATGACAGTCACTGGGTAACAATTAGCGGCGGTCAATTAGCGGATAATAGCAGTATTAAACATAGTGCATTCATGCCTTCTTACTTTGAGTTCACACCAACAACGAGCAAAGTTAGATTACTGTTAACAGCCTCTCCTAAGTGTACCGCACAGATTTCGGGTATAATGGTTAACATAGGGAAAAAGCCTATTAAGTGGACAATGGCTACTGGTGAGAACTATAACACAAACGTCCGCATGAACTTAAACGGTATCCGTGTATCTCAGGTTGACAAGGATGGTAACGAAATTGGGTATACCGTTATAACGCCGGAAAAATTTGCGGGTTATTACATTAAGGATGGTAAGCCGGAAGAGATATTCCGACTCGACGGTGATGAGACGTGGACTAAGAAGCTGAGAGCAGAAAATGAAATAAACATGGGACCAATCAAGATATTACGCGTAGAGAATGCAAACAACGCAGGTTGGGCGTTTATTTCGAATTACTAA

Genome Context

Tertiary structure

PDB ID

b9a41997be16c4e7581f48f40f79c354452c6316f7b06fa5d0a9822647c118a0

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7019

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence