Protein

View in Explore

Genbank accession

AOZ61725.1 [GenBank]

Protein name

tail fiber protein

RBP type

TSP

Evidence RBPdetect

Probability 0,57

Protein sequence

MVEFEPLETMRFQSQLGKEMKRKYKEGNNLVTLSLADVVKVNYKYNTVDVITVRDNNSTAKNPNDNGKYSAMLPTHMSGRTANGNIYGSTTLVTVGTRVLIGFIDGQVDTPIVINIYGKTDDQQQLTRTDFTSADDSIESIQQELWNTFNLYPSMTYDNIDGRGNREITFSGKTFLISTDRDQENMYVQDAHFDYMDLPHSRYANGELIEPESPGAPTMLYVHQSVYDNHRTTFFVKSDGTFRLGSRHISGGGITYQELKPDGSYSIVKKNDTENPEEESSDLSSIEILKDGNVVLQNPKTKMEITDEGVLVNGKPIGSGGSGGGISPELENIIKQINNQFSLLKITMSEIEGGLETKVEKDTYYIDTAEIEAKVKEMKDNARKSKDSLQKSIEELVKYIANDVNTNPITDANKLQISKLLDDIDNKKITLDGAAQTILLDPFLTDEQKVAVKKWFDKLNSDHTALKTTVMAAMQDGNLTVQDKKDISTAAETYLNDLASWLTEMDKAADASYEQRIVEAFENAVNYANKESLHQSAVITQLYNMVSIKVSSEQVTQQFLDLNMKIEKTQEETSTALDDIQNQIDNTVKNLPYKVEVTSSNGLIFVNGGVNSMLAAKITKGTEDITSTVPASDFVWTRVSNNTAADTAWNNAHKDSGRSFNINAADVIDRATFFCDYKNPPVATGSVTIANIQDITVGNVEPTNPREGALWYDRGTGIVWMWQQGSWVEINRFDVNIRNLLIGSRDFGAQNSNNPTDPNNSTPQGNISGAWVMSGDTSGNPPKTGVKPSPQNATNQDTWISYTQSQWGGVKYKSSKLAGSGLLSVGDMVTYVCYVRTVGGASPDKGIPIRLYVTDNRDGGTGTIGFEMKDKETDGKPVTGTPVQMRATQQWKMVWGTFPVTQLFLDTANDPNSTSKTVRVEPTSFTDIGAGGQLEVKSHMVVKGVIPSDWVPAPEDTKRDTDNTNWNMDALGNDNYLTRFERGLVKTKLTDITGESLSGSQDMKTSAQLDADTWGKGQFYAIRKQARDIAIDPVNDAAYKNLTTAYETLRTYLRALKTNTGRNTVYPWDTSSDVVMDVVRTAWDKAWADYENAYASLTVLVQQKQKTYTDDRIKDVNAEIGKISKTGQHSTTDLRIPTTSISPKVTTIALPSFKGNTKNNLEVGGINLLDGTITPAEIVGNGTSNQTKNIYAFHGGNSTEMINSQTVVGFYWSITPNGNNPVAGKMYFQGSNPYPALTPTLTFTPDKLSGVELFTRSL

Physico‐chemical properties

protein length:	1258 AA
molecular weight:	138825,16480 Da
isoelectric point:	5,02141
aromaticity:	0,07870
hydropathy:	-0,52862

Domains

Domains [InterPro]

Coil
375–395

Coil Coil

AOZ61725.1

1 1258

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	375	395	Coils	None
Coil	552	572	Coils	None

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage BJ4 [NCBI]	1909402	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AOZ61725.1 [NCBI]

Genbank nucleotide accession

KX961629.1 [NCBI]

CDS location

range 54153 -> 57929
strand +

CDS

ATGGTAGAATTTGAACCTTTAGAAACGATGAGATTCCAATCACAACTCGGTAAAGAAATGAAACGAAAATACAAAGAGGGTAACAATCTTGTTACTCTCTCTCTTGCTGATGTCGTAAAAGTTAACTATAAATATAATACAGTTGACGTTATCACAGTAAGAGATAATAACTCTACAGCTAAAAACCCAAACGATAACGGTAAGTACTCAGCTATGCTTCCAACTCATATGTCTGGTCGTACAGCTAATGGTAATATCTATGGTTCTACAACATTAGTAACTGTAGGTACTCGTGTACTAATCGGGTTTATCGATGGGCAAGTTGACACACCAATCGTAATTAACATCTACGGTAAAACAGATGACCAACAACAATTAACTCGTACGGACTTCACATCAGCTGATGATTCAATTGAGTCTATCCAACAAGAATTATGGAACACTTTCAATCTATACCCATCTATGACTTATGATAACATCGATGGTAGAGGGAACCGTGAAATAACATTCTCTGGTAAGACGTTCTTAATTTCTACAGACCGTGACCAAGAGAACATGTACGTACAGGATGCACATTTCGATTATATGGACCTTCCACATTCTCGTTATGCAAACGGAGAGCTAATCGAACCAGAATCTCCAGGTGCACCTACAATGTTATACGTTCACCAAAGCGTATATGACAACCATCGTACAACGTTCTTCGTCAAGTCAGACGGTACGTTCCGATTAGGTTCCCGTCATATCAGTGGCGGAGGTATCACGTACCAAGAACTAAAACCAGATGGCTCTTACTCAATCGTTAAGAAGAATGATACGGAGAATCCAGAAGAAGAATCTAGCGACCTATCTTCTATCGAAATCTTAAAGGACGGTAACGTAGTGTTACAGAATCCTAAGACGAAAATGGAGATTACTGATGAGGGTGTACTTGTAAACGGTAAGCCTATCGGTTCTGGTGGTTCTGGTGGAGGTATCTCCCCTGAGTTAGAGAATATCATAAAACAAATCAATAATCAATTCTCTTTACTAAAAATTACAATGTCTGAGATTGAAGGCGGTCTTGAAACAAAGGTAGAGAAAGACACTTACTACATCGACACCGCTGAGATTGAAGCAAAAGTTAAAGAGATGAAGGACAACGCTCGTAAGAGCAAAGACAGTCTACAAAAGTCTATCGAAGAACTAGTGAAATATATTGCTAACGATGTCAACACGAATCCTATTACAGATGCTAACAAGTTACAAATATCGAAGCTGTTAGATGACATCGATAACAAGAAAATAACACTAGATGGTGCTGCACAAACTATTTTACTAGACCCATTCTTAACTGATGAACAGAAAGTAGCTGTTAAAAAGTGGTTCGACAAGCTTAACTCTGACCACACCGCATTGAAGACAACTGTCATGGCAGCTATGCAAGATGGTAACTTGACAGTACAAGATAAGAAAGACATCTCGACTGCCGCAGAGACATATCTAAATGACCTTGCTTCTTGGTTAACAGAAATGGATAAAGCTGCTGATGCTAGTTACGAACAGCGTATCGTTGAAGCATTCGAGAACGCAGTAAACTACGCTAACAAAGAATCACTACATCAGAGCGCAGTAATCACTCAGCTGTACAACATGGTTTCTATTAAGGTTAGTTCTGAGCAAGTAACGCAGCAGTTCCTTGATTTGAACATGAAGATTGAGAAGACACAGGAAGAGACATCAACAGCTCTAGATGATATCCAAAACCAGATTGACAATACGGTGAAGAACTTACCGTACAAAGTAGAAGTGACTTCATCTAACGGTTTGATATTCGTAAACGGTGGAGTTAACTCTATGCTAGCAGCTAAAATTACAAAAGGTACTGAGGATATAACAAGTACAGTACCTGCTTCTGACTTTGTTTGGACCCGTGTCTCTAACAATACAGCAGCGGATACAGCTTGGAACAACGCGCACAAGGACTCTGGTCGTTCATTCAACATCAATGCTGCTGACGTAATTGACAGAGCTACATTCTTCTGTGATTACAAGAATCCGCCAGTAGCTACAGGTAGTGTTACAATTGCGAACATCCAAGATATCACGGTAGGTAACGTTGAGCCAACAAATCCACGTGAAGGTGCGCTATGGTATGACCGTGGAACAGGTATCGTGTGGATGTGGCAGCAAGGTAGCTGGGTTGAGATTAACAGATTCGATGTTAACATTCGTAACTTATTAATTGGTTCTCGTGACTTTGGTGCGCAGAACTCTAACAACCCAACAGACCCGAATAACTCAACACCTCAAGGGAACATATCAGGTGCATGGGTTATGTCAGGTGACACATCAGGGAACCCGCCTAAGACAGGAGTTAAACCTTCACCACAAAACGCTACGAATCAGGATACATGGATATCTTACACGCAAAGTCAATGGGGCGGAGTTAAGTACAAATCTAGTAAACTTGCTGGAAGTGGGCTATTATCTGTTGGTGATATGGTAACTTACGTATGTTACGTGAGAACAGTAGGCGGAGCAAGCCCAGATAAAGGTATACCGATTCGACTATACGTGACAGACAATCGCGATGGTGGTACTGGAACAATCGGTTTCGAAATGAAAGACAAAGAGACGGACGGCAAACCAGTTACTGGAACACCTGTACAAATGCGCGCAACACAACAATGGAAGATGGTATGGGGTACATTCCCTGTAACACAATTATTCCTAGACACTGCAAACGACCCTAATAGTACATCTAAGACTGTTCGTGTAGAACCAACAAGTTTCACAGACATCGGAGCCGGAGGACAACTAGAAGTTAAATCTCACATGGTTGTCAAAGGTGTTATTCCTTCTGACTGGGTGCCAGCCCCAGAAGATACAAAACGTGATACGGATAACACTAACTGGAACATGGATGCACTTGGTAATGATAACTATCTAACTCGTTTTGAGCGTGGATTAGTTAAAACTAAGCTAACAGACATTACAGGTGAATCTCTATCAGGTTCTCAAGATATGAAGACATCCGCTCAGTTAGACGCAGACACATGGGGTAAAGGTCAGTTCTACGCTATCCGTAAACAGGCTAGAGACATCGCTATAGACCCTGTGAATGACGCAGCGTACAAAAACCTAACTACAGCTTACGAAACCCTTAGAACGTATCTGAGAGCCCTTAAAACTAACACTGGTAGAAACACAGTTTACCCGTGGGATACTTCTTCTGATGTAGTCATGGATGTAGTACGTACTGCATGGGATAAGGCGTGGGCAGATTATGAGAATGCGTACGCATCGTTAACTGTTCTTGTGCAGCAGAAACAGAAGACATACACGGATGATAGAATCAAAGATGTTAACGCAGAGATTGGTAAGATTAGTAAAACGGGACAACACTCGACTACTGATTTGCGTATACCAACAACATCTATATCACCAAAAGTTACAACAATAGCTTTACCGAGTTTTAAGGGTAACACGAAGAATAACTTAGAAGTTGGTGGTATTAACCTTCTCGACGGTACTATAACACCCGCAGAAATAGTAGGTAACGGAACATCGAACCAAACTAAAAACATCTACGCGTTCCATGGAGGAAACTCTACAGAAATGATAAATAGCCAAACAGTAGTAGGGTTCTACTGGAGCATTACTCCAAACGGTAATAACCCAGTAGCAGGTAAGATGTACTTCCAAGGTAGTAACCCATACCCTGCACTGACACCTACATTGACGTTTACTCCAGACAAATTGAGTGGCGTAGAGTTATTCACAAGAAGCCTATAG

Tertiary structure

PDB ID

9247f214997e7f0d0da437072de6c8640b73d70ee1f6b06da59528da9bf054e2

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5862

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Predicting Genome Terminus Sequences of Bacillus cereus-group Bacteriophage using Next Generation Sequencing data	Chung,C.-H., Walter,M.H., Yang,L., Chen,S.-C., Winston,V. and Thomas,M.A.	—	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature