Protein

View in Explore

Genbank accession

XOF09531.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,63

Evidence RBPdetect2

Probability 0,83

Protein sequence

MAEIKRKFRAEDGLDAGGDKIINVALADRTVGTDGVNVDYLIQENTVQQYDPTRGYLKDFVIIYNNRFWAATDNIPKPAGSFNRIRWKALRTDAVYTTVSSGPYQLKSGEAISVDTSVGNDIEFNLPPSPLDGETVIIQDIGGKPGINQVKINSSNQSIVNFRGEQVRSVLMTHPKSQMIFIFNNRLWQMYVADYSREAAIVTPSTAYQAQSNDFIVRRFTSAAPINIKLPRFANHGDIINFVDLDKLNPLYHTIVTTYDETTSVQEVGTHSIEGRTSIDGFLMFDDNEKLWRLFNGDSKARLRIITTNSNIRPNEEVMVFGANNGTTQTIELQLPTDISVGDTVKISMNYMRKGQTVKIKAAGEDKIASSVQLLQFPKRSEYPPEAEWVTVQELVFNGETNYVPVLELAYIEDSDGKYWVVQQNVPTVERVDSLNDSTRARLGVIALATQAQANADLENSPQKELAITPETLANRTATETRRGIARIATTAQVNQNTTFSFADDIIITPKKLNERTATETRRGVAEIATQQETNAGTDDTTIITPKKLQARQGSESLSGIVTFVSTAGATPASSRELNGTNVYNKNTNNLVVSPKALDQYKATPTQQGAVILAVESEVIAGQSQEGWANAVVTPETLHKKTSTDARIGLIEIATQSEVNTGTDYTRAVTPKTLNDRIATESLSGIAEIATQVEFDAGVDDTRISTPLKIKTRFNSTDRTSVVALSGLVESGTLWDHYTLNILEANETQRGTLRVATQVEAAAGTLDNVLITPKKLLGTKSTEAQEGVIKVATRSETVAGTSANTAVSPKNLKWIVQSEPTWAATTAIRGFVKTSSGSITFVGNDTAGSTQDLELYEKNNYAVSPYELNRVLANYLPLKAKAVDSNLLDGLDSLQFIRRDIAQTVNGSLTLTQQTNLSAPLVSSSTATFGGSVSANSTLTISNTGTATQLIFEKGPQTGTNPTQTMTVKVWGNQFSGESDTTRSTVFEVSDDTSYHFYSQRNKDGNIAFSINGTVTPINVNASGTLNANGVATFGSSVTANGEFISKSSNAFRAINGDYGFFIRNDAANTYFMLTASGDQTGGFNGLRPLAINNQSGQVTIGESLIIAKGATITSGGLTVNSRIRSQGTKTSDLYTRAPTSDTVGFWSIDINDSATYNQFPGYFKMVEKTNEVTGLPYLERGEEVKSPGTLTQFGNTLDSLYQDWITYPTTPEARTTRWTRTWQKTKNSWSSFVQVFDGGNPPQPSDIGALPSDNAIMGNLTIRDFLRIGNVRIIPDPVNKTVKFEWVE

Physico‐chemical properties

protein length:	1289 AA
molecular weight:	140522,95520 Da
isoelectric point:	5,30032
aromaticity:	0,07603
hydropathy:	-0,34849

Domains

Domains [InterPro]

DC_1986
ATT
13–125

DC_1986 DC_1209 IPR048391

IPR048390
ATT
979–1092

IPR048390

DC_1209
STR
999–1274

DC_1209

XOF09531.1

1 1289

Architecture

ATT

STR

ATT

STR

ATT

STR

ATT 13-125 | STR 343-978 | ATT 979-1092 | STR 1093-1138 | ATT 1139-1237 | STR 1238-1274 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1986	ATT	DC_1986	13	125	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits
DC_1209	STR	DC_1209	343	1071	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
IPR048390	ATT	DC_0836	979	1092	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
DC_1209	STR	DC_1209	999	1274	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
IPR048391	ATT	DC_0875	1139	1237	InterPro cluster	Long-tail fiber proximal subunit domain	C-terminal	Medium	Text match	795 proteins / 796 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XOF09531.1

1 1289

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	1081	1081	0,8167
Central domain	1082	1278	198	0,1339
C-terminal	1279	1289	10	0,8777

Note: Constraints were applied during segmentation.
Fixed 25 C-terminal predictions appearing before Central domain|C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-1081

Central
1082-1278

C-terminal
1279-1289

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage OES_C-3 [NCBI]	3390845	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia sp. [NCBI]	1884818	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

XOF09531.1 [NCBI]

Genbank nucleotide accession

PQ642264 [NCBI]

CDS location

range 152731 -> 156600
strand +

CDS

ATGGCCGAGATTAAAAGAAAGTTCAGAGCAGAAGATGGTCTGGACGCAGGTGGCGATAAAATAATCAACGTAGCTTTAGCTGATCGTACCGTAGGAACTGACGGTGTTAACGTTGATTACTTAATTCAAGAAAACACAGTTCAACAATATGATCCAACTCGTGGATATTTAAAAGATTTTGTAATCATTTATAATAATCGTTTTTGGGCAGCAACGGATAATATTCCAAAACCTGCTGGAAGTTTTAATAGAATTCGTTGGAAAGCATTACGTACTGATGCAGTATATACAACCGTATCATCTGGACCATATCAATTAAAATCCGGAGAAGCAATTTCAGTAGATACATCAGTTGGTAATGACATTGAGTTTAATTTACCACCTTCTCCGCTTGATGGAGAAACCGTAATAATTCAAGATATTGGTGGAAAACCTGGTATAAATCAGGTTAAAATAAATTCTTCAAATCAGAGTATTGTCAATTTTAGAGGTGAACAAGTACGTTCAGTTCTAATGACTCATCCAAAGTCACAAATGATATTCATTTTTAATAATCGTTTGTGGCAAATGTATGTTGCTGATTATAGCAGAGAAGCTGCGATTGTTACTCCATCGACTGCATATCAAGCACAATCTAATGATTTTATCGTGCGTAGATTTACTTCCGCTGCGCCGATTAATATTAAACTTCCGAGATTTGCTAATCATGGCGATATTATTAATTTCGTTGATTTAGATAAATTAAATCCACTTTATCATACAATTGTCACGACATATGATGAAACAACTTCAGTACAAGAAGTTGGAACTCATTCTATTGAAGGTCGTACATCGATTGATGGTTTCTTGATGTTTGATGATAATGAAAAATTGTGGAGATTGTTTAACGGGGATAGTAAAGCACGTTTACGCATTATAACAACTAATTCTAACATTCGTCCAAATGAAGAAGTTATGGTATTTGGTGCGAATAATGGAACAACCCAAACAATTGAACTTCAGCTTCCGACTGATATTTCTGTTGGTGATACTGTTAAAATTTCCATGAATTACATGAGAAAAGGACAAACAGTTAAAATCAAAGCTGCCGGTGAAGATAAAATTGCTTCTTCAGTTCAATTGTTGCAATTCCCAAAACGTTCAGAGTATCCGCCTGAAGCTGAATGGGTGACTGTTCAAGAATTAGTTTTTAACGGCGAAACTAATTATGTTCCAGTTTTAGAGCTTGCTTATATAGAAGATTCTGACGGAAAATACTGGGTTGTACAACAAAACGTTCCAACAGTTGAAAGAGTTGATTCTTTAAATGATTCTACTAGAGCAAGATTAGGCGTAATTGCTTTAGCTACACAAGCTCAAGCAAATGCTGATTTAGAAAATTCTCCACAGAAAGAATTAGCAATTACTCCAGAAACATTAGCTAACCGTACTGCTACAGAAACTCGTAGAGGTATCGCAAGAATAGCAACCACTGCTCAAGTGAATCAGAACACCACATTCTCTTTTGCTGATGATATTATCATCACTCCTAAAAAGCTGAATGAAAGAACTGCCACAGAAACTCGTAGAGGCGTTGCTGAAATTGCCACACAGCAAGAAACTAACGCAGGTACTGATGATACTACAATCATCACTCCTAAAAAGCTTCAAGCTCGTCAAGGTTCTGAATCATTATCTGGTATTGTAACCTTTGTATCTACTGCAGGAGCTACTCCAGCTTCTAGTCGTGAATTAAATGGTACAAATGTTTATAATAAAAACACTAATAATTTAGTTGTTTCGCCTAAAGCTTTGGATCAGTATAAAGCTACTCCAACCCAACAAGGTGCAGTAATTTTAGCAGTTGAAAGTGAAGTAATTGCTGGACAGAGTCAAGAAGGATGGGCAAATGCGGTTGTAACGCCAGAAACGTTACATAAAAAGACATCAACTGATGCAAGAATTGGTTTAATTGAAATTGCTACGCAAAGTGAAGTTAATACAGGAACTGATTATACTCGTGCAGTCACTCCTAAAACTTTAAATGACCGTATAGCAACTGAAAGTTTAAGTGGTATAGCTGAAATTGCTACGCAAGTTGAATTCGACGCAGGCGTCGACGATACTCGTATCTCTACACCATTAAAAATTAAAACCAGATTTAATAGTACTGATCGTACTTCTGTTGTTGCTCTGTCTGGATTAGTTGAATCAGGAACTCTCTGGGACCATTATACCCTTAATATTCTTGAAGCAAATGAGACACAGCGTGGTACACTTCGTGTAGCTACACAAGTTGAAGCTGCTGCAGGAACATTGGATAATGTTCTAATAACTCCTAAAAAGCTTTTAGGTACTAAATCTACTGAAGCGCAGGAAGGCGTTATTAAAGTTGCAACTCGGTCTGAAACTGTAGCTGGAACGTCAGCAAATACTGCTGTATCTCCAAAAAATTTAAAATGGATTGTGCAGAGTGAACCTACTTGGGCAGCTACTACTGCGATAAGAGGTTTTGTTAAAACCTCATCCGGTTCAATTACATTCGTTGGTAATGATACAGCTGGTTCTACGCAGGACTTAGAACTATATGAGAAAAATAACTATGCAGTATCACCATATGAATTAAACCGCGTATTAGCAAATTATTTGCCGTTAAAAGCAAAAGCTGTAGATAGTAATTTATTAGATGGTTTAGATTCACTCCAGTTCATTCGTAGGGATATTGCGCAGACGGTTAATGGTTCACTAACCTTAACACAACAAACGAATCTGAGTGCCCCTCTTGTATCATCTAGTACTGCTACGTTCGGTGGATCAGTTTCAGCAAATAGTACACTAACCATTTCTAATACTGGAACAGCAACTCAATTGATTTTTGAGAAAGGACCTCAAACTGGAACAAACCCAACTCAAACGATGACTGTTAAAGTGTGGGGAAATCAATTTAGTGGGGAATCAGACACAACACGTTCTACTGTATTTGAAGTTAGTGATGACACATCTTATCACTTTTATTCTCAACGCAATAAAGATGGTAATATAGCATTTAGCATTAATGGTACAGTAACACCGATAAATGTGAATGCTTCAGGAACATTGAATGCGAATGGCGTTGCAACATTCGGTAGTTCAGTTACTGCTAATGGCGAATTTATCAGTAAATCGTCGAATGCTTTTAGAGCAATAAACGGTGATTATGGATTCTTTATTCGCAATGATGCTGCTAACACCTATTTTATGCTTACTGCATCTGGCGATCAGACTGGTGGATTTAATGGATTACGTCCTTTAGCTATTAATAATCAATCTGGTCAGGTTACAATTGGTGAAAGCTTAATCATTGCCAAAGGTGCTACTATAACTTCAGGTGGTTTAACTGTCAACTCGAGAATTCGTTCTCAGGGTACTAAAACCTCTGATTTATATACTCGTGCGCCAACATCTGATACTGTAGGATTCTGGTCAATCGATATTAATGATTCAGCCACTTATAACCAATTCCCGGGTTATTTTAAGATGGTTGAAAAAACTAATGAAGTGACTGGGCTTCCATACTTAGAACGCGGCGAAGAGGTTAAATCTCCTGGTACGTTGACTCAGTTTGGTAACACACTCGATTCGCTTTACCAAGATTGGATTACTTATCCAACGACCCCAGAAGCGCGCACCACTCGCTGGACGCGTACATGGCAGAAAACCAAAAATTCTTGGTCAAGCTTTGTTCAGGTATTTGATGGAGGTAACCCTCCTCAGCCATCTGATATCGGTGCTTTACCATCTGATAATGCTATAATGGGGAATCTTACTATTCGTGATTTCTTACGAATTGGTAATGTTCGCATTATTCCTGACCCAGTGAATAAAACGGTTAAATTTGAATGGGTTGAATAA

Genome Context

Tertiary structure

PDB ID

b5f44f1a569579cc46b2423b24368528255fbde1a92167f8336e4e9009890815

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2783

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence