Protein

View in Explore

Genbank accession

ARB13625.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MAAAIALPIVSAIVSTAISYAFPSDGPRLRDTKVSASTYGNVIPEIYGTARVGGNMIWSKPFTEKKKKKRAGKGGSYYNEYTYYCDFAMAFCRGPVKEVRRIWADGKVIYDTTGGSEVIDNNKYRFRFYPGDETQLPDSLIVEDKGADYAPAYRGLCYVVFDDFALADFGNRIPQIMAEVYAGDEGGAAITDIVPLPSSPVTGGSYQLGQMMIDADRGYFYLVDSVSNPAGTVLRRFLLANGKEDRREIVSIPQTQFPPSVYDSPDLTSVRAVTSKGELLCVFGGINNYMRIEKLDPYSWQSLGTIGRSYPFAGTPENSLQHSNTNFEISRDDKGNYLCLTLGVFGEYNIFDPSDMSFKAKGEMAGWGGAGTPMYICARQGGSAASRRFYHVTYTGGASLQVCSLGEVLYNHPLDYPGNSQTASSWAFWDEGDPGVVFFYSDGPNRYIAKWSESTGVLAWKTQLRNSDPFCGYGVYGLRARIKDNEFHWVYNKHLFSINTATGQWIDRTFDQDFYKSDNDKTAEQVNDGDKGLLLPRDISEDYVIYDPRRNIVICVGQIQGQNGIVHVGGYTGGKTSVGAIVERLLVSTGQMTSNDYDLTPLYDIPVYGYGYASSTDIKSIIAELRNLFMFDLVESDGRLVARVRGDQDPDAEVPWKLLGSQSGPTPDKADYWKETRMSESDLPASIDLTYSNIDDDYNPSTAKSKRIASPVATMLSRQQVKAECNLVMDATEAKNRVNIMLYTQWEERTQHQTALPWLYANLDASDLISVTMEDGRNYFERIGSIEFGADFSSRLETYGTDSGAYLSDKTGDGGGAGRPTVVPAPKPVVGFILNTPLLRDTHDSGGNFSNWYSAIGAGAPGVFLGGTMFKSANSQDYVDLYQEPESAEWGTVMGAVPSPSHGWFALDWETRITITPAVDFFELESITDDELWEGLNLVMIGDEVLQFRDAVQNADGTWTIWNLLRGRRGTQYACDNHKAGERFLFLDERSIEFQAENLDTSGQNRWYKAVGSGMSLFETDPIQINYQPRDLMPYRPADIRRAVAGGDVTVTWKRRTRFTATLKDGTGEVSLNEGTEAYEAYVLATSYAGDLSRQDAPAVYRRKYTLTSPSFTYTAAEQAADGFDVNLDTLHVVIYQLSSVVGRGFPGARSIESWQDF

Physico‐chemical properties

protein length:	1158 AA
molecular weight:	128336,54020 Da
isoelectric point:	4,83071
aromaticity:	0,11917
hydropathy:	-0,37435

Domains

Domains [InterPro]

DC_1879
ATT
1–248

DC_1879 IPR007110 DC_1657 IPR056490

IPR032876
ATT
615–787

IPR032876

DC_1311
RBD
784–1157

DC_1311

ARB13625.1

1 1158

Architecture

ATT

STR

ATT

STR

RBD

ATT 1-248 | STR 259-339 | STR 557-614 | ATT 615-787 | STR 788-813 | RBD 814-1157 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1879	ATT	DC_1879	1	248	Novel HMM	DC_1879	N-terminal	Low	Positional only	54 proteins / 54 hits
IPR007110	STR	DC_0008	259	339	InterPro cluster	Immunoglobulin-like domain	C-terminal	Medium	Text match	304 proteins / 473 hits
DC_1657	STR	DC_1657	557	813	Novel HMM	DC_1657	Central	Low	Positional only	43 proteins / 43 hits
IPR032876	ATT	DC_0307	615	787	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
DC_1311	RBD	DC_1311	784	1157	Novel HMM	DC_1311	C-terminal	Low	Positional only	46 proteins / 46 hits
IPR056490	RBD	DC_0637	890	984	InterPro cluster	Rcc01698-like, C-terminal domain	C-terminal	Low	Positional only	42 proteins / 42 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

ARB13625.1

1 1158

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	197	197	0,8495
Central domain	198	577	381	0,8143
C-terminal	578	1158	580	0,1090

Note: Constraints were applied during segmentation.
Fixed 4 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-197

Central
198-577

C-terminal
578-1158

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Caulobacter phage Ccr10 [NCBI]	1959735	No lineage information
Host	Caulobacter crescentus NA1000 [NCBI]	565050	Pseudomonadota > Alphaproteobacteria > Caulobacterales > Caulobacteraceae > Caulobacter > Caulobacter vibrioides

Coding sequence (CDS)

Genbank protein accession

ARB13625.1 [NCBI]

Genbank nucleotide accession

KY555142 [NCBI]

CDS location

range 67824 -> 71300
strand +

CDS

ATGGCCGCCGCCATTGCCCTTCCGATCGTCTCCGCCATCGTCAGCACGGCGATCAGCTACGCCTTCCCGAGCGATGGCCCGCGCCTGCGCGACACCAAGGTCTCGGCCTCGACCTACGGCAACGTGATCCCGGAAATCTACGGGACCGCGCGCGTCGGCGGCAACATGATCTGGTCCAAGCCGTTCACCGAGAAGAAGAAGAAGAAGCGGGCCGGCAAGGGCGGCTCCTACTACAACGAATACACCTACTACTGCGACTTCGCCATGGCCTTCTGCCGGGGGCCGGTCAAGGAAGTGCGCCGCATCTGGGCCGACGGTAAGGTGATCTATGACACCACCGGCGGCTCGGAGGTGATCGACAACAACAAGTACCGCTTCCGCTTCTATCCCGGCGACGAGACGCAGCTTCCCGACAGCCTCATCGTCGAGGACAAGGGCGCCGATTACGCCCCCGCCTACCGGGGCCTCTGCTACGTCGTGTTCGACGACTTCGCCCTGGCCGATTTCGGCAACCGCATCCCGCAGATCATGGCCGAGGTCTATGCCGGAGACGAAGGCGGCGCGGCGATCACCGACATCGTCCCGCTGCCGAGTTCGCCGGTCACTGGCGGGTCCTATCAGCTTGGCCAGATGATGATCGACGCTGACCGGGGCTATTTCTACCTCGTCGATTCGGTGTCCAACCCGGCAGGCACCGTTCTGCGCCGCTTCCTGCTGGCGAACGGCAAGGAGGATCGGCGCGAAATCGTCTCGATCCCGCAGACTCAGTTCCCGCCCTCGGTCTATGACAGCCCTGACCTGACCTCGGTCCGGGCGGTCACCTCCAAGGGCGAGCTTCTCTGCGTCTTCGGCGGGATCAACAACTACATGCGGATCGAGAAGCTCGATCCCTATTCCTGGCAGTCGCTGGGGACGATCGGCCGCAGCTATCCTTTCGCGGGCACTCCCGAAAACAGCCTTCAGCACTCCAACACCAACTTCGAGATTTCGCGGGATGACAAGGGCAACTATCTCTGTCTGACGCTGGGGGTGTTTGGCGAATACAACATCTTCGATCCCTCCGACATGTCGTTCAAGGCCAAGGGGGAAATGGCCGGCTGGGGTGGTGCGGGTACGCCGATGTACATCTGCGCCCGCCAAGGCGGCTCGGCGGCTTCCCGGCGGTTCTACCACGTCACCTACACGGGTGGCGCGTCCTTGCAGGTGTGCAGCCTGGGCGAGGTGCTCTACAATCACCCGCTCGACTATCCGGGCAATTCCCAGACCGCGTCGTCCTGGGCCTTCTGGGACGAGGGCGATCCGGGGGTGGTCTTCTTCTATTCCGACGGCCCTAACCGCTACATCGCCAAGTGGTCCGAATCCACCGGCGTGCTGGCCTGGAAGACCCAGCTTCGCAACTCCGATCCGTTCTGCGGCTATGGGGTCTATGGTCTGCGCGCCCGGATCAAGGATAACGAGTTCCACTGGGTCTACAACAAGCACCTGTTCTCGATCAACACCGCCACGGGTCAGTGGATCGACCGGACGTTCGACCAGGACTTCTACAAGAGCGACAACGACAAGACCGCCGAACAGGTCAACGACGGTGACAAGGGCCTGCTGTTGCCTCGCGACATCTCCGAGGACTATGTCATCTACGATCCGCGCCGCAACATCGTGATTTGCGTCGGACAGATTCAGGGCCAAAACGGCATCGTCCACGTCGGAGGCTACACGGGGGGCAAGACCTCGGTGGGGGCCATTGTCGAGCGTCTTCTGGTCTCGACGGGGCAGATGACCTCGAACGACTACGACCTGACGCCGCTCTACGACATCCCGGTCTACGGGTACGGCTACGCCTCCTCGACCGACATCAAGTCGATCATCGCCGAACTGCGCAACCTCTTCATGTTCGACCTCGTCGAAAGCGACGGTCGACTGGTCGCGCGCGTGCGCGGCGATCAGGACCCTGACGCCGAGGTGCCCTGGAAGCTCCTGGGCTCCCAGAGCGGCCCGACCCCGGACAAGGCCGACTACTGGAAAGAGACCCGGATGTCGGAGTCCGACCTCCCGGCCTCGATCGACCTGACCTATTCGAACATCGATGACGACTACAATCCGTCAACGGCCAAGTCCAAGCGGATCGCCTCGCCGGTGGCGACCATGCTCTCGCGCCAGCAGGTCAAGGCCGAGTGCAACCTCGTCATGGACGCGACCGAGGCCAAGAATCGCGTCAACATCATGCTCTATACCCAGTGGGAGGAGCGCACCCAGCACCAGACGGCCCTTCCCTGGCTCTACGCCAATCTCGACGCTTCGGACCTGATCTCGGTGACCATGGAGGACGGCCGTAACTACTTCGAGCGGATCGGCTCGATCGAGTTCGGCGCCGACTTCTCCTCGCGCCTGGAAACCTATGGCACCGACAGCGGCGCCTATCTCTCCGACAAGACCGGCGACGGCGGCGGCGCCGGGCGGCCCACGGTCGTGCCGGCCCCCAAGCCGGTGGTGGGCTTCATCCTCAACACCCCGTTGCTGCGCGACACCCACGACAGCGGCGGCAACTTCTCCAACTGGTATAGCGCCATCGGCGCCGGCGCGCCGGGCGTGTTCCTCGGCGGCACGATGTTCAAGTCCGCCAATTCGCAGGACTACGTTGATCTCTACCAGGAGCCGGAGAGCGCCGAGTGGGGCACGGTGATGGGGGCCGTGCCCTCCCCCTCGCACGGCTGGTTCGCGCTCGACTGGGAAACGCGCATCACCATCACGCCGGCGGTCGACTTCTTCGAACTGGAGTCGATCACCGACGACGAGCTTTGGGAAGGGCTCAACCTCGTGATGATCGGCGACGAGGTCCTCCAGTTCCGCGACGCGGTGCAGAACGCCGACGGCACCTGGACGATCTGGAACCTGCTGCGCGGCCGGCGCGGGACGCAATATGCCTGCGACAATCACAAGGCCGGCGAGCGCTTCCTGTTCCTCGACGAGCGCTCGATCGAGTTCCAGGCCGAGAACCTCGACACCTCGGGCCAGAACCGCTGGTATAAGGCCGTCGGCTCGGGCATGTCGCTGTTCGAGACCGATCCGATCCAGATCAATTACCAGCCCCGCGACCTCATGCCCTACCGCCCGGCCGACATCCGTCGGGCGGTCGCGGGCGGCGATGTCACCGTGACCTGGAAGCGTCGCACGCGTTTCACGGCCACGCTCAAGGATGGCACCGGCGAAGTCAGCCTCAACGAGGGGACCGAAGCCTATGAGGCCTATGTCCTCGCCACGTCTTACGCGGGGGACCTGTCGCGTCAGGACGCGCCGGCCGTCTACCGCCGTAAATACACCCTGACGAGTCCGAGCTTCACCTACACGGCGGCCGAGCAGGCGGCCGACGGATTTGACGTGAATCTTGACACTCTGCACGTGGTGATCTATCAGTTGAGTTCGGTTGTTGGTCGGGGTTTCCCCGGCGCGCGCTCGATTGAGTCCTGGCAGGACTTCTAA

Genome Context

Tertiary structure

PDB ID

210047ab179eb6ebf27a4221cda58a7b685c5a752c2a04d62e63230b842cafa1

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7410

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence