Protein

View in Explore

Genbank accession

XRX04440.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,95

Protein sequence

MLDAEQFSSMPVRSYDVKGLLVKYPSNYNPQTRQYVGVWDGTFVGGWTDNPAWIFYDLVLNKRYGLGKYVDATMIDRYALYQIAQYCDVLVSDGKGGKEPRFTCNCAITSRADAIKVLQDLASVFRGIAYWSAGTVVASSDMPSDPVYVYTAANVVNGQFKYVGSSLKSRYTSALVTFNDPDNGYKQTVEYVEDAEGIRRYGLNKAEVTAFGCTSRSQAQRVGHWLLLTSRYETNAVTFSVGMYGTLAQPGQVIAIADPSRSGKRIGGRIKQAASKGTVTLDQAPEGAARGDRLTVVTPNGMAQSRAVQSVSDSIVSVQPEFDVQPAPGAVWMLETATLKSQLFRVTSVSEREGITFEISATQHEPGKYDAVDNGAAIEYRPITGETFKAQRPPANVRLSQFVVIDQGIARTNMTVAWDAAPNAIAYVAEFRRDNGDWISAGRTGGLSLDVGNIYSGRYVARVRAVNALDISSPLAYSPETRLNGKTGSPPRPATLVATTDQVLSIGLNWSFPPNSGDTSYTEVWYSTTPRFANATPLSRYGFPTNSASLLNLAAGASLYFWARLVDTSGNIGPWYPAESEPGVYGAATSNATAILAYLVGKITDTELSQELLGPIKEIPDIQQKVTENAAAISSERQARIDENAALAGKIDKVSAQIVVPDMAGSSGDLAGSTTVYAGVWSEQSARVEADLALSRRIDTTTAQLSNTQHSILSAVQTETRARVDADSAQAELITKVQAKADANAANVETVAKSYADLNGRVSASYNIKTQVTVDGRLYVAGIGVGIDNNNGQIESQVLVAAQRFAVVDPNGHTVTSPFVIQGGQVFINQAFIGAGWIQNAMIGDYIQSNNYVAGRSGWRLDKSGWFEINNTDGQGNRLNIDSNGLRGFDANGTLRYRLGFY

Physico‐chemical properties

protein length:	902 AA
molecular weight:	97260,44370 Da
isoelectric point:	5,64760
aromaticity:	0,09202
hydropathy:	-0,21619

Domains

Domains [InterPro]

DC_0014
STR
1–902

DC_0014

IPR053171
Unmapped
2–616

IPR053171 IPR015406

IPR032876
ATT
110–270

IPR032876 IPR013783

IPR036116
STR
408–491

IPR036116

XRX04440.1

1 902

Architecture

STR

ATT

STR

STR 1-109 | ATT 110-270 | STR 271-902

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0014	STR	DC_0014	1	902	Novel HMM	DC_0014	Central	Low	Positional only	830 proteins / 830 hits
IPR053171	Unmapped	-	2	616	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR032876	ATT	DC_0307	110	270	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR013783	STR	IPR013783	392	484	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR036116	STR	IPR036116	408	491	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR015406	RBD	DC_0135	748	881	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Burkholderia phage vB_SBP39 [NCBI]	3412860	Viruses >
Host	Burkholderia sp. [NCBI]	36773	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Betaproteobacteria > Burkholderiales

Coding sequence (CDS)

Genbank protein accession

XRX04440.1 [NCBI]

Genbank nucleotide accession

PV072743.1 [NCBI]

CDS location

range 15390 -> 18098
strand +

CDS

ATGCTGGATGCAGAGCAGTTCTCTAGCATGCCTGTACGTTCCTACGACGTGAAAGGCTTGCTCGTGAAATACCCAAGCAACTACAACCCGCAGACGAGGCAGTACGTCGGCGTGTGGGACGGAACCTTCGTTGGCGGCTGGACGGATAACCCCGCATGGATCTTTTACGACCTCGTGCTCAACAAGCGTTACGGGCTAGGCAAGTATGTAGACGCGACGATGATCGATCGCTATGCGTTGTATCAGATTGCTCAGTATTGCGATGTTCTGGTCTCAGACGGCAAAGGCGGCAAGGAACCGCGCTTTACGTGCAACTGCGCAATCACCTCCCGAGCGGATGCTATCAAAGTCTTGCAAGACCTCGCGAGCGTGTTTCGCGGCATCGCCTATTGGTCGGCGGGAACTGTTGTTGCGTCGTCCGACATGCCCAGCGACCCCGTGTATGTCTATACGGCTGCCAACGTCGTCAACGGCCAATTCAAGTACGTCGGCAGTTCGCTTAAGTCGCGCTACACATCGGCGCTCGTAACGTTCAACGACCCCGACAACGGATACAAGCAGACTGTCGAATACGTAGAAGACGCGGAAGGTATTCGAAGATACGGGCTCAACAAGGCCGAAGTGACCGCCTTCGGTTGCACGAGTCGATCCCAGGCACAACGCGTCGGCCATTGGCTGCTCCTCACGTCCCGCTACGAGACGAACGCGGTTACATTCAGCGTCGGGATGTATGGCACGTTAGCGCAGCCGGGGCAGGTAATCGCGATTGCTGACCCGTCGCGATCAGGAAAGAGAATCGGCGGGCGTATCAAGCAGGCCGCATCCAAGGGGACGGTAACACTCGACCAAGCTCCGGAAGGTGCCGCGCGCGGCGACCGCTTGACGGTAGTCACGCCTAACGGAATGGCCCAGTCTCGCGCAGTTCAGTCCGTTAGCGACTCGATCGTAAGCGTACAGCCCGAATTCGACGTGCAGCCCGCTCCCGGCGCGGTATGGATGCTGGAGACGGCTACTCTCAAATCGCAGCTTTTCCGGGTTACCAGCGTCAGCGAGCGCGAAGGAATCACCTTCGAGATTTCAGCGACGCAGCATGAGCCAGGCAAGTATGACGCTGTGGACAACGGGGCCGCGATTGAGTACCGGCCAATCACCGGAGAAACCTTCAAGGCACAGCGCCCTCCGGCTAACGTCCGCCTCTCTCAGTTCGTCGTCATCGATCAAGGCATCGCCCGTACCAACATGACAGTTGCTTGGGATGCCGCTCCCAACGCAATCGCATACGTCGCGGAATTCCGCAGGGATAACGGAGATTGGATTTCAGCGGGTAGGACTGGCGGGCTATCCCTGGATGTAGGCAACATCTACAGCGGGCGTTACGTTGCACGCGTGCGCGCTGTCAACGCGCTAGACATCTCGTCACCCCTCGCGTACTCGCCGGAAACGCGCCTGAACGGGAAAACGGGTTCTCCGCCCCGCCCTGCTACGCTCGTCGCGACCACGGATCAGGTATTGTCGATCGGGTTGAATTGGTCATTCCCGCCGAACTCCGGCGACACGTCGTACACCGAAGTTTGGTACAGCACGACGCCACGCTTTGCGAATGCTACCCCGCTATCGCGGTATGGCTTCCCGACGAACTCGGCGAGCCTGCTGAATCTAGCGGCGGGCGCGTCGCTGTACTTCTGGGCGCGGCTTGTTGATACGTCCGGCAACATTGGTCCGTGGTATCCGGCGGAATCGGAACCCGGCGTGTACGGGGCGGCCACGTCGAACGCAACAGCAATTCTCGCGTACCTCGTCGGCAAGATCACCGATACGGAACTCTCCCAAGAGTTGCTCGGCCCGATCAAAGAGATTCCCGACATTCAGCAGAAGGTAACGGAGAACGCTGCGGCAATTTCTTCGGAGCGGCAGGCTCGGATTGACGAGAACGCCGCACTCGCCGGAAAGATCGATAAAGTCTCGGCTCAGATCGTTGTTCCCGACATGGCAGGCAGTTCGGGCGACCTCGCCGGATCGACAACGGTATACGCTGGAGTATGGTCGGAGCAATCCGCGCGCGTAGAGGCGGACCTCGCACTTTCTCGCCGAATCGACACGACGACAGCCCAGCTAAGCAACACACAGCACTCCATACTTTCCGCCGTTCAGACGGAAACCCGCGCGCGTGTAGACGCAGACAGCGCGCAAGCAGAACTCATCACGAAGGTACAGGCGAAGGCCGATGCAAACGCGGCAAACGTCGAGACCGTTGCGAAGTCATACGCGGACCTCAACGGCCGTGTATCGGCGTCGTACAACATCAAGACGCAAGTAACCGTAGATGGCCGCCTATACGTTGCGGGCATCGGTGTAGGCATCGACAACAACAACGGCCAAATCGAGTCGCAAGTCCTCGTAGCCGCGCAGCGATTCGCAGTTGTCGACCCGAACGGCCACACCGTGACTTCCCCGTTCGTGATTCAGGGCGGGCAGGTCTTCATCAATCAGGCGTTCATCGGCGCGGGCTGGATTCAGAACGCGATGATTGGCGACTACATCCAGAGCAACAACTATGTAGCGGGCCGCTCTGGTTGGAGGCTGGACAAGAGCGGATGGTTCGAAATCAACAACACGGACGGACAAGGAAACCGATTGAACATTGACAGTAACGGCTTGCGCGGCTTCGACGCAAACGGCACCCTGCGGTATCGACTGGGGTTCTACTAA

Genome Context

Tertiary structure

PDB ID

6c381beac7e63fb3bd102701a1784920a6720cd933fb3088d00d477cf0210fa3

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8099

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence