Protein

View in Explore

Genbank accession

YP_009620697.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,71

Evidence RBPdetect2

Probability 0,96

Protein sequence

MNTSVKTKEQVLFVYVKNPLQPAESRVCVSNDHEKNRSLADYLGAIEGRWAVSVSGKLIEQEDWEQTYLQANDCVVVAPLIEGGGGGGGKTVLRLVAIIALTVVSAGAGAAFGAAAGGALGVSAAAGTALVSAGVMMAGTMAINALLPPATPKAPASGSDYDSSPTYGIDGPKNMSSRGIPVPVVYGESWFAGNFLQSYVDNVGDDQYLNLLINLGEGPVEGITEIMINNQPMNNFSNVETWFRNGTEHQTMIPYFGDIIVPVNRNLDLQPGVYSLHTVADAVDRLRVDIVMPGGVNRADDEDGLVPFTALFTLELREVGGAWGPFVEGASTGQVAIGGKQMSALRRSYYSRTLDRSKRYEVRAIHNQSTDDTNVSNRVSLTDVNYITFDDLTYKHTALFGMRIKLSDQLSGIPSVQYRLKGRKVPVYSPLTGAYDETFTSNPAWIALDVLMHKRYGGGISASRIKMEYFRQWATFCDQNNLKFNGAIDQRTNLWDALAPICKVGRAQIIRAGTRFQVSMVRKQKPVQMFSMGNIKKGSLSIDWLAMDERANECHVSYYDKNDGGKQKTVIVPNMAARERGEEAKPTELTLYGVDNVEQATREGTLAMNMQQLLKTISFEAPISAIACTLGDVVAIQHDVPDWGQGGLTDAGSTKNVLVVDKPVTQDLGGTYVVRVRHDKVLQGTWEVDELIGNIVVPTGPFNIQMFERYRRLFVPGTGQDFQIQEPIIDQYGRHGLRLNSTAGLKKGDTIQLFDTDVLETRFVGAVSPDGLRITPTQAFSAIPGRETPWAFGLNGTEVMMMTIMDISGKDDLWKTIGGIEYSDAAYDDTVVDYPPDPTNTNPVMPNITFNGFKERRYLVGAAYTSDVEMTWSCTDIAYAYAEVHINIDGEGWKFMDANATFYQLTAINSGSIQLKLVPVTIEGFKPNFNAVPVHTYTVEGGVPRNPDPPLNFRVGTVTNDIIELLWGDLNAWSAAQNVYAYEIWHAEGQGAVLESAQLIAVTKNDHYPHVGLLKNSWHTYWIRTINVTAKNAKSAFIPAAGLSVQCKDNDPYGLIDLTDLAPSLRESINAPKVLEDLSQIIANAATKLEETDDAQKQEVFNRKQAVGEVAASVNEQVAAIADETEAMAARITQMEATTTPGTQAKIDELAQVVANGDSTLAQRISLMQVKFADDLSAAIAQEQTVRADAISALASQVTTLTSTVGENTASLQETMEVVDGISAQYTLRVDINGIVSGFGIATGEGGVSEFAIMASRFKIYGPGPGDTVVKTAVFNVDAETGVAYLRNAVVGNLQSDNYISGVSGWCLKK

Physico‐chemical properties

protein length:	1310 AA
molecular weight:	142181,92420 Da
isoelectric point:	4,94598
aromaticity:	0,08092
hydropathy:	-0,14359

Domains

Domains [InterPro]

DC_1181
STR
2–939

DC_1181 Coil IPR015406

IPR053171
Unmapped
206–675

IPR053171 DC_1281

IPR055385
ATT
272–388

IPR055385 IPR032876

NF040662
Unmapped
282–678

NF040662

YP_009620697.1

1 1310

Architecture

STR

ATT

STR

ATT

STR

RBD

STR 2-271 | ATT 272-388 | STR 389-488 | ATT 489-642 | STR 643-939 | RBD 940-1310

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1181	STR	DC_1181	2	939	Novel HMM	DC_1181	Central	Low	Positional only	7 proteins / 7 hits
IPR053171	Unmapped	-	206	675	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	272	388	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
NF040662	Unmapped	-	282	678	NCBIfam	host specificity factor TipJ family phage tail protein	-	-	-	-
IPR032876	ATT	DC_0307	489	642	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
DC_1281	RBD	DC_1281	837	1310	Novel HMM	DC_1281	C-terminal	Low	Positional only	31 proteins / 31 hits
Coil	Unmapped	-	1075	1095	Coils	Coil	-	-	-	-
IPR015406	RBD	DC_0135	1216	1310	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009620697.1

1 1310

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	109	109	0,9126
Central domain	110	308	200	0,1223
C-terminal	309	1310	1001	0,0713

Note: Constraints were applied during segmentation.
Fixed 6 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-109

Central
110-308

C-terminal
309-1310

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage nickie [NCBI]	2048977	Uroviricota > Caudoviricetes > Nickievirus >
Host	Pseudomonas syringae pv. avii [NCBI]	663959	Pseudomonadota > Gammaproteobacteria > Pseudomonadales > Pseudomonadaceae > Pseudomonas > Pseudomonas syringae

Coding sequence (CDS)

Genbank protein accession

YP_009620697.1 [NCBI]

Genbank nucleotide accession

NC_042091.1 [NCBI]

CDS location

range 22625 -> 26557
strand +

CDS

ATGAATACGTCGGTTAAGACCAAAGAGCAGGTTCTCTTTGTCTATGTGAAGAACCCTCTGCAACCAGCAGAGAGCCGAGTCTGCGTCTCCAACGATCACGAAAAGAACCGTTCGCTGGCCGACTACCTGGGCGCCATCGAAGGGCGCTGGGCTGTGTCCGTCTCGGGCAAGCTGATCGAGCAGGAAGACTGGGAGCAGACCTACCTGCAAGCGAATGACTGCGTGGTCGTCGCGCCCCTGATTGAAGGTGGTGGCGGCGGTGGCGGCAAGACCGTACTCCGCCTGGTAGCGATCATCGCCCTGACCGTAGTATCCGCTGGTGCCGGTGCTGCTTTCGGTGCTGCTGCTGGTGGCGCCCTGGGTGTCTCTGCTGCCGCTGGTACTGCTCTGGTGTCCGCAGGTGTCATGATGGCAGGTACGATGGCGATCAACGCCCTGCTGCCGCCTGCGACCCCGAAAGCACCTGCATCCGGTTCCGACTACGACTCCAGCCCAACCTACGGCATCGACGGCCCGAAGAACATGAGTTCTCGGGGCATCCCTGTGCCTGTCGTTTACGGTGAGTCCTGGTTCGCAGGTAACTTCCTTCAGTCCTACGTCGATAACGTGGGCGATGACCAGTACCTGAACCTGCTGATCAACCTTGGTGAAGGCCCTGTTGAGGGCATCACCGAAATCATGATCAACAACCAGCCGATGAACAACTTCTCGAACGTCGAGACGTGGTTCCGCAACGGCACCGAACATCAGACGATGATCCCGTACTTCGGCGACATCATCGTGCCGGTCAACCGCAACCTCGATCTGCAACCCGGCGTCTACTCGCTGCACACCGTTGCAGACGCTGTTGACCGCCTGCGTGTGGACATCGTTATGCCAGGCGGTGTGAACCGCGCTGACGACGAAGACGGCTTGGTTCCGTTCACCGCTCTCTTCACGCTTGAGTTGCGTGAGGTAGGTGGCGCATGGGGTCCGTTCGTTGAGGGCGCAAGCACCGGTCAGGTCGCTATTGGTGGCAAGCAGATGTCTGCCCTGCGCCGCAGCTACTACAGCCGTACCCTGGACCGCAGCAAGCGCTACGAAGTTCGAGCGATCCACAACCAGTCCACTGACGACACCAACGTCAGCAACCGGGTGAGCCTGACCGACGTCAACTACATCACCTTCGACGACCTGACCTACAAGCACACCGCTCTGTTCGGTATGCGGATCAAGCTGTCTGACCAGCTCAGCGGCATTCCATCGGTTCAGTACCGTCTGAAGGGCCGCAAGGTGCCGGTGTACAGTCCTCTGACTGGCGCATACGACGAGACCTTCACGTCGAACCCGGCGTGGATTGCTCTCGACGTTCTGATGCACAAGCGCTACGGCGGCGGCATCAGTGCATCCCGCATCAAGATGGAATACTTCCGTCAGTGGGCGACGTTCTGCGACCAGAACAACCTGAAGTTCAACGGCGCAATCGACCAGCGCACCAACCTGTGGGACGCCCTGGCGCCAATCTGCAAGGTAGGCCGTGCTCAGATCATTCGTGCCGGCACCCGCTTCCAGGTGTCGATGGTCCGCAAGCAGAAGCCCGTCCAGATGTTCTCGATGGGCAACATCAAGAAGGGCTCCCTGTCGATTGACTGGCTGGCAATGGACGAGCGCGCCAACGAATGTCACGTCAGCTACTACGACAAGAACGACGGCGGCAAGCAGAAGACGGTCATCGTGCCGAACATGGCCGCCCGTGAGCGCGGTGAAGAGGCGAAGCCAACCGAGTTGACTCTGTACGGCGTGGATAACGTCGAGCAGGCGACCCGTGAAGGCACGCTCGCCATGAACATGCAGCAGTTGCTGAAGACCATCAGCTTCGAGGCTCCAATCTCGGCAATCGCCTGTACCCTGGGTGACGTGGTCGCAATCCAGCATGACGTTCCAGACTGGGGTCAGGGCGGCCTGACTGACGCCGGCAGCACCAAGAACGTCCTGGTGGTCGACAAGCCTGTCACTCAAGACCTGGGCGGCACCTACGTGGTTCGTGTTCGTCACGACAAGGTTCTGCAAGGCACTTGGGAAGTAGACGAGCTGATCGGCAACATCGTCGTGCCAACTGGCCCGTTCAATATCCAGATGTTCGAGCGCTACCGTCGTCTGTTCGTCCCAGGCACTGGGCAGGACTTCCAGATTCAAGAGCCGATCATCGACCAGTACGGCCGGCACGGTCTGCGCTTGAACAGCACTGCTGGTCTGAAGAAGGGCGACACCATTCAGCTCTTCGACACCGACGTGCTTGAGACGCGCTTCGTGGGCGCTGTGAGCCCCGATGGGCTGCGTATCACCCCAACACAAGCATTCAGCGCTATCCCGGGTCGTGAGACGCCCTGGGCGTTCGGTCTGAACGGCACCGAAGTCATGATGATGACCATCATGGACATCAGCGGTAAGGATGATCTGTGGAAGACCATCGGTGGTATCGAGTACAGCGATGCAGCCTACGACGACACCGTTGTGGACTACCCGCCTGACCCGACCAACACCAACCCGGTCATGCCGAACATCACGTTCAATGGGTTCAAAGAGCGCCGCTACCTGGTGGGCGCCGCGTACACCTCCGACGTCGAAATGACCTGGAGCTGCACTGACATTGCCTACGCCTACGCCGAAGTCCACATCAACATCGACGGTGAAGGCTGGAAGTTCATGGACGCGAACGCGACCTTCTACCAGTTGACCGCGATCAACAGTGGGTCGATTCAGCTCAAGCTGGTGCCGGTGACCATCGAAGGGTTCAAGCCGAACTTCAACGCTGTGCCGGTTCACACCTACACCGTAGAGGGCGGTGTACCGCGGAACCCTGATCCACCCCTGAACTTCCGGGTTGGGACTGTCACCAACGACATCATCGAACTGCTGTGGGGCGACCTGAACGCCTGGTCTGCTGCTCAGAACGTGTACGCCTACGAAATCTGGCATGCTGAAGGTCAGGGCGCTGTTCTGGAATCGGCCCAACTGATCGCCGTGACCAAGAACGACCACTACCCTCACGTTGGTCTGCTGAAGAACTCCTGGCACACCTACTGGATTCGGACGATCAACGTCACCGCGAAGAACGCGAAGTCTGCATTCATCCCGGCCGCCGGTCTGTCGGTGCAGTGCAAGGACAACGACCCATACGGGCTGATCGACCTCACTGACCTGGCCCCGAGCCTGCGTGAGAGCATCAACGCGCCGAAGGTTCTCGAAGACCTGTCGCAGATCATTGCCAACGCCGCGACCAAGCTCGAAGAGACCGATGACGCTCAGAAGCAGGAGGTGTTCAACCGTAAGCAGGCTGTCGGTGAAGTAGCCGCATCCGTCAACGAGCAGGTAGCAGCAATCGCGGATGAGACCGAAGCGATGGCAGCCCGGATCACTCAGATGGAAGCGACCACCACGCCGGGCACCCAGGCGAAGATCGACGAGCTGGCTCAGGTGGTAGCAAACGGTGACTCCACTCTGGCTCAGCGTATCTCGCTGATGCAGGTGAAGTTCGCTGACGACCTGTCTGCCGCAATCGCCCAAGAGCAGACTGTCCGTGCTGACGCAATCAGCGCGCTGGCCAGTCAGGTGACCACGCTGACCTCGACCGTCGGTGAGAACACTGCAAGCCTGCAAGAGACGATGGAGGTTGTTGACGGTATCTCCGCGCAGTACACGCTGCGGGTAGACATCAACGGGATCGTCTCGGGCTTCGGTATCGCAACCGGTGAAGGTGGTGTGTCCGAGTTCGCGATCATGGCCAGCCGGTTCAAGATTTACGGCCCAGGCCCGGGTGATACGGTGGTGAAGACTGCGGTGTTCAACGTGGATGCTGAGACTGGTGTCGCATACCTCCGCAACGCGGTGGTGGGCAACCTTCAGTCCGACAACTACATTTCTGGCGTGTCGGGGTGGTGCCTAAAAAAGTAG

Genome Context

Tertiary structure

PDB ID

fc0ba48c37daff7a1b8258964abde02f3652e88b2cc8ce22c9827524116b31c4

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7320

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence