Protein

View in Explore

Genbank accession

QGF21243.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect2

Probability 0,96

Protein sequence

MNKQLPVPVGAKGGSSKPKAPYEMEDNLISIDKIKILLAVSDGEVDPSFSLMNLYLDDVPVQSSNGILNYPELRLNLGREHNIKITLKDSPIPQAKLHMARGVKAESDGDQVGVRVEYAVDMAVDGGAYSEYMVDVIDGKTTSGYDRSRRIDLPAFNTQVLLRIRRVTPDSQSGNVVDAIQLQSYAEVIDAKFRYPLTGLVYVEFDSKLFPNQIPNISIKKKWKLINVPVNYDPFHAHTPARGMEYGRKRGVITPLSFCTTVPNGKGGTEPRYLCDVVIQSQIEAYQLIRDICSIFRGMSFWNGESLSIVIDKPRNPSYIFTNENVIGGEFTYTFASEKSMYTQCNVTFDDAQNFYAQDVEGVFDPEMTLRFGHNPTAITAIGCTRRSEANRRGRWILKTNVRSTTVNFATGLEGMIPTIGDVIIVADNFWSSALTMNLSGRVMEVSGLQVFLPFKVDARAGDRIIVNKPDGAPVGRTIASVTPDGKTITLNTTFGFDVQPDSIFAIERTDLAQQQYVVTEIKRGDGEEEFTYSITAVEYDPNKYDEIDYGVNIDDRPTSIVQPDILPAPENVKVSSYSRIVQGMSVETMRVTRDKVEYATLYEMQWRKDNGNWNNTPQTASKEIEVEGIYAGNYHVRVRSVSSNGSSSGWSKIVSVHLKGKVGEPGAPINMTASDNEVFGIRVKWGMPEGSGDTAYIELHRAPNSAEGHPIEDQATLLTLVPYPQYEYWHSILPAGQVIWYKARAIDRIGNVSQWTDFVRGMSSVDTSIITDHIKVDIENSEGINSKNGKFTAQIKESLRLIANETEARVTQVSQLEADFDGKITAQNSELREVIATGDEALSRSIDELRAEIGDDIQGQITEVKEAIVTETDARVTADTALSTRIGDNEAAINQKLDSDYGVNLGLKYNGQEYSAGMALSLVGDGTGVKSQMLFSADRFAIISNAQAGAFTLPFVVENNRVYARGVKAESDGDQVGVRVEYAVDMAVDGGAYSEYMVDVIDGKTTSGYDRSRRIDLPAFNTQVLLRIRRVTPDSQSGNVVDAIQLQSYAEVIDAKFRYPLTGLVYVEFDSKLFPNQIPNISIKKKWKLINVPVNYDPFHAHTPARGMEYGRKRGVITPLSFCTTFINSLLVKDGTITTAKIAQQINSTNWSSGSAGWMINKNGIAEFNRYGKGKPLRKQRGIFIFINSLLVKDGTITTAKIAQQINSTNWSSGSAGWMINKNGIAEFNRYGKGKPL

Physico‐chemical properties

protein length:	1238 AA
molecular weight:	136991,98160 Da
isoelectric point:	5,59309
aromaticity:	0,08643
hydropathy:	-0,31624

Domains

Domains [InterPro]

DC_0014
STR
1–968

DC_0014 DC_0335 IPR015406

IPR055385
ATT
96–191

IPR055385 IPR053171 IPR015406 IPR055385 IPR015406 DC_0335

IPR032876
ATT
282–446

IPR032876 IPR013783 DC_1299

QGF21243.1

1 1238

Architecture

STR

ATT

STR

ATT

STR

ATT

STR

RBD

STR 1-95 | ATT 96-191 | STR 192-281 | ATT 282-446 | STR 447-965 | ATT 966-1056 | STR 1057-1119 | RBD 1120-1235 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0014	STR	DC_0014	1	968	Novel HMM	DC_0014	Central	Low	Positional only	830 proteins / 830 hits
IPR055385	ATT	DC_0360	96	191	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR053171	Unmapped	-	261	783	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR032876	ATT	DC_0307	282	446	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR013783	STR	IPR013783	568	662	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR015406	RBD	DC_0135	891	964	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits
DC_1299	STR	DC_1299	944	1119	Novel HMM	DC_1299	Central	Low	Positional only	15 proteins / 15 hits
IPR055385	ATT	DC_0360	966	1056	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
DC_0335	RBD	DC_0335	1116	1184	Novel HMM	DC_0335	C-terminal	Low	Positional only	17 proteins / 17 hits
IPR015406	RBD	DC_0135	1126	1171	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits
DC_0335	RBD	DC_0335	1181	1235	Novel HMM	DC_0335	C-terminal	Low	Positional only	17 proteins / 17 hits
IPR015406	RBD	DC_0135	1186	1231	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Citrobacter phage HCF1 [NCBI]	2849700	Uroviricota > Caudoviricetes > Drexlerviridae > Hicfunavirus HCF1 >
Host	Citrobacter amalonaticus [NCBI]	35703	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QGF21243.1 [NCBI]

Genbank nucleotide accession

MN545971.1 [NCBI]

CDS location

range 25631 -> 29347
strand +

CDS

ATGAATAAACAATTACCTGTTCCAGTTGGTGCAAAAGGCGGATCAAGCAAGCCTAAAGCGCCGTATGAAATGGAAGATAATCTGATCTCTATTGATAAGATTAAGATTTTATTAGCTGTTTCTGACGGTGAAGTAGATCCTAGCTTTTCGTTAATGAATTTATATCTTGATGATGTTCCAGTTCAAAGTTCAAATGGGATATTAAACTATCCCGAGTTAAGGCTGAATTTAGGCCGGGAACACAATATCAAGATCACATTAAAGGATTCACCGATACCGCAAGCGAAATTACATATGGCGCGAGGCGTTAAAGCAGAAAGTGACGGCGATCAGGTTGGCGTTCGCGTAGAATATGCGGTAGACATGGCTGTTGACGGTGGAGCGTATAGTGAATATATGGTTGATGTTATCGACGGCAAAACAACAAGCGGTTACGACAGAAGCCGTCGCATTGATTTGCCAGCGTTCAATACTCAAGTATTATTGCGCATTCGCCGTGTAACTCCAGATAGCCAGAGCGGGAACGTTGTTGATGCTATTCAGTTGCAAAGCTATGCAGAGGTTATTGATGCTAAATTCCGTTATCCTCTTACTGGACTTGTATATGTTGAATTTGACAGCAAATTATTCCCGAACCAGATCCCTAACATTTCAATCAAAAAGAAATGGAAGTTGATTAACGTTCCGGTTAATTACGATCCATTTCACGCACATACTCCGGCACGTGGAATGGAGTATGGAAGAAAGCGTGGAGTAATAACCCCGCTTTCATTCTGTACGACCGTTCCTAACGGTAAGGGCGGAACAGAGCCGCGTTATCTTTGCGACGTTGTGATCCAGTCTCAGATTGAAGCATATCAGCTTATTCGTGATATTTGCTCAATCTTCCGTGGCATGAGCTTTTGGAACGGTGAGAGCCTTTCAATTGTGATCGATAAGCCTCGCAATCCGTCTTACATTTTCACTAATGAAAACGTGATCGGCGGTGAGTTCACTTACACTTTCGCAAGCGAAAAGAGCATGTACACACAATGCAATGTGACGTTCGACGACGCTCAAAACTTTTACGCTCAGGATGTGGAAGGTGTTTTTGATCCAGAAATGACGTTGCGCTTTGGTCATAATCCGACAGCAATCACCGCTATCGGTTGCACACGACGCAGTGAAGCAAATAGACGTGGGCGCTGGATACTGAAAACCAACGTTCGCAGCACTACGGTAAACTTTGCTACTGGCCTTGAGGGTATGATCCCGACAATCGGTGACGTGATTATTGTTGCGGATAACTTCTGGAGCAGTGCGTTAACAATGAATCTTTCAGGGCGCGTAATGGAGGTAAGCGGGTTACAGGTTTTCTTACCGTTTAAAGTGGATGCGAGAGCAGGTGATCGCATTATCGTAAATAAGCCAGACGGCGCACCAGTAGGACGAACGATTGCCAGCGTAACGCCGGACGGAAAGACAATCACACTCAACACTACTTTCGGTTTTGACGTGCAGCCAGATTCAATCTTTGCCATTGAGCGCACCGATTTAGCGCAGCAGCAGTATGTTGTTACCGAAATCAAGCGCGGTGATGGTGAGGAAGAATTTACTTATAGCATCACGGCAGTCGAATACGATCCGAACAAGTACGACGAAATTGATTACGGCGTGAACATTGATGATCGACCGACTTCAATCGTGCAGCCGGATATTCTGCCAGCGCCGGAAAACGTTAAGGTTTCCAGCTACAGCCGAATTGTTCAGGGCATGAGTGTTGAAACGATGCGCGTTACCCGGGACAAGGTTGAATATGCAACGCTGTACGAAATGCAGTGGCGCAAGGATAACGGAAACTGGAACAACACGCCGCAGACCGCAAGCAAAGAAATTGAGGTTGAAGGTATTTACGCAGGTAACTATCACGTTCGCGTTCGTTCTGTTTCATCCAACGGCTCATCGTCTGGATGGTCTAAGATCGTTAGTGTTCACCTGAAAGGCAAGGTTGGCGAGCCCGGCGCACCTATTAACATGACAGCCAGTGATAACGAGGTGTTTGGTATTCGTGTTAAATGGGGTATGCCGGAGGGAAGCGGTGACACTGCATACATTGAGTTGCACCGGGCACCAAACAGCGCGGAAGGACACCCGATTGAAGATCAAGCAACACTGTTGACGCTTGTACCGTATCCGCAATATGAATACTGGCACAGCATTTTGCCAGCAGGACAAGTGATCTGGTACAAGGCGCGAGCCATTGACCGAATCGGAAACGTGTCACAATGGACTGATTTTGTGCGCGGCATGTCGTCCGTTGATACAAGTATCATCACGGATCATATTAAGGTTGATATTGAGAATTCAGAGGGTATCAATTCCAAAAACGGAAAGTTCACGGCGCAGATCAAGGAGTCATTGCGACTTATCGCAAATGAAACCGAAGCGCGTGTAACTCAGGTGTCACAACTGGAAGCTGATTTTGACGGAAAAATTACCGCCCAAAACAGCGAATTGAGAGAGGTTATTGCAACTGGTGACGAAGCGTTAAGCCGTTCAATTGACGAACTTAGAGCCGAGATAGGAGACGATATTCAGGGGCAAATAACAGAAGTTAAGGAGGCAATAGTAACTGAAACTGATGCGCGTGTTACTGCTGATACTGCGTTATCTACACGCATTGGTGACAATGAGGCTGCAATTAACCAGAAGTTAGACTCGGATTACGGAGTTAATCTTGGCCTGAAATATAACGGTCAGGAATATAGCGCTGGTATGGCGTTGTCACTTGTTGGCGATGGTACTGGTGTGAAGTCGCAAATGCTTTTCTCCGCTGATCGGTTTGCAATCATCAGCAATGCACAGGCTGGCGCGTTTACGCTTCCGTTTGTGGTTGAGAATAACCGTGTTTATGCGCGAGGCGTTAAAGCAGAAAGTGACGGCGATCAGGTTGGCGTTCGCGTAGAATATGCGGTAGACATGGCTGTTGACGGTGGAGCGTATAGTGAATATATGGTTGATGTTATCGACGGCAAAACAACAAGCGGTTACGACAGAAGCCGTCGCATTGATTTGCCAGCGTTCAATACTCAAGTATTATTGCGCATTCGCCGTGTAACTCCAGATAGCCAGAGCGGGAACGTTGTTGATGCTATTCAGTTGCAAAGCTATGCAGAGGTTATTGATGCTAAATTCCGTTATCCTCTTACTGGACTTGTATATGTTGAATTTGACAGCAAATTATTCCCGAACCAGATCCCTAACATTTCAATCAAAAAGAAATGGAAGTTGATTAACGTTCCGGTTAATTACGATCCATTTCACGCACATACTCCGGCACGTGGAATGGAGTATGGAAGAAAGCGTGGAGTAATAACCCCGCTTTCATTCTGTACGACCTTTATTAACAGCCTTTTGGTGAAAGATGGAACGATTACCACGGCTAAGATTGCGCAGCAAATCAACTCTACAAACTGGAGTTCTGGATCGGCTGGCTGGATGATTAACAAGAACGGAATTGCGGAGTTTAACCGTTACGGTAAGGGGAAACCTTTACGCAAACAGCGGGGCATTTTCATTTTTATTAACAGCCTTTTGGTGAAAGATGGAACGATTACCACGGCTAAGATTGCGCAGCAAATCAACTCTACAAACTGGAGTTCTGGATCGGCTGGCTGGATGATTAACAAGAACGGAATTGCGGAGTTTAACCGTTACGGTAAGGGGAAACCTCTTTGA

Genome Context

Tertiary structure

PDB ID

e83e1cf57ae793b65f9c780d9ceb4e876c69d9da9c29c5847e954453311272b3

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5943

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence