Protein

View in Explore

Genbank accession

WKV24447.1 [GenBank]

Protein name

central tail fiber J

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,53

Evidence RBPdetect2

Probability 0,96

Protein sequence

MEITEWFIPEGAKGGGGNAHTPVESPDSLRSSAKMRMLIALSEGVVQGGLDGKKIFLNGTPLQAQDGTMNFPGVRWEFRNGTATQDPIKGFPAVERPGTVGIDLVKATPWVHEITDTNLDAFRVRMGFPYMAKTESDGDTVGTSVTYTIELSTDGGAYKLLSTMKATGKTTSLYERDHRIDLPKATTKWSVRVTRVTADSTAQTLQNKTQIQGYTEVIDARMRYPHTALLYVEYDAKTFPQVPRVSCLLQGRQIQVPSNYDPVARTYTGDWDGTFKWAFTDNPAWVFYDIATNDRFSIGRKVKANMISKWDLYVIAQRCDELVPNGDGGTGKEPRFTCNVYIQGQEQAFNVLRDIASIFNGATFWGNSQLNVISDMPGDVKQVVTRANVVDGKFNYVGGSQKNHYSSALVSIGDKTNHYQDLPVLVSVPRLQKRYGFQQTQTSAIGCTSVGEGQRRGKYILLSNELDRGVSFKMGLDGIQFLPGHIIALADERLAGKVMGGRIKSVSADLRTVTLDRVTDAAIGDAILVRTKDGKPERRTIATVNGAIIGLQTALSAAPVPYAVFVIDAGTLHLQTFKVQSMKRSDGEDCYEITAIIHNASKYDAIDKGARLDIPTVSLLPVPGIKAPGNIAISAYDVIRQGQRVKTMRITWGKVQGALAYEIQWRKGDGDWVNGPRQSTTSYEVAGIYAGDYYARVRAIGASEVSSPWAESAMVTLPGRTGAPQPPIMGAAVKMQYGIQWNWTFAAGSGDTASTELQYQALNLPTDPVTANWLPLTLVAYPTGKYQQMGLAIGQNIAVRARCIDKLGNQSAWTAPVKGAANEVISDYIRDLDAEIQKSQAFKDVTTYIDTNLEKVGNDMTALGARVDTVTKNVSDLTGTVQTISGTVTQQGKTITTMQQTVQTAQQTADAAKSAAESAASAAAGGAKVYFQNSPPPSADQKANVLWIDTTNNANTPKRWVNNAWTAVTDKQATDAAAAAKTAHDTAVEAQKVAGVANVKGNNLFPDGSFESYQTESDLDLMINSGRAQASLVTSGAYAGTRTLRYNTNTGNADLEWLKQTQVGFESKYWYVSYVAKIGSGSAPAGCSLRIGIACYDGAGTRLSVSAVEANASNGLTTAWKTFSGYVLLPEGTRSIRPYFYAPHGTTAWPAGTNFWIDAVCMYEADAAKRAADLAATVQVTANAARDKLGKYDATWTVKAQVDSAGRHYMAGISAGVSWSEAGGGSYQGTVLINANNFAVYVPGANNGNGVLKNMMTVNAAGVWMNLAMIQDATITNAKIANATIQGAKIASAAISSAHIVDGAITNAKIAKAAIDSAKIANASINTAHLGTVSIKSAQIESLHANKITGDIATAYTVAPAQTLTIPADSTLNREIILMPIHIHFRLSSTTSASGSVSATITVQGEAAHSVLASADNKVILSAVNSSVVSLPAGKSATIRFDNAAKSTASGYSTQGIFLVAKAR

Physico‐chemical properties

protein length:	1464 AA
molecular weight:	156451,55750 Da
isoelectric point:	8,80221
aromaticity:	0,07787
hydropathy:	-0,18040

Domains

Domains [InterPro]

DC_0129
STR
8–960

DC_0129 DC_1604

IPR053171
Unmapped
10–1002

IPR053171 IPR015406

IPR055385
ATT
95–220

IPR055385 IPR032876 IPR036116 G3DSA:1.20.5.340 SSF141571

IPR013783
STR
626–719

IPR013783 G3DSA:2.160.10.20

WKV24447.1

1 1464

Architecture

STR

ATT

STR

ATT

STR

RBD

STR

RBD

STR 8-94 | ATT 95-220 | STR 221-343 | ATT 344-506 | STR 507-960 | RBD 1163-1229 | STR 1230-1340 | RBD 1341-1450 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0129	STR	DC_0129	8	960	Novel HMM	DC_0129	Central	Low	Positional only	234 proteins / 234 hits
IPR053171	Unmapped	-	10	1002	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	95	220	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
IPR032876	ATT	DC_0307	344	506	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR036116	STR	IPR036116	620	717	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	626	719	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
G3DSA:1.20.5.340	STR	G3DSA:1.20.5.340	799	924	Merged direct domain	G3DSA:1.20.5.340	Central	Low	Positional only	38 proteins / 38 hits
DC_1604	RBD	DC_1604	1163	1450	Novel HMM	DC_1604	C-terminal	Low	Positional only	61 proteins / 61 hits
IPR015406	RBD	DC_0135	1178	1291	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits
SSF141571	STR	SSF141571	1230	1340	Merged direct domain	SSF141571	Central	Low	Positional only	8 proteins / 8 hits
G3DSA:2.160.10.20	RBD	G3DSA:2.160.10.20	1258	1370	Merged direct domain	G3DSA:2.160.10.20	C-terminal	Low	Positional only	6 proteins / 6 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Enterobacter phage ST22 [NCBI]	3061299	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Enterobacter sp. [NCBI]	42895	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

WKV24447.1 [NCBI]

Genbank nucleotide accession

OQ957557.1 [NCBI]

CDS location

range 23521 -> 27915
strand -

CDS

ATGGAAATTACTGAATGGTTTATTCCTGAGGGCGCAAAGGGCGGCGGTGGCAATGCTCACACGCCGGTGGAGTCTCCTGATAGCCTGCGCAGCTCCGCAAAAATGCGCATGCTTATTGCGCTCAGTGAGGGCGTGGTGCAGGGTGGCCTGGACGGGAAAAAGATTTTCCTCAACGGCACCCCATTGCAGGCGCAGGATGGAACAATGAATTTCCCAGGCGTGCGCTGGGAGTTTCGCAACGGCACAGCCACGCAAGATCCAATCAAAGGTTTCCCTGCGGTTGAGCGTCCTGGCACGGTTGGCATCGATCTGGTTAAGGCCACCCCATGGGTGCATGAGATCACGGACACAAACCTTGATGCTTTCCGCGTGCGCATGGGATTCCCGTATATGGCGAAAACTGAGAGCGACGGTGACACCGTAGGCACCTCAGTGACCTACACCATTGAGCTGAGCACGGACGGCGGCGCGTATAAGCTGCTGAGCACCATGAAAGCCACCGGCAAGACCACGAGCCTTTATGAGCGCGATCACCGCATCGACCTGCCGAAAGCCACCACCAAATGGAGCGTGCGAGTTACCCGCGTCACGGCAGACAGCACCGCCCAGACTCTGCAAAACAAGACGCAGATCCAGGGTTACACTGAGGTGATTGATGCGCGTATGCGTTACCCTCACACCGCGCTGCTTTACGTCGAATATGACGCAAAAACATTCCCGCAGGTGCCACGCGTCAGCTGCCTGCTGCAAGGCCGCCAGATTCAGGTGCCATCAAACTATGATCCAGTTGCGCGCACCTATACCGGTGATTGGGATGGCACGTTTAAATGGGCCTTTACCGACAACCCCGCGTGGGTGTTTTACGATATCGCCACCAATGATCGCTTTTCTATCGGGCGCAAAGTAAAGGCGAACATGATCAGCAAGTGGGATCTATACGTCATTGCGCAGCGCTGTGATGAGCTGGTGCCTAACGGCGATGGCGGCACCGGCAAAGAGCCACGCTTCACCTGTAACGTTTATATTCAGGGGCAGGAGCAGGCATTCAACGTGCTGCGCGATATCGCGTCTATTTTCAACGGGGCCACCTTCTGGGGCAATTCACAGCTGAATGTGATCTCAGATATGCCTGGCGACGTTAAGCAGGTTGTTACCCGCGCCAACGTGGTTGATGGCAAATTTAACTATGTGGGCGGTAGCCAGAAAAACCATTACAGCAGCGCGCTGGTGAGTATTGGCGATAAAACCAACCATTACCAGGATCTGCCGGTGCTGGTGAGCGTGCCGCGCCTACAAAAGCGCTATGGCTTCCAGCAAACCCAGACAAGCGCAATTGGCTGCACGTCAGTAGGTGAGGGCCAGCGCCGTGGCAAATACATCCTCCTCAGCAATGAGCTGGATCGTGGCGTGAGCTTTAAAATGGGTCTTGACGGCATCCAGTTCCTGCCTGGTCACATCATCGCGCTGGCTGATGAGCGCCTTGCCGGTAAGGTCATGGGCGGGCGTATCAAGTCAGTTTCCGCTGACCTGCGCACCGTGACGCTGGACCGTGTGACGGATGCAGCTATTGGTGATGCCATTCTGGTGCGTACCAAAGATGGAAAGCCTGAGCGCCGGACTATTGCCACCGTCAACGGGGCAATCATTGGCCTCCAAACGGCTCTTTCTGCCGCGCCGGTGCCTTACGCCGTTTTCGTCATTGACGCGGGCACGCTGCACCTGCAAACGTTCAAAGTGCAGAGCATGAAGCGCTCAGATGGTGAGGACTGCTATGAGATCACCGCCATCATTCACAACGCCTCAAAATATGACGCGATTGATAAGGGCGCACGGCTGGACATTCCAACCGTCAGCCTGCTGCCGGTGCCTGGCATCAAAGCCCCTGGTAATATCGCCATCAGTGCCTATGACGTGATCCGTCAGGGTCAGCGCGTCAAAACCATGCGCATCACATGGGGTAAGGTGCAGGGCGCGCTGGCGTATGAAATTCAGTGGCGAAAAGGTGATGGCGATTGGGTTAATGGCCCGCGTCAGTCAACCACGTCCTATGAGGTGGCGGGCATCTACGCCGGTGATTATTACGCCCGCGTGCGCGCCATTGGTGCCTCTGAGGTTTCCAGCCCGTGGGCTGAGTCTGCCATGGTCACGCTGCCAGGCCGCACCGGCGCACCGCAGCCGCCAATCATGGGCGCAGCGGTTAAAATGCAGTACGGCATCCAGTGGAATTGGACATTTGCGGCAGGCTCCGGCGATACCGCGTCTACTGAATTGCAGTACCAGGCGTTAAACCTTCCTACCGATCCGGTAACGGCTAACTGGCTGCCGCTCACGCTGGTGGCTTACCCTACCGGCAAATATCAGCAGATGGGGCTGGCAATCGGGCAAAATATCGCCGTTCGCGCTCGCTGCATTGACAAGCTGGGCAATCAGTCAGCATGGACTGCTCCAGTAAAAGGTGCCGCCAATGAGGTGATTTCTGACTACATCAGAGATCTGGATGCGGAGATCCAGAAGTCGCAAGCGTTCAAAGATGTGACCACGTACATTGACACCAACCTTGAGAAGGTTGGCAACGATATGACCGCGCTGGGCGCGAGAGTGGACACAGTTACCAAAAACGTTAGCGACTTAACCGGCACCGTGCAGACCATCAGCGGCACCGTGACGCAGCAGGGCAAAACCATCACCACCATGCAGCAGACGGTGCAGACGGCGCAGCAGACTGCTGATGCAGCCAAATCAGCTGCTGAGAGCGCGGCAAGCGCTGCGGCTGGTGGGGCGAAAGTCTACTTTCAGAATAGCCCGCCGCCATCAGCTGACCAAAAGGCCAACGTGCTTTGGATTGACACCACGAACAACGCCAATACGCCCAAGCGATGGGTTAATAACGCATGGACGGCGGTAACTGATAAGCAGGCAACGGATGCGGCTGCGGCTGCTAAAACTGCGCATGACACTGCGGTTGAGGCCCAGAAGGTGGCAGGCGTTGCCAACGTCAAAGGGAATAACCTTTTCCCAGATGGCTCGTTTGAAAGTTACCAGACTGAGAGTGATCTGGATCTGATGATCAATAGCGGGCGGGCGCAGGCTTCTCTGGTGACTTCTGGAGCTTACGCAGGCACTAGAACCCTGCGATACAACACCAACACCGGCAACGCAGATCTTGAATGGCTCAAGCAGACTCAGGTTGGGTTTGAGTCTAAATATTGGTATGTCAGCTACGTGGCTAAAATTGGCAGCGGCTCAGCGCCTGCTGGGTGCTCTCTGCGCATTGGCATCGCTTGCTATGATGGCGCTGGAACACGCCTGAGTGTGTCAGCAGTGGAAGCTAATGCATCAAACGGGCTAACCACTGCATGGAAAACGTTTTCTGGTTACGTGCTGCTGCCAGAGGGCACGCGCTCAATCCGGCCTTATTTCTACGCTCCTCACGGCACCACTGCATGGCCCGCTGGAACAAACTTCTGGATTGATGCCGTTTGCATGTATGAGGCTGATGCGGCTAAGCGTGCGGCTGATTTGGCGGCAACGGTCCAGGTAACCGCCAACGCGGCGCGGGATAAGCTGGGCAAATATGATGCCACATGGACCGTTAAGGCGCAGGTAGACAGCGCAGGCCGCCACTACATGGCAGGCATCTCTGCGGGCGTTTCATGGTCAGAGGCTGGCGGTGGCAGCTACCAGGGCACCGTGCTGATTAACGCGAACAATTTCGCGGTATACGTCCCAGGGGCTAACAACGGCAACGGCGTGCTCAAAAACATGATGACTGTTAACGCCGCTGGGGTCTGGATGAATTTAGCCATGATCCAGGATGCCACGATCACAAATGCAAAAATCGCTAATGCCACCATTCAGGGCGCGAAGATTGCTAGCGCGGCTATCTCATCTGCCCATATCGTTGACGGGGCGATCACAAACGCTAAGATTGCCAAAGCGGCGATTGACAGCGCGAAAATTGCCAATGCGTCAATCAATACGGCGCACCTGGGCACTGTAAGCATCAAAAGCGCTCAGATTGAGAGCCTGCACGCCAATAAGATCACTGGCGATATTGCGACGGCTTACACGGTGGCACCGGCGCAAACTCTGACTATTCCAGCAGATAGTACGCTAAACCGTGAGATCATTCTCATGCCTATTCACATTCACTTTAGGCTTTCATCAACCACCAGCGCCTCAGGCTCTGTGTCAGCTACCATCACGGTGCAGGGTGAGGCCGCTCACAGCGTTCTGGCCTCAGCAGATAACAAGGTGATTTTGTCAGCGGTAAACAGTAGCGTGGTTAGCCTCCCAGCAGGCAAATCTGCCACGATCCGCTTTGACAACGCGGCAAAGAGCACGGCATCAGGTTATTCGACTCAGGGCATTTTCCTGGTGGCTAAGGCGAGATAA

Genome Context

Tertiary structure

PDB ID

91ab6da2c2e65eed924ea6651be037856a7c686167a830597d44c78f2ae58223

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7265

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence