Protein

View in Explore

Genbank accession

WIL00430.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,81

Protein sequence

MTTKVIFTFHNPDGSPQANEKFTVRLTRPGMSDAEHCVVIPETYEMVTDAKGEFTMDLESSTSAYRVTAIGDDDEYEDDPCSQYTFTFYVPDSADPVYVQELILMPPPTNLPWDEEAMNKITQAVVDAREARDEAEAQADRAEVQVDLAKAEVVKAQDEVVKAKAEVTKAQAEVTKAAQQVELAKVEVGKAEASAAAAKVSETNAANAAAGSAASATAATNQANRAKTEADRAESLANQVAEKVEGGNLPALVGMNETFTYEGGEDHYNWTRTGPVSVSQHIGYIRVAKTDASSNRAFIRKSAEFPDGHWIAYFRVATQTGTADQNRSAQIRFIAADGKDYTVYFNINASGVVEPNTIHMQGSEGSTRNAATMFTGLNTETWMDMAVKFDAVNRHIELFRRMPNGTWQKGGGRLMVDTIKPTVIEISSMPVAPNGWWMYVDFISVCRPNLICYGDSIAAGQNEYGVTRGNNPYNNNRNWAGTWFGKVPLYATNRNNLVLVQGVEGRRTWQYLSQLSEISNSGVKVVFMHASTNDVNDATMTMAKRTSDTQAIIDQLHAVGAQVVLFNSMQGTQAYNDASSNTVKLRDYTDQWWNTELPKVNGLAQTLDIARLIAKDGYMDPDLGASDGLHLTNASAQKIADKLGQFYSNSTSINGLAPLESPAFTGIPTVPTQTPFLPYGKQIANTEYVITFIQDWTSNYGYGDLTIRSKTGAQLAAGGVRSGYYYVPGDATNPLPGNNYAFVHHMSYDTNKGWELWNHCYTDRVYMRHSNNQGVWQTPVELVTENWMERNSFMTPRVTAFNRLPVFNAAGYEGFTPVQNSANGGWRNVATGAAGIGLLGAATGASALNYIGGMSKTTANGRTASNMNDFPDECGLYGVGVEPWANLPPGVDRINPVGSSVYHHVYDASTATQIFIPRTSDICYFRRKSGGTWQPWVRYLTDLQLVGTTTDDTAGNPNGAIMQVNGSAALNVGVCTRFADGTQIVRALLQLDYGAVDILQRQFTFPMSFVGKPVVTATLEQGTVADINNMPLQALGPVMVASIYAGNCNVRVMRSQGYTAGGFAAGSKMLCSVIAMGFWK

Physico‐chemical properties

protein length:	1080 AA
molecular weight:	117598,11300 Da
isoelectric point:	5,24348
aromaticity:	0,09444
hydropathy:	-0,30639

Domains

Domains [InterPro]

DC_0617
ATT
1–66

DC_0617 DC_2023 IPR036514 cd19958

Coil
Unmapped
118–187

Coil IPR051532

Coil
Unmapped
216–243

Coil DC_0711

SSF52266
STR
447–644

SSF52266

cd00229
ENZ
450–646

cd00229

IPR013830
ENZ
452–635

IPR013830

WIL00430.1

1 1080

Architecture

ATT

STR

ATT 1-66 | ATT 94-409 | STR 410-1079 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0617	ATT	DC_0617	1	66	Novel HMM	DC_0617	N-terminal	Low	Positional only	49 proteins / 49 hits
DC_2023	ATT	DC_2023	94	409	Novel HMM	DC_2023	N-terminal	Low	Positional only	29 proteins / 29 hits
Coil	Unmapped	-	118	187	Coils	Coil	-	-	-	-
IPR051532	Unmapped	-	206	645	InterPro	Diverse Ester Hydrolysis Enzymes	-	-	-	-
Coil	Unmapped	-	216	243	Coils	Coil	-	-	-	-
DC_0711	STR	DC_0711	398	1079	Novel HMM	DC_0711	Central	Low	Positional only	59 proteins / 59 hits
IPR036514	STR	IPR036514	444	651	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
SSF52266	STR	SSF52266	447	644	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
cd00229	ENZ	DC_0001	450	646	InterPro cluster	cd00229	C-terminal	High	Text match	480 proteins / 783 hits
IPR013830	ENZ	DC_0001	452	635	InterPro cluster	SGNH hydrolase-type esterase domain	C-terminal	High	Text match	480 proteins / 783 hits
cd19958	STR	DC_0464	906	939	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

WIL00430.1

1 1080

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	244	244	0,9934
Central domain	245	496	253	0,5451
C-terminal	497	1080	583	0,8059

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-244

Central
245-496

C-terminal
497-1080

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage Pa_WF01 [NCBI]	3043430	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Pseudomonas aeruginosa [NCBI]	287	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Pseudomonadales

Coding sequence (CDS)

Genbank protein accession

WIL00430.1 [NCBI]

Genbank nucleotide accession

OQ848593.1 [NCBI]

CDS location

range 2521 -> 5763
strand +

CDS

ATGACTACCAAGGTGATCTTCACCTTCCATAACCCGGATGGCAGCCCACAGGCGAACGAGAAGTTCACCGTGCGACTGACCCGTCCTGGCATGAGCGATGCAGAGCACTGCGTCGTAATTCCCGAAACCTACGAGATGGTGACCGACGCCAAGGGCGAGTTCACCATGGACTTGGAATCGTCTACCTCTGCCTACCGCGTCACTGCTATAGGCGATGACGACGAGTACGAGGACGATCCCTGCTCGCAGTACACCTTCACCTTCTACGTGCCGGACTCTGCTGATCCGGTCTACGTGCAGGAACTGATCCTGATGCCCCCGCCCACGAATCTGCCGTGGGACGAGGAAGCCATGAACAAGATCACCCAGGCTGTCGTCGATGCCCGTGAGGCTCGTGACGAAGCTGAAGCTCAGGCTGACCGTGCTGAAGTGCAGGTAGATCTAGCCAAAGCCGAGGTCGTCAAAGCCCAGGATGAGGTAGTTAAAGCCAAAGCCGAGGTGACCAAGGCTCAGGCTGAAGTGACCAAAGCTGCTCAGCAAGTTGAGCTTGCGAAGGTCGAAGTGGGTAAGGCAGAAGCCTCTGCTGCTGCGGCCAAGGTCAGCGAGACCAATGCTGCGAATGCCGCTGCTGGTTCTGCCGCCTCGGCAACTGCTGCAACCAACCAAGCCAACCGTGCGAAGACGGAAGCTGATCGTGCCGAATCACTGGCAAACCAAGTCGCTGAAAAGGTGGAAGGCGGTAACCTGCCTGCACTGGTAGGGATGAACGAAACCTTCACCTACGAAGGTGGCGAGGACCACTACAACTGGACCCGTACTGGGCCAGTATCTGTGTCTCAGCACATTGGCTACATTCGGGTTGCTAAGACCGATGCCTCCAGTAACCGGGCTTTCATCCGCAAGTCTGCTGAGTTCCCGGATGGTCACTGGATCGCCTACTTCCGGGTGGCGACCCAGACGGGTACTGCTGACCAGAACCGTTCGGCACAGATCCGCTTTATCGCTGCCGACGGTAAGGACTACACGGTCTACTTCAACATTAATGCTAGTGGGGTGGTGGAACCGAACACCATCCACATGCAAGGTAGCGAAGGTAGTACCCGCAATGCTGCAACCATGTTCACTGGTTTGAATACCGAAACTTGGATGGACATGGCAGTAAAGTTCGATGCCGTGAACCGGCACATTGAACTCTTCCGTCGGATGCCCAATGGCACCTGGCAGAAGGGTGGTGGTCGCTTGATGGTGGATACGATCAAGCCCACGGTTATCGAGATTTCTTCCATGCCCGTCGCACCCAATGGGTGGTGGATGTATGTGGACTTCATCTCGGTTTGCCGACCTAACCTCATCTGCTACGGCGACAGCATTGCTGCTGGTCAGAACGAGTATGGGGTAACCCGAGGGAACAACCCCTACAACAACAACCGCAACTGGGCTGGTACCTGGTTCGGCAAGGTTCCGCTCTACGCCACGAACCGGAACAACCTGGTGCTTGTCCAGGGTGTGGAAGGCCGCCGTACCTGGCAGTACCTCAGCCAGTTGTCGGAGATCTCCAACTCTGGCGTGAAGGTAGTCTTCATGCATGCCAGCACGAATGACGTGAACGATGCCACCATGACCATGGCCAAGCGTACGTCTGACACCCAAGCCATCATCGACCAGCTTCATGCTGTCGGTGCTCAGGTGGTGCTGTTCAACTCCATGCAGGGTACCCAGGCGTACAACGATGCCTCGTCCAACACGGTCAAGCTGCGGGACTACACCGACCAGTGGTGGAACACCGAACTACCCAAGGTCAATGGTTTGGCCCAGACCCTGGACATCGCCCGTCTCATCGCCAAGGACGGGTACATGGACCCGGATCTCGGTGCGAGTGATGGTCTGCACCTGACCAATGCCTCGGCACAGAAAATCGCTGACAAGCTGGGACAGTTCTACTCGAACTCCACTTCCATCAATGGTTTGGCTCCGCTGGAAAGTCCTGCGTTTACCGGTATTCCTACCGTGCCTACGCAGACTCCTTTCCTGCCTTACGGCAAGCAGATCGCCAACACCGAGTACGTGATCACCTTCATTCAGGACTGGACCAGCAACTACGGTTACGGTGACCTAACGATACGTAGCAAAACTGGTGCTCAGCTGGCTGCCGGTGGTGTTCGCAGTGGTTATTACTACGTGCCAGGGGATGCTACTAACCCCTTGCCGGGGAATAATTATGCATTCGTGCACCACATGTCCTACGACACCAACAAGGGTTGGGAACTCTGGAACCACTGCTACACCGACCGTGTGTACATGCGTCATTCGAACAACCAGGGTGTCTGGCAAACTCCGGTGGAGTTGGTTACCGAGAATTGGATGGAGCGTAATAGCTTCATGACCCCACGGGTTACCGCATTCAATCGACTGCCTGTGTTCAACGCTGCTGGATACGAAGGCTTTACTCCGGTGCAGAACTCTGCCAACGGTGGTTGGCGTAACGTGGCTACAGGTGCAGCTGGTATTGGACTACTTGGTGCGGCTACTGGGGCCAGTGCCTTGAACTACATCGGTGGCATGTCCAAGACTACTGCTAATGGGCGAACTGCCAGCAACATGAACGACTTCCCTGATGAATGCGGGTTGTACGGTGTTGGTGTTGAGCCTTGGGCAAACCTACCTCCGGGTGTGGACCGCATTAACCCGGTGGGTTCTTCTGTCTACCACCATGTGTATGACGCCAGCACTGCTACGCAGATCTTCATTCCGCGTACTTCGGATATCTGCTATTTCCGTCGTAAGTCTGGTGGTACCTGGCAGCCTTGGGTACGTTACCTGACCGACTTGCAGTTGGTGGGGACCACTACTGACGATACTGCGGGAAATCCGAACGGGGCCATCATGCAGGTCAACGGCAGTGCCGCACTGAACGTCGGTGTTTGCACCCGTTTTGCGGATGGTACTCAAATTGTTCGGGCGTTACTCCAATTGGATTACGGTGCAGTAGATATCCTTCAGCGTCAGTTCACTTTCCCCATGTCTTTTGTGGGTAAGCCGGTGGTAACCGCCACCCTGGAACAAGGCACTGTTGCTGACATCAACAACATGCCTTTGCAGGCTCTTGGCCCTGTTATGGTTGCCAGTATCTATGCAGGCAACTGCAACGTGCGTGTCATGCGGTCTCAGGGGTATACTGCTGGTGGATTCGCAGCAGGCTCTAAAATGCTGTGCTCTGTCATCGCAATGGGGTTCTGGAAATAA

Genome Context

Tertiary structure

PDB ID

16850d15b45dc718d8edd72060b723a7fd7dc287104fbadf5f652d130e9bef76

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7551

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence