Protein

View in Explore

Genbank accession

CAO0810313.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,82

Evidence RBPdetect2

Probability 0,93

Protein sequence

MASAFEDYVNGELPKRVSSIDEPTSVVNGHIPVSTGVGLNTTFVDPVTIPGLKGEDGAPGKDGEQGPPGPVGPAINIIANVDLATFEQDIKPLDTHNVGDAWFVEDRLWVWESPLGNEDPPVKGRWVETGSLRGPDGTGLVIRGRWPNNLELPKTESNKPGDAYSWNNQLWAWMLISGNNPPENPTIDDYDWFPVTPQGERGPEGPEGPQGKDGGIGPEGPQGEPAMPFTIKDSLPSPADLPDPSVAKESEAYLVTMEADKPEHLFIFVKGAWSDLGTFQGPEGPEGKQGNTGDPGPDGKQGEPGPQGRNLEVVKAVETAEELLTTTGVEQYQGVSVRSTNTVYVLTGQDPTVDISWTAMGSFRGPQGPEGPQGEDGEQGLPGEPGAQGKSAFQVALDNGFTGTEGEWLISLHGKNVVITGAVANEAALPADAPDQAAYFTQDTSTLFVKIDGNWVNSGTHRGPKGEDGAPGKDGDQGPEGPEGPEGPQGPAGEPIQIIAAIDTPEDTPPEALADNQWKAYTVKSTGEVFVNMDGSRWTSIGIMAGPQGKPGEGLNIKGVLTDASQLPKKDTDPDLVTGDSYWVETNEGTMLYTYQGQEIDGYIGPINLNGEQGIQGVEGPQGPEGKQGGGLLIIYVGDDAGKPVASADNVGKGIAIRTNTEGQVEVFVSIDTEGTFTWESLGVLAMGPQGPEGPEGKQGVPGIPGKTGQKGERGSSWVILPEGQTAPTSIDGNRGDWCIDKTGTVWYKDANWVVFYKLMSVPVSEVDPEDVDKKMVRYKLGWTELPVDEVVDAEVGVFYGRRKATADGAVEWTAIELPTPAIDAVPSPVVNAQYVRKGIAGGETEWATITFPEIPSDVVRDTAQATKPQGRVAGNWVDVAPLQTDDTLMGMQNGEWVAVPAAVIGEVPSEGANGTNYVREKTASGSKWTPVTIIVDQADATSGQLFLRNAAAKSWTLFQGPNNDVTADGDWLRSRTGTNITWKKLDKSFDAYSLKSSTFTGTALTLTPANQQCYRVQTAANQTITLENGPVDRMITAVLVLLGKVAMPTLSSAVLQWNNGTPVIVDDLGDTKTVLTLLWDGTNWIVSKGAVI

Physico‐chemical properties

protein length:	1093 AA
molecular weight:	115795,00500 Da
isoelectric point:	4,33218
aromaticity:	0,07136
hydropathy:	-0,43303

Domains

Domains [InterPro]

DC_0272
ATT
1–50

DC_0272 IPR050149 DC_1062

G3DSA:1.20.5.320
STR
49–93

G3DSA:1.20.5.320 DC_0114 DC_0309

G3DSA:1.20.5.320
STR
281–333

G3DSA:1.20.5.320 G3DSA:1.20.5.320 G3DSA:1.20.5.320

CAO0810313.1

1 1093

Architecture

ATT

STR

RBD

STR

RBD

STR

RBD

ATT 1-50 | STR 51-93 | RBD 153-280 | STR 281-333 | RBD 334-362 | STR 363-900 | RBD 924-1091 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0272	ATT	DC_0272	1	50	Novel HMM	DC_0272	N-terminal	Low	Positional only	31 proteins / 31 hits
G3DSA:1.20.5.320	STR	G3DSA:1.20.5.320	49	93	Merged direct domain	G3DSA:1.20.5.320	Central	Low	Positional only	67 proteins / 67 hits
IPR050149	Unmapped	-	50	735	InterPro	Collagen superfamily	-	-	-	-
DC_0114	RBD	DC_0114	153	405	Novel HMM	DC_0114	C-terminal	Low	Positional only	42 proteins / 42 hits
G3DSA:1.20.5.320	STR	G3DSA:1.20.5.320	281	333	Merged direct domain	G3DSA:1.20.5.320	Central	Low	Positional only	67 proteins / 67 hits
G3DSA:1.20.5.320	STR	G3DSA:1.20.5.320	363	411	Merged direct domain	G3DSA:1.20.5.320	Central	Low	Positional only	67 proteins / 67 hits
DC_0309	STR	DC_0309	409	900	Novel HMM	DC_0309	Central	Low	Positional only	26 proteins / 26 hits
G3DSA:1.20.5.320	STR	G3DSA:1.20.5.320	688	754	Merged direct domain	G3DSA:1.20.5.320	Central	Low	Positional only	67 proteins / 67 hits
DC_1062	RBD	DC_1062	924	1091	Novel HMM	DC_1062	C-terminal	Low	Positional only	31 proteins / 31 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage RLG_107 [NCBI]	3449637	Viruses >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAO0810313.1 [NCBI]

Genbank nucleotide accession

OZ317769.1 [NCBI]

CDS location

range 144465 -> 147746
strand -

CDS

ATGGCTTCTGCATTTGAAGATTATGTAAATGGGGAACTCCCCAAACGGGTATCATCTATTGATGAACCTACCTCTGTAGTTAATGGACACATCCCGGTTTCTACCGGGGTGGGTCTTAATACCACTTTCGTTGATCCTGTCACTATACCTGGATTAAAGGGTGAAGATGGTGCACCAGGGAAAGATGGTGAGCAAGGTCCTCCTGGTCCGGTTGGTCCAGCTATCAATATTATCGCTAATGTTGATCTAGCAACATTCGAACAAGATATCAAGCCATTAGATACACATAATGTCGGTGATGCTTGGTTCGTTGAAGATCGGCTATGGGTATGGGAATCACCGCTAGGTAATGAAGATCCCCCTGTAAAAGGACGTTGGGTTGAAACAGGTTCACTTCGTGGTCCAGATGGTACTGGTCTAGTTATCCGTGGTCGTTGGCCTAATAACTTAGAATTACCTAAGACTGAAAGTAATAAACCTGGAGATGCTTATTCATGGAATAATCAACTCTGGGCGTGGATGCTTATCTCAGGTAATAATCCGCCAGAGAATCCAACTATCGATGACTATGATTGGTTCCCAGTTACACCACAGGGTGAACGTGGACCTGAAGGTCCTGAGGGTCCGCAAGGTAAAGATGGTGGAATTGGTCCTGAAGGTCCTCAGGGTGAACCAGCAATGCCGTTTACCATTAAGGATTCACTACCATCTCCAGCTGATTTGCCTGATCCATCTGTAGCTAAAGAATCAGAAGCATACTTAGTTACTATGGAAGCTGATAAACCAGAACATCTATTCATCTTTGTAAAAGGAGCGTGGTCAGACCTAGGTACTTTCCAAGGTCCTGAGGGCCCTGAAGGCAAGCAAGGTAATACAGGTGATCCGGGCCCCGATGGTAAACAAGGTGAGCCGGGTCCGCAAGGCCGTAACTTAGAAGTAGTTAAAGCAGTTGAAACTGCTGAAGAGCTATTAACTACGACTGGTGTAGAACAATACCAAGGTGTTTCAGTACGTTCCACCAATACGGTTTATGTACTGACTGGCCAAGATCCGACTGTTGATATCTCATGGACAGCCATGGGTTCATTCCGTGGCCCGCAGGGCCCTGAAGGTCCGCAAGGTGAAGATGGCGAACAAGGTCTACCTGGTGAACCAGGGGCACAAGGTAAATCGGCTTTCCAAGTAGCATTGGACAATGGCTTCACTGGTACTGAGGGTGAATGGTTAATCAGTCTACATGGTAAGAACGTAGTTATTACTGGTGCTGTTGCCAATGAGGCAGCCCTGCCGGCAGATGCTCCTGATCAGGCAGCGTACTTCACACAAGACACATCTACCTTATTTGTTAAGATAGATGGTAATTGGGTAAATAGTGGTACACATCGAGGTCCTAAAGGTGAAGATGGCGCACCTGGTAAAGACGGTGATCAGGGACCAGAAGGACCCGAGGGACCAGAAGGCCCACAAGGTCCCGCTGGTGAACCTATCCAGATCATCGCAGCGATTGACACTCCTGAAGATACCCCACCAGAAGCACTTGCCGATAACCAATGGAAAGCATATACTGTTAAGTCCACGGGCGAAGTATTTGTTAACATGGACGGTAGTCGCTGGACTAGCATTGGTATTATGGCAGGTCCGCAAGGTAAACCGGGTGAAGGTTTAAACATTAAAGGTGTTTTAACCGATGCTTCACAACTACCAAAGAAAGACACTGATCCTGACTTAGTAACTGGTGATTCATACTGGGTTGAAACTAACGAAGGTACAATGCTCTATACTTACCAAGGTCAGGAAATTGATGGCTATATCGGCCCAATTAATCTAAATGGTGAGCAGGGTATCCAGGGTGTCGAAGGCCCACAAGGTCCTGAAGGTAAACAAGGTGGTGGTCTATTAATTATCTATGTTGGTGATGATGCTGGTAAACCAGTAGCATCTGCTGATAACGTAGGTAAAGGTATTGCCATTCGCACCAATACTGAAGGACAAGTAGAAGTATTTGTAAGTATCGATACTGAAGGTACATTTACTTGGGAAAGCCTAGGTGTCTTAGCCATGGGTCCGCAGGGTCCTGAAGGTCCTGAGGGCAAACAAGGTGTTCCAGGTATCCCTGGTAAAACCGGTCAGAAAGGTGAACGTGGATCCTCTTGGGTAATTCTACCTGAAGGTCAAACTGCACCCACTTCTATCGATGGTAATCGTGGTGACTGGTGTATCGACAAAACTGGTACCGTTTGGTATAAAGATGCTAACTGGGTTGTATTCTACAAATTAATGTCAGTTCCAGTTAGTGAAGTCGATCCAGAAGATGTCGATAAGAAAATGGTTCGGTACAAACTCGGTTGGACTGAACTACCTGTTGATGAGGTGGTAGATGCTGAAGTAGGTGTCTTCTATGGTCGCCGTAAAGCAACCGCTGACGGGGCTGTTGAATGGACTGCTATTGAATTACCAACACCTGCCATTGATGCTGTACCTAGTCCAGTTGTTAATGCACAATACGTTCGTAAAGGTATTGCAGGGGGTGAAACTGAATGGGCTACCATTACATTCCCAGAAATTCCTTCAGATGTAGTACGCGATACTGCACAAGCTACTAAGCCTCAAGGTCGTGTAGCTGGTAACTGGGTTGATGTAGCACCTCTGCAAACCGATGATACTCTAATGGGTATGCAAAATGGTGAATGGGTAGCTGTACCAGCCGCAGTTATTGGTGAAGTACCTAGTGAAGGTGCTAATGGCACTAACTATGTACGTGAGAAAACAGCTAGTGGTTCTAAATGGACACCTGTAACTATTATAGTTGATCAAGCTGATGCTACTAGTGGACAACTATTCCTACGTAATGCTGCGGCTAAATCATGGACTCTATTCCAAGGGCCGAATAATGATGTAACCGCTGATGGTGATTGGCTACGTAGCCGTACTGGTACTAATATTACTTGGAAGAAGCTAGATAAATCATTCGATGCATATAGCCTAAAATCAAGTACATTCACTGGTACAGCTTTAACTCTAACACCAGCTAACCAACAGTGCTATAGGGTTCAAACTGCTGCTAACCAAACCATTACACTAGAGAATGGACCTGTTGATCGTATGATCACAGCTGTTCTTGTATTGCTTGGTAAGGTAGCTATGCCAACACTTTCTAGTGCAGTGTTACAATGGAACAATGGTACTCCAGTAATAGTAGATGACCTAGGTGATACTAAAACAGTTCTTACCCTCTTATGGGATGGTACTAACTGGATAGTTTCCAAAGGTGCTGTTATTTAA

Genome Context

Tertiary structure

PDB ID

3f4c6ca55de7170267aab861c063a9a6a66d0eec42486371e431224f869a2539

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,5199

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence