Protein

View in Explore

Genbank accession

APU02022.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,71

Evidence RBPdetect2

Probability 0,94

Protein sequence

MADLKVGTTIGGSPAWNQGNLPLVPSGDRILYKGARVYSESDKPSADELSVLSINGGRLKGQLQIDSASDNIFDLNSTDSGAVFMRYMHNNSNKAYTGIDASGNFYVRMADGASRAGIAFQIDNVSQDITFGANLKGPAGRAFSINKGDQPFIRDHGNGNVTISALSKVDGNPGDLYLGYNSAGMVTNTVRLESPLFWKGARQLVDSNGFILRSAMDNNYYNQSEADARFIRLNNNTTTDGFILSKTAEYTDAGRNMGYSGFYRHNGVDGFSGLTMHVAHPSYSNGAYSRGITFAYGSSSYGLYTYGYDSAGVRLANQKIYTEADKPTPQELGALAAEANAVSASKLQTPRRISLSSGASGSVLFDGSGDVVIPVTVANDSHTHNIYVKKSGDIMSGNLVVNAAVDANELRAGDATTKARIALSSDTVFFQGGPIGTTGLHKIAMSGYMGKGIDAVTYWMTNGVTPVVRWGSVDNKMFHEGYRPFDVQSTSLASKSCNDALESGFYSIFGTTADTPYGTGPSGSTMVVSRWSGTGVSQTFYTYNSDRVFVRRLVGTTWNAWFELYSTSKIPTPAEVGALAVNANAVSATRLQTARLISGVPFDGTSNITITATNVGALPITGGDINGNLLVKGTLTNEGQLISYDSSTRGYGFRSTYSTGWLYTQTGKVDRDVNDQKHNLSGWYGTPLSALRFTMAEGTSPHVLWGSTSHDVLHIGKSYGVGIRQGNGASNGHIYTEDGSRDFNKLITAGRYSVDGQWLNGRAGAAAATYVGTAEVEVRAWGSGPAYIQTFTQLEGGLPSRYNRVGTGTYPNIVWASWESGTKEWEYQAGYRMMISRSGEGVYPYMTIHKADLPPTGTESVIGAWQSKIGAPPTANNPDSAQLATIVASVVDTTNRYATLRLSARDITTNGILSIVDIGKDGLVVTNGGKKVELTAGVARAEKFIASDPYAFVSSTSNTHGVYLGNSASDKRLILGGGNNTAGAVHVRPQGISTETGETVFNTNGTISNGTTPSAPGHLTNKVYVDNLIAQQVSKSGDIMTGQLTIHTANNAPLELKSTTAGVVTPQYIIGNDSTGAQRWYVGQASPNSPDVLLYSTANGTYLRLEANQISFNKNPISTASQGAAAGSLVRRDFLQTSLSSQTPNNPVYIGASANLNNYQTPGYYYQDSNANAVSGSNYPTQQAGALVVTKAAGIIQEYTVYGSGVRFIRAFYTNVWSAWATIYDSLRPPTAAAVGALPIAGGTLTGGYLQIRGSANPMLELHQPGQVAAVIYLTSAGQLRFSTGNGAGGETAVRMTVDANGAVATIGSINGGAGVYDVGQRVYSPNNPQPSLTPTQIGNALASMAYDAVGQYAMLLVFVDKGNWLPPGTVVPGSQLRYSTAEGKDPGGAPPGNWRLHGRTNQGGRWGAWNVSLWQRVS

Physico‐chemical properties

protein length:	1419 AA
molecular weight:	150274,98130 Da
isoelectric point:	8,42694
aromaticity:	0,09302
hydropathy:	-0,25729

Domains

Domains [InterPro]

DC_0466
STR
1–192

DC_0466 cd19958 G3DSA:6.20.80.10 cd19958

DC_1150
STR
156–591

DC_1150 IPR048388 DC_1924

DC_1619
ATT
499–866

DC_1619

APU02022.1

1 1419

Architecture

STR

ATT

STR

RBD

STR 1-498 | ATT 499-866 | ATT 1053-1130 | STR 1150-1224 | RBD 1225-1419

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0466	STR	DC_0466	1	192	Novel HMM	DC_0466	Central	Low	Positional only	392 proteins / 392 hits
DC_1150	STR	DC_1150	156	591	Novel HMM	DC_1150	Central	Low	Positional only	18 proteins / 18 hits
cd19958	STR	DC_0464	498	565	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_1619	ATT	DC_1619	499	866	Novel HMM	DC_1619	N-terminal	Low	Positional only	123 proteins / 123 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	1052	1114	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR048388	ATT	DC_0224	1053	1130	InterPro cluster	Tail fibre protein gp37, trimerization region	Central	Medium	Text match	404 proteins / 802 hits
cd19958	STR	DC_0464	1150	1224	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_1924	RBD	DC_1924	1215	1419	Novel HMM	DC_1924	C-terminal	Low	Positional only	237 proteins / 237 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

APU02022.1

1 1419

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	811	811	0,1039
Central domain	812	1010	200	0,4948
C-terminal	1011	1419	408	0,8689

Note: Constraints were applied during segmentation.
Fixed 97 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-811

Central
812-1010

C-terminal
1011-1419

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Aeromonas phage L9-6 [NCBI]	1932905	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Aeromonas salmonicida [NCBI]	645	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Aeromonadales

Coding sequence (CDS)

Genbank protein accession

APU02022.1 [NCBI]

Genbank nucleotide accession

KY290956.1 [NCBI]

CDS location

range 150755 -> 155014
strand +

CDS

ATGGCAGATCTGAAAGTTGGAACTACGATAGGTGGTTCTCCTGCTTGGAACCAAGGTAATTTGCCATTAGTTCCAAGCGGTGATAGAATATTATACAAAGGAGCACGTGTTTACAGTGAATCTGATAAACCGTCTGCCGATGAACTGAGTGTTCTGTCAATAAATGGTGGTCGTTTGAAGGGTCAATTACAAATTGATTCAGCATCCGATAACATTTTCGATTTGAACTCAACCGATTCTGGCGCAGTTTTCATGCGCTATATGCATAACAATAGCAACAAAGCCTACACTGGCATCGACGCGAGCGGGAACTTTTACGTCCGCATGGCTGACGGCGCATCTCGCGCTGGCATTGCTTTCCAAATTGACAACGTTTCGCAAGACATAACCTTCGGGGCGAACCTGAAAGGTCCTGCCGGCCGTGCATTCTCAATCAACAAAGGCGATCAACCGTTCATCCGTGACCACGGCAACGGAAACGTTACAATTTCAGCTTTGTCAAAAGTAGATGGAAACCCTGGTGATCTGTACCTCGGATACAATTCCGCTGGTATGGTGACCAATACAGTTCGACTGGAAAGTCCGCTGTTTTGGAAGGGTGCGCGTCAACTGGTTGACTCTAATGGTTTCATCCTTCGTTCAGCGATGGATAACAACTATTACAACCAATCTGAAGCTGACGCACGTTTTATCCGTCTGAACAATAACACCACGACCGACGGTTTCATCCTGTCGAAAACCGCTGAATATACTGACGCCGGTCGAAACATGGGTTATTCTGGATTCTATCGCCATAATGGTGTTGACGGATTCTCCGGTTTAACGATGCATGTCGCTCATCCTAGCTATAGCAACGGAGCATACTCCCGTGGTATCACCTTTGCTTATGGTTCTTCGTCTTATGGTCTTTACACCTATGGTTATGATAGTGCTGGTGTTCGTCTGGCGAATCAGAAAATCTATACCGAAGCCGATAAGCCGACTCCACAAGAGTTAGGTGCGCTCGCCGCCGAGGCCAACGCAGTATCAGCTTCCAAACTTCAGACCCCTCGTCGTATTTCGCTTTCAAGCGGTGCTTCTGGTTCTGTATTGTTTGACGGCTCTGGTGATGTTGTTATTCCGGTAACAGTCGCAAACGACAGTCACACGCACAACATTTACGTTAAGAAATCTGGCGACATAATGTCAGGTAACTTGGTTGTTAATGCTGCAGTTGACGCGAATGAATTGCGGGCTGGCGATGCGACAACTAAAGCTAGAATTGCTCTGAGTTCGGACACCGTATTCTTCCAAGGTGGTCCTATCGGAACTACCGGTTTGCATAAAATCGCGATGTCTGGTTATATGGGCAAAGGCATTGACGCGGTGACCTATTGGATGACAAATGGCGTTACTCCGGTAGTTCGTTGGGGTTCAGTTGACAACAAGATGTTTCACGAAGGATACCGTCCTTTTGACGTCCAGTCAACTTCATTAGCTTCAAAAAGCTGTAATGACGCTTTAGAATCAGGTTTCTACTCTATTTTCGGAACAACTGCCGATACTCCATATGGCACTGGACCTTCTGGTTCAACTATGGTTGTTTCACGCTGGTCTGGCACTGGAGTTTCGCAGACATTTTACACCTACAACTCCGACCGCGTATTCGTACGTCGCTTAGTTGGGACAACTTGGAATGCTTGGTTTGAGTTGTATTCAACCTCGAAAATTCCAACCCCTGCTGAAGTCGGGGCTTTGGCTGTAAACGCGAACGCTGTCTCAGCTACTCGTCTGCAAACAGCTCGTTTGATTTCTGGTGTTCCATTTGACGGTACTTCAAACATCACAATTACTGCTACAAACGTTGGTGCTCTCCCAATAACCGGCGGTGATATTAACGGTAACCTTTTGGTTAAAGGAACCTTGACGAACGAAGGTCAACTGATTTCGTACGACAGTTCGACCCGCGGTTATGGTTTCCGGTCAACGTATTCTACTGGATGGTTATACACCCAAACGGGTAAAGTTGATCGCGACGTAAACGATCAAAAGCATAATTTGTCGGGCTGGTATGGAACTCCGTTGTCGGCACTGAGATTCACCATGGCTGAAGGAACTTCTCCTCACGTCCTTTGGGGTTCAACATCTCATGATGTTTTGCACATTGGTAAATCATATGGCGTCGGAATTCGTCAAGGTAATGGCGCCAGCAATGGACACATTTACACCGAAGATGGAAGTCGCGATTTCAACAAATTGATTACCGCTGGTCGTTATTCAGTCGATGGGCAATGGTTAAATGGCCGAGCCGGCGCAGCAGCTGCGACATATGTTGGAACCGCTGAAGTTGAAGTTCGCGCATGGGGCTCAGGTCCTGCCTATATTCAGACGTTCACTCAACTTGAAGGTGGTTTGCCGTCACGTTATAACCGAGTCGGTACCGGAACATATCCGAATATCGTTTGGGCATCATGGGAATCAGGCACAAAGGAATGGGAATATCAAGCTGGTTATCGCATGATGATTTCTCGTTCCGGGGAAGGCGTATATCCGTATATGACCATCCACAAGGCTGATTTGCCGCCGACTGGCACCGAGTCTGTTATAGGCGCCTGGCAGTCGAAAATCGGAGCTCCGCCTACAGCTAATAACCCGGATTCAGCACAATTAGCAACAATAGTTGCATCTGTCGTGGATACAACCAATCGTTATGCTACTTTAAGATTGTCTGCTCGCGATATCACAACAAACGGAATACTGTCTATTGTTGATATTGGTAAAGATGGTTTAGTCGTGACAAATGGTGGTAAAAAGGTTGAATTAACTGCAGGCGTTGCACGCGCTGAAAAGTTTATTGCAAGCGACCCTTATGCATTCGTTTCAAGTACTAGCAACACCCATGGTGTTTATCTTGGCAATAGTGCTTCGGACAAGAGACTGATACTCGGTGGTGGTAACAACACCGCTGGCGCAGTTCATGTTCGTCCACAAGGTATTAGTACCGAAACAGGCGAAACAGTATTCAACACCAACGGTACCATTAGTAATGGTACTACCCCGAGCGCGCCCGGTCATTTGACCAACAAGGTTTATGTTGATAACCTAATTGCTCAGCAAGTGAGTAAATCTGGCGATATTATGACTGGTCAACTAACCATTCATACAGCAAACAATGCACCTCTTGAATTGAAGAGCACAACTGCTGGTGTAGTGACACCTCAATATATCATCGGTAACGATTCTACTGGGGCACAACGTTGGTATGTCGGCCAAGCAAGTCCGAATTCTCCAGACGTACTTCTGTATAGCACGGCAAACGGAACTTACCTTCGCCTGGAAGCAAACCAAATATCGTTCAACAAAAATCCAATATCAACCGCCTCGCAAGGTGCAGCAGCTGGTTCTCTGGTTCGTCGAGATTTTCTCCAAACTTCTCTGTCTTCACAGACACCGAATAACCCAGTTTATATTGGAGCCTCAGCGAACCTTAACAACTACCAAACACCCGGATATTACTATCAGGATTCCAACGCAAACGCGGTTTCCGGAAGTAACTATCCAACGCAGCAAGCTGGAGCTTTGGTTGTTACAAAAGCAGCTGGAATAATTCAAGAATATACTGTTTACGGCAGCGGCGTTCGTTTTATTCGGGCTTTTTATACCAATGTTTGGTCAGCATGGGCAACCATATATGATTCGCTTCGCCCACCTACAGCTGCTGCTGTAGGAGCGTTGCCGATAGCCGGTGGTACTTTGACTGGTGGTTACCTGCAAATACGCGGAAGCGCAAACCCAATGTTAGAATTGCACCAACCTGGCCAGGTTGCCGCTGTAATTTACTTGACATCTGCAGGGCAATTAAGATTTAGCACTGGGAATGGGGCTGGCGGTGAAACTGCGGTTCGTATGACGGTTGACGCGAATGGGGCTGTTGCTACTATAGGATCTATCAATGGCGGCGCTGGTGTTTACGATGTCGGGCAACGTGTTTATTCTCCGAATAACCCGCAACCAAGTCTGACACCAACCCAAATCGGTAACGCTTTGGCGAGTATGGCTTATGACGCTGTTGGTCAATACGCAATGCTCTTGGTGTTTGTTGACAAAGGAAACTGGCTTCCACCCGGAACAGTTGTTCCCGGCTCACAGCTTAGATACTCTACAGCTGAAGGTAAAGATCCAGGCGGTGCTCCTCCAGGAAACTGGCGTTTGCACGGTCGTACAAACCAAGGCGGACGATGGGGTGCTTGGAACGTTTCGCTTTGGCAGCGTGTTAGCTAA

Genome Context

Tertiary structure

PDB ID

bf84d2fd707ccf99a3c321a927e0dc429041621320110a83751b7c06df914527

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5315

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence