Protein

View in Explore

Genbank accession

YP_009842508.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MSRILLRDLEPGRLYHIQARATNGEQSSQWSQLWDLQTTSDIMPPAAPTSLAWTVEGTAFKAVWTGPTLNQDGTPLMDFKDFQVKIYSPAAPSTIVTYYTTAPRFDFPFEMNVNSFTTPRAQVSIEVRARDNTGNLSTAATATATNPPPANVTGFTATGITDAIALKWNANADTDLKHYKVWQGTAAGSENTLVYTGLATSFVFDTNSTNPQYFKIVAVDVFNTESATAATASATAKSSLAVDVNPPNAPTGVTVSSALDSSDPSGGRAYIDVSWTGVADTDLQNYSVRYSTGTSWDYINVPEGVTSARINGLRPDTDYNVAVAAVDYSGNSSAYTNAGTYPIKTAKDTSAPAAVSGVTVGAGITTMTVAWTENTENDVKNGIGTYEIQLDTANTFNTGNLVTKQNSGTIVSFANLTSNTTYYTRVRAIDATGNAGAWSSIVSGTPRYVANADIQAGTINGDKITAASLNGDRVVANSLDANTIKANSTFSQNLTVGSTFTMGTSGIMQSANYSVGSTGWRLTNNTLEINQGTIRASALQLQNGHNMLHPAYADFEFVKSWYTTNLITFNDGGVSTWAISDATDVTGKYNTQCIKTSWTGVGTFSRTYLGPTFTSYNVQLEANTDYIFSGWVYVKSGAGAKTAALGIKLADASFPGPVGNTSIPATGVWTRIWGTFNSGTQTSAELYLSQYTAGDMYWDGLQLEKKVTADTGPSQWKPPASTSIDGGIIRTGEIRSTASASGLAGQPAWSINMQGNAQLGDANIRGRLVVGDVNNPSADGVNSKIQSANYSAGTTGWVIRNDGYAEFRQLAVNSIKVTAFDSPFQNTANAKLFDYMQDANLWLQSGSVQQKTDPGAYSAESLFEFTGPGLVLRNGTGVKPIAYDPTILYRISARVRAFTVSTLNSNGTFEGNNTTGWTVDATNGATIAASNTYASTGTYSMRMTSGASTGASYRAWTNVLVKPGYNYTINAKVKAMIQAAYYNATNYGNIELRVTWFGTSGYLDESIQLVTPPVDANGVILTAPTDWFSIGATFTAPANATNANFIIRLARYDNVTAGTVIGYIDDVSVTTPPRIKLGLFGMDNSNNFIDYDFIDDATTPTKKHPMPSDYSTLSGFSSSQYMLVADNVEVPIATGGSSTTSDWITLTGYIKGRGGSGATGKFGKSGMFLDEYNPSSFNQEVRFMVPYVEFDTAAGSIAQLDQFSIESYESGAVAKVDTTGNSESMKSVSIENIQDGTEFDHALRFYTGEIDEKKPGLIGHITDGETNDAAHLRIVPPLLNSLSGYNEGPYIGIWDQNPNYLYDASFQTGISGWTGMANTTLSWNETVGREDNSCLQIQATGTISSPSTTELLGKYQVSVLGNQELVGQKVTVSGYAMMGTATGRNVRLVVKFLDEAGAMLNGYFIEKAVTNNDWTYYAFVTPIVVPDTCYTIEFSFSWFNGATGDIVYVEDVQLEANDKKTDFRSASASKIDLNAEVVRSRGPLIIADNDFQLPAAVIGGTGKPDAPGYKGVILQNEAGTGGLRLINYTDTNGSRVSLTTSFFSSEGVEESRIAIYGMADGAFPGRMALTSPNGSWALSTQPAADGAYPYDVHVHGSLIVDGPLQWVPLTSSAVTPFDAGRALGVAKINNMLVFRGAGSWSGTAGSSGTVIFTLPSGYRPASPQYMCALMWNGNAWSSGVAFHVKTNGECILWSPPEGAGLGTSLSIEGCQMNLSAMPTTTTPGTDTTAPSAPTGFSISAVSSGTSTGSYKLAWTNPSASDTAGVKVIWRSDRYPTVTIASSGTKTLTTDGTVITVTGSASQAKTYTHSGLPVNKTIYYRVVSYDKSGNHSSYVSASRYLLASPITISPSSSGSYRLGYGGMWRNDGDEVYQGDWTGNDNHRGLYFYGSNIYSKLSTGGVVRTPTKMTIYLKRLNTSHGNNAGVGINLRGHKYQTKPSGDPVGSMTNEGSSGDNIVYLSRGEAATVTIPSSWYNNFVVADPNNTDRLEGIGVYGSSTSDYAVLYGKSSGSSYGKLTIYHKG

Physico‐chemical properties

protein length:	2021 AA
molecular weight:	215151,54090 Da
isoelectric point:	5,10701
aromaticity:	0,10193
hydropathy:	-0,23013

Domains

Domains [InterPro]

IPR003961
STR
1–41

IPR003961 IPR003961 DC_1241 IPR013783 IPR013783 DC_1278 G3DSA:2.60.120.260 DC_0240 G3DSA:2.60.120.260 DC_2246

DC_2195
ATT
2–44

DC_2195 DC_1267 IPR013783 DC_1230 G3DSA:2.60.120.260 IPR003305 DC_1500

IPR036116
STR
4–51

IPR036116 IPR003961 IPR003961 IPR013783

IPR036116
STR
246–443

IPR036116 IPR003961

IPR003961
STR
246–348

IPR003961 IPR003961

IPR003961
STR
247–332

IPR003961 IPR003961

IPR003961
STR
270–332

IPR003961 IPR003961

YP_009842508.1

1 2021

Architecture

ATT

STR

RBD

STR

RBD

ATT 1-243 | STR 244-832 | STR 899-1296 | STR 1298-1456 | RBD 1457-1729 | STR 1730-1841 | RBD 1842-2007 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR003961	STR	DC_0003	1	41	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
DC_2195	ATT	DC_2195	2	44	Novel HMM	DC_2195	N-terminal	Low	Positional only	34 proteins / 34 hits
IPR036116	STR	IPR036116	4	51	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR003961	STR	DC_0003	45	137	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
DC_1267	ATT	DC_1267	48	147	Novel HMM	DC_1267	N-terminal	Low	Positional only	38 proteins / 38 hits
DC_1241	ATT	DC_1241	140	243	Novel HMM	DC_1241	N-terminal	Low	Positional only	68 proteins / 68 hits
IPR013783	STR	IPR013783	148	242	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	149	332	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
DC_1230	STR	DC_1230	242	499	Novel HMM	DC_1230	Central	Low	Positional only	37 proteins / 37 hits
IPR013783	STR	IPR013783	243	347	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR036116	STR	IPR036116	246	443	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR003961	STR	DC_0003	246	348	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	247	332	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	270	332	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR013783	STR	IPR013783	349	447	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	351	452	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	352	436	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	352	445	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	354	443	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
DC_1278	STR	DC_1278	450	832	Novel HMM	DC_1278	Central	Low	Positional only	66 proteins / 66 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	553	705	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	899	1073	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR003305	CBM	DC_0700	905	1049	InterPro cluster	Carbohydrate-binding, CenC-like	C-terminal	High	Text match	15 proteins / 15 hits
DC_0240	STR	DC_0240	1073	1296	Novel HMM	DC_0240	Central	Low	Positional only	34 proteins / 34 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1298	1456	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_2246	RBD	DC_2246	1457	1769	Novel HMM	DC_2246	C-terminal	Low	Positional only	32 proteins / 32 hits
DC_1500	RBD	DC_1500	1704	2007	Novel HMM	DC_1500	C-terminal	Low	Positional only	35 proteins / 35 hits
IPR013783	STR	IPR013783	1730	1841	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	1730	1832	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

YP_009842508.1

1 2021

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	248	248	0,5376
Central domain	249	569	322	0,5779
C-terminal	570	2021	1451	0,2667

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-248

Central
249-569

C-terminal
570-2021

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptomyces phage Gilson [NCBI]	2488789	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

YP_009842508.1 [NCBI]

Genbank nucleotide accession

NC_048742 [NCBI]

CDS location

range 34534 -> 40599
strand +

CDS

ATGAGTAGAATTCTTCTAAGAGACCTAGAGCCAGGAAGACTGTATCACATTCAGGCGAGAGCCACGAATGGTGAGCAGTCTTCCCAGTGGTCCCAGCTTTGGGACCTTCAGACAACCAGTGACATTATGCCACCAGCCGCACCTACCAGTCTAGCATGGACTGTTGAAGGTACGGCTTTTAAGGCTGTCTGGACAGGACCAACCCTTAACCAGGATGGCACTCCACTTATGGATTTCAAGGATTTCCAGGTTAAGATTTATTCTCCAGCAGCTCCATCTACAATTGTTACATATTACACGACTGCTCCGAGATTCGATTTCCCATTCGAAATGAATGTGAATTCATTTACGACACCTCGTGCTCAAGTAAGCATTGAGGTTCGAGCCAGGGACAATACTGGAAATCTTTCAACAGCAGCTACGGCAACAGCGACAAATCCACCCCCAGCAAATGTAACAGGTTTTACAGCAACAGGAATTACAGATGCTATTGCTCTTAAGTGGAACGCAAATGCCGACACAGACCTAAAGCATTACAAGGTTTGGCAAGGAACTGCGGCGGGTTCTGAGAATACACTCGTATACACAGGACTAGCTACTTCATTCGTATTTGATACTAATTCTACAAATCCGCAGTATTTCAAGATTGTAGCGGTTGACGTCTTTAATACAGAGTCAGCAACAGCGGCAACAGCCAGCGCAACCGCAAAGTCTTCCCTTGCCGTAGACGTTAATCCGCCAAACGCACCTACCGGAGTGACTGTTAGCTCAGCCCTAGACTCATCTGACCCGTCAGGTGGTAGGGCTTACATTGACGTGTCTTGGACTGGTGTTGCTGATACGGACCTTCAGAATTACAGCGTCCGATACAGCACCGGAACATCTTGGGATTACATCAATGTTCCTGAGGGCGTTACAAGCGCGAGAATCAATGGCCTAAGACCAGATACGGATTACAATGTTGCAGTTGCAGCAGTTGACTATTCTGGTAATTCCAGCGCATATACAAATGCAGGTACATACCCTATCAAGACAGCCAAGGACACATCTGCCCCGGCTGCCGTTTCTGGTGTAACAGTTGGCGCGGGTATTACAACCATGACTGTTGCTTGGACCGAGAACACCGAAAATGACGTAAAGAATGGAATCGGTACATACGAGATTCAGCTCGATACAGCCAATACATTCAATACTGGAAACCTCGTTACCAAGCAGAATTCTGGTACCATTGTTTCATTTGCAAATCTAACATCAAACACGACTTACTACACAAGAGTTCGTGCAATTGATGCTACCGGAAATGCAGGTGCATGGTCTTCTATTGTTTCTGGAACGCCAAGATATGTGGCGAATGCAGACATTCAGGCTGGTACCATCAACGGTGACAAGATTACCGCAGCAAGCCTTAACGGTGACAGAGTAGTAGCCAACAGCCTTGACGCTAATACCATCAAGGCCAATTCGACGTTCTCTCAGAACCTCACGGTTGGTTCTACCTTCACAATGGGCACCAGTGGAATTATGCAGAGCGCGAATTATTCTGTGGGTTCTACGGGATGGCGTCTAACAAACAACACACTTGAGATTAATCAGGGTACTATTCGAGCATCTGCCCTTCAGCTTCAGAATGGTCACAACATGCTTCACCCAGCCTATGCAGATTTTGAGTTCGTAAAGTCATGGTACACAACGAATCTCATCACATTCAATGATGGTGGAGTTTCAACGTGGGCTATTTCTGATGCAACGGATGTCACTGGAAAGTACAACACTCAGTGTATCAAGACTTCATGGACAGGTGTGGGTACGTTTTCAAGAACTTACCTTGGACCGACATTCACCAGCTACAACGTTCAGCTTGAGGCAAATACCGATTACATTTTCTCCGGGTGGGTTTATGTAAAGTCTGGTGCTGGAGCAAAGACGGCTGCTCTTGGAATTAAGCTAGCAGATGCTTCATTCCCTGGCCCTGTAGGAAACACTTCAATCCCGGCAACAGGAGTATGGACCAGAATTTGGGGTACATTCAATTCAGGTACTCAGACAAGCGCAGAACTTTACCTATCTCAGTATACTGCTGGAGATATGTACTGGGATGGTCTACAGCTTGAAAAGAAGGTCACTGCTGATACGGGTCCATCACAGTGGAAGCCACCAGCTTCTACATCAATTGATGGTGGAATTATTCGTACAGGTGAAATTCGCTCAACAGCTTCAGCAAGCGGTCTTGCAGGGCAGCCAGCATGGTCAATTAACATGCAGGGTAATGCCCAGCTTGGTGATGCCAATATTCGCGGTCGCCTTGTTGTTGGAGATGTCAACAACCCATCTGCCGATGGTGTTAATTCAAAAATTCAGTCAGCAAACTATTCTGCTGGAACAACCGGATGGGTTATTCGAAATGATGGCTATGCTGAATTCCGTCAGCTAGCAGTTAACTCAATCAAGGTAACTGCATTTGACTCTCCATTCCAGAATACTGCAAACGCTAAGCTATTCGATTACATGCAGGATGCTAACCTGTGGCTTCAGAGCGGTTCCGTTCAGCAGAAGACTGACCCTGGTGCGTACTCGGCAGAATCTCTATTTGAGTTTACCGGGCCGGGTCTGGTATTGAGAAATGGTACTGGTGTCAAGCCTATTGCTTATGACCCAACCATTCTTTACCGCATTTCAGCCCGTGTTCGCGCCTTTACAGTTTCTACCTTGAATAGCAATGGTACCTTTGAGGGCAACAATACAACCGGATGGACTGTTGACGCAACAAACGGTGCGACCATTGCGGCAAGCAATACCTATGCAAGTACGGGAACATACTCAATGAGAATGACATCTGGTGCTTCAACAGGTGCTTCTTACCGTGCATGGACAAATGTTCTCGTAAAGCCTGGATATAATTACACAATCAATGCCAAGGTTAAGGCAATGATTCAGGCGGCATATTACAATGCCACGAATTATGGAAATATCGAACTTCGTGTTACATGGTTCGGAACTTCCGGATATCTTGACGAGAGTATTCAGCTTGTAACTCCGCCAGTAGATGCTAATGGTGTAATTCTAACTGCACCTACTGACTGGTTCTCAATTGGTGCTACATTTACTGCCCCGGCTAATGCTACGAATGCAAATTTTATCATCAGACTTGCTCGTTACGATAATGTTACTGCCGGAACAGTAATTGGATACATTGATGATGTTTCTGTTACCACACCACCAAGAATTAAGCTTGGTCTATTTGGTATGGATAATTCTAATAATTTCATTGATTATGACTTTATCGATGATGCAACCACTCCAACAAAGAAGCATCCAATGCCTTCAGATTACAGCACTCTATCAGGATTCTCTTCAAGTCAGTACATGCTTGTTGCTGATAACGTAGAGGTTCCAATTGCGACCGGTGGTTCAAGCACAACATCCGACTGGATTACTCTTACTGGATACATCAAGGGCCGTGGTGGTTCTGGTGCGACCGGTAAGTTTGGTAAGTCTGGAATGTTCCTTGATGAATATAACCCTTCATCATTCAACCAGGAAGTCCGATTCATGGTTCCTTATGTTGAATTCGATACTGCGGCGGGTTCTATTGCTCAGCTTGACCAGTTCTCTATTGAGTCTTATGAATCTGGAGCTGTAGCCAAGGTAGATACTACAGGTAATAGCGAAAGCATGAAGTCTGTATCTATTGAGAACATTCAGGATGGTACAGAATTCGACCATGCTCTTAGATTCTACACTGGAGAGATTGACGAAAAGAAGCCGGGTCTTATTGGTCACATCACAGATGGTGAGACCAATGACGCAGCTCATCTAAGAATTGTTCCGCCATTGCTTAACAGCTTGAGTGGTTACAATGAAGGTCCATACATTGGTATTTGGGACCAGAATCCTAATTACCTTTACGACGCATCATTCCAGACAGGAATTTCTGGCTGGACCGGAATGGCTAACACGACACTCTCCTGGAATGAGACTGTTGGTCGTGAAGACAACTCATGTCTTCAGATTCAGGCTACTGGAACAATTTCTAGCCCGTCAACCACAGAGCTTCTAGGTAAGTATCAGGTATCAGTTCTTGGTAATCAGGAATTGGTTGGTCAGAAGGTAACAGTTTCCGGATATGCAATGATGGGAACTGCTACAGGACGAAATGTTCGTCTCGTAGTTAAGTTCCTTGATGAAGCAGGTGCAATGCTAAATGGATACTTCATTGAAAAGGCTGTCACGAATAATGACTGGACATACTACGCATTTGTAACTCCAATTGTTGTTCCGGATACCTGTTACACAATTGAATTCTCATTCAGTTGGTTTAATGGTGCCACAGGTGACATTGTTTATGTTGAGGATGTCCAGCTTGAGGCGAATGATAAGAAGACAGATTTCCGCTCGGCTTCGGCAAGTAAGATTGATTTGAATGCTGAAGTTGTTAGAAGTCGTGGACCGCTTATTATTGCAGACAATGACTTCCAGCTTCCTGCGGCCGTCATTGGTGGAACTGGTAAGCCTGATGCTCCAGGATACAAGGGTGTCATTCTTCAGAATGAGGCGGGCACTGGTGGTCTAAGACTCATCAATTACACTGACACCAATGGTTCTAGAGTTTCACTTACAACATCTTTCTTTAGCTCAGAAGGAGTTGAGGAATCTAGAATTGCTATTTATGGTATGGCAGATGGTGCATTCCCAGGAAGAATGGCTCTTACCAGCCCTAACGGTTCTTGGGCATTGTCAACTCAGCCTGCGGCTGATGGTGCTTATCCATATGACGTTCATGTTCATGGCTCGCTTATCGTTGATGGTCCTCTACAGTGGGTTCCGCTAACTTCAAGCGCTGTGACCCCATTTGATGCCGGACGTGCTCTTGGTGTTGCCAAGATTAACAATATGCTGGTATTTCGTGGGGCTGGTTCCTGGTCTGGTACAGCCGGTTCTTCTGGTACAGTTATCTTTACGCTTCCGTCTGGGTATCGTCCAGCGAGCCCTCAGTACATGTGTGCTCTTATGTGGAACGGTAATGCTTGGTCATCTGGTGTGGCATTCCATGTTAAGACAAACGGTGAATGTATTCTTTGGTCACCACCTGAGGGTGCTGGTCTAGGTACATCTCTATCGATTGAGGGATGTCAGATGAATCTATCAGCCATGCCAACAACGACGACACCGGGAACCGACACAACCGCTCCGTCAGCACCTACCGGATTCAGTATTTCTGCTGTATCGTCAGGTACGTCAACAGGCTCTTACAAGCTTGCTTGGACGAATCCTAGCGCATCTGATACGGCGGGTGTCAAGGTTATTTGGAGGTCTGACCGTTATCCAACTGTTACCATTGCTAGCTCTGGTACAAAGACCTTGACAACAGATGGTACAGTCATTACGGTTACTGGTTCAGCGTCACAGGCAAAGACCTACACACACTCAGGTCTTCCAGTGAACAAGACAATTTATTACCGTGTGGTTTCTTACGACAAGTCTGGTAACCACTCGTCATATGTGAGCGCTTCTAGATATCTTCTGGCAAGCCCTATCACTATCTCTCCGTCTAGCTCCGGTTCTTACCGTCTAGGTTACGGAGGTATGTGGCGAAACGATGGTGACGAAGTTTACCAGGGTGACTGGACCGGAAATGACAACCATCGTGGTTTGTACTTCTATGGTTCCAACATTTACAGCAAGTTGTCAACTGGTGGTGTCGTTCGTACTCCAACAAAGATGACTATTTACCTAAAGAGACTAAACACCTCTCACGGTAACAACGCCGGGGTTGGAATCAACCTTCGTGGTCACAAGTACCAGACAAAGCCTTCTGGAGACCCAGTTGGTTCTATGACAAACGAGGGTAGCTCTGGAGACAACATCGTTTATCTGAGCCGTGGAGAGGCTGCGACAGTAACCATTCCATCTTCGTGGTACAATAACTTTGTTGTTGCCGACCCGAACAACACCGACAGACTTGAAGGTATCGGTGTCTACGGTAGCTCAACATCAGACTATGCCGTGCTATATGGTAAGTCAAGTGGTTCTAGTTACGGAAAGCTAACTATCTACCACAAGGGTTGA

Genome Context

Tertiary structure

PDB ID

afe363f65c8892e4b13ebee676a058acde93bf35a433c16404a82c8c303acd8d

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7092

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence