Protein

View in Explore

Genbank accession

QNN98311.1 [GenBank]

Protein name

minor tail protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MRILLRDLTPGTDYNIQLRANDGTNVSDWSRIFPLTTIQDTLAPAAPTGLTWVVNRSAFSAKWNAVTQNEDASPLEDFSHYLVKIAIPGGSYVTIKTTNTFYDFPFETNKAQFGTPQASLEATVYAVDLTGNVSVASTTLTATNPPPPDPTGVVAAGIVGGVSMRWDVQVIDDLAAYDVYMSTSGSGFTPSNANRIYSGTGNTVVYDSSSLGVVHYFKIRSRDVFDSISNYVTVSATPISPTDVDTTAPGVPTGLAATMAVDTNDSAFAVATVSWTAPSDTDLAGYVVRYKQNADTGYDYVNVPVGTTSIIIGGLTVGVQYNFGVQAYDRSTNRSAYSTNVNATAANTAPSTPAAPTAVADVMSIQVSHSLQKATSGRLEADVSYLEVHLGTTSTFTASDSTMIGQLQVEPGSTFVSEVFNTPAQDSALARWVRVIAVDRGGLKSASSAVASVTVGLISNAYIANATITSAKISNLDANKITAGTGIINALLIKNSLTVDTGGTIKSTNYVAGTTGYQLSNNTLEINGGTIRAAALLLQDAPNIILPQYADFEFQSTWYTGKQVTFNDGGTTSWTIATAPELTPKFGTQCLKHTWTGGGTFSRVYQGSSYTDYNVVVEPNTDYIASVWVFNPSGSGDKTVGFGVKMGDGVTYPQPGGTPIVVANGTWTRISGTFNTGANSTLMTYMSLYNTGSVYFDGIQIERKLTSSTVASPWRAPSTTSIDGGIIRTGEIRSTALANGLSGQPAWSINMTGGAQFGDATVRGRIVVGDPSNPSADGVNSRIHSSNYVAGTSGWIIRNDGYAEFRNLAVNSIKVTALDAPMQNNTYAKLFDYMQDGSLWLSNGAVLQKTDPGAYSAESLFEFTGSGLILRNAVGVTKVAYDPTILYRISARVRAYSVATLNANPGFETNTTGWFAYGTNSITRDTTKFFTGVASVRWDQVGSSNGVYGMGTVVNVKAGYTYTFSARMLPNSTVIRDNLKMNIVWKDAANATISTTFNDMPPPVDVNGTPIPIDGTTWSQFSSTGTAPTGAVTASFEIQAGISGSPVAGIQGWFDDVTITTPPRIKVGLFGFDNNNNIIDWDYVDDATTPTKKHAMPTDYSLLSGYSANQYMMVQNNSEVQIATGSSATTADWITVTGYVRGRGGAGATGVLGTQGEHQDPYSPASLNQSVRYLVPYVEWDVATGSIAQLDQFSIEAYENGAPAKVATTDVNGQKAVSVENIQGSIFDHAIRFYSGEADEIYPGMIGHVMDGDWNDASHIRIAPALINKNSDYGSVFIGVYDRNPNYIYDATFEDGITGWTGMANTTLSQETTVGREDTNSLKILATGTISNPATTELLGKYNVSTLVNQELIGQKVTVTGYAMMGTATGRNVRLVVKFLDEAGAMINGYFIEKAVTNTAWVNFSFISPIVIPDTCYSVEFSFSWFNGATGDIVYVDDVQLEMGTRTDFRTASASKIMLQSDYVKSNGGIIISKSELDLPDNVWGSTNGGRRDTPFYPGVILQSEGGTGGFRYVNYTDSAGNRASTQVTNFSPSGVEEHGIRFYGMNDATYPGRWVLTNATGQFVMSSYANTDEDMTTARNVRVYGHLDVEGAPAWASATLLNGATAVSGAYTPSYVLNNSTTYFRGAVAGWTKGSGTPFMTLPSGLRPAKTIYLSTVSYTTTSDAQATVLVVTTAGNVYVYSSVATKTNVMLDGLSFSTAPDTYTTPPTGDTTAPGTPTGFKITPLSSSTTTGTYRLNWTNPSASDTAGVKVIWRSDRYPTVTIAGSGTKTLTTDGKIITVTGGASAAKQYDHSGLPVNKTIYYRVVSYDTSGNHSTYVSASRYLLASPVTVTANSSDSYRLGYGGMWRNDGDEVYQGDWTGNDNHRGIYLYGTKIYDALNTGGVVRTPTKATIYLKRLSTAHGNNTGVGINLRGHIYQTKPSGDPVGGMTNEGSDGDDIVFLSRGEAATVTIPSSWYNNIVDSTAANRIEGFGVYGSTTSDYAVMYGVSSGSSYGKITLYHKG

Physico‐chemical properties

protein length:	2005 AA
molecular weight:	213323,98620 Da
isoelectric point:	5,04750
aromaticity:	0,10075
hydropathy:	-0,15830

Domains

Domains [InterPro]

DC_2195
ATT
1–43

DC_2195 IPR013783 IPR013783 IPR036116 DC_1278 G3DSA:2.60.120.260 DC_0240 IPR008979 DC_1500

IPR003961
STR
1–40

IPR003961 DC_1267 DC_2279 G3DSA:2.60.120.260 DC_1214 DC_0219

IPR036116
STR
3–102

IPR036116 DC_1241 IPR013783 IPR015406 IPR008979 G3DSA:2.60.120.260 IPR003961

IPR003961
STR
249–335

IPR003961 IPR013783

IPR003961
STR
249–344

IPR003961

IPR003961
STR
251–351

IPR003961

IPR003961
STR
271–341

IPR003961

QNN98311.1

1 2005

Architecture

ATT

STR

RBD

ATT 1-494 | STR 495-1827 | RBD 1828-1996 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2195	ATT	DC_2195	1	43	Novel HMM	DC_2195	N-terminal	Low	Positional only	34 proteins / 34 hits
IPR003961	STR	DC_0003	1	40	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR036116	STR	IPR036116	3	102	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	44	145	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
DC_1267	ATT	DC_1267	48	145	Novel HMM	DC_1267	N-terminal	Low	Positional only	38 proteins / 38 hits
DC_1241	ATT	DC_1241	138	243	Novel HMM	DC_1241	N-terminal	Low	Positional only	68 proteins / 68 hits
IPR013783	STR	IPR013783	146	241	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
DC_2279	ATT	DC_2279	240	494	Novel HMM	DC_2279	N-terminal	Low	Positional only	26 proteins / 26 hits
IPR036116	STR	IPR036116	245	358	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	249	349	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	249	335	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	249	344	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	251	351	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR003961	STR	DC_0003	271	341	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
DC_1278	STR	DC_1278	422	830	Novel HMM	DC_1278	Central	Low	Positional only	66 proteins / 66 hits
IPR015406	RBD	DC_0135	457	533	InterPro cluster	Tip attachment protein J, central straight fiber domain	C-terminal	High	Text match	1265 proteins / 1266 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	548	703	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_1214	STR	DC_1214	772	1067	Novel HMM	DC_1214	Central	Low	Positional only	45 proteins / 45 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	898	1061	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	902	1063	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
DC_0240	STR	DC_0240	1063	1283	Novel HMM	DC_0240	Central	Low	Positional only	34 proteins / 34 hits
DC_0219	STR	DC_0219	1250	1735	Novel HMM	DC_0219	Central	Low	Positional only	25 proteins / 25 hits
IPR008979	STR	IPR008979	1284	1425	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1285	1443	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_1500	RBD	DC_1500	1638	1996	Novel HMM	DC_1500	C-terminal	Low	Positional only	35 proteins / 35 hits
IPR003961	STR	DC_0003	1716	1817	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR013783	STR	IPR013783	1716	1827	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QNN98311.1

1 2005

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	248	248	0,6821
Central domain	249	545	298	0,4570
C-terminal	546	2005	1459	0,2756

Note: Constraints were applied during segmentation.
Fixed 7 C-terminal predictions appearing before Central domain|Sequence started with non-N-terminal domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-248

Central
249-545

C-terminal
546-2005

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptomyces phage LilMartin [NCBI]	2767566	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QNN98311.1 [NCBI]

Genbank nucleotide accession

MT684590 [NCBI]

CDS location

range 43837 -> 49854
strand +

CDS

ATGAGAATTCTTCTAAGAGACCTGACACCAGGCACAGACTACAACATTCAGCTACGTGCGAATGATGGAACAAACGTCTCCGACTGGAGTCGCATCTTTCCGCTTACCACAATTCAGGACACGCTAGCTCCAGCAGCCCCAACGGGGCTTACTTGGGTTGTCAACAGAAGCGCATTCTCTGCTAAGTGGAATGCTGTCACTCAGAATGAAGATGCCAGTCCATTGGAAGACTTTTCTCACTATCTTGTGAAGATTGCCATTCCGGGCGGCTCATATGTCACCATCAAGACTACCAATACATTCTACGATTTCCCATTCGAAACAAATAAGGCTCAGTTCGGAACTCCACAAGCTTCTCTAGAAGCTACTGTTTATGCTGTAGACCTTACCGGAAATGTGTCAGTAGCGTCCACAACTCTTACTGCTACAAACCCACCACCACCTGACCCAACTGGAGTAGTTGCGGCCGGTATTGTGGGTGGCGTTAGCATGCGTTGGGACGTGCAGGTAATTGATGACCTAGCGGCCTATGACGTATACATGAGTACGTCAGGCTCAGGATTCACTCCAAGCAATGCAAATAGGATTTATAGTGGCACAGGAAACACCGTCGTATATGACTCTTCATCTCTCGGTGTCGTCCACTACTTCAAGATTCGCTCACGTGACGTATTCGATAGCATTTCAAACTACGTCACTGTTTCAGCGACTCCTATTTCCCCAACCGACGTAGACACAACTGCGCCCGGCGTTCCAACAGGTCTCGCTGCAACTATGGCAGTAGATACCAATGACTCTGCTTTTGCTGTAGCTACAGTTTCATGGACAGCTCCATCAGACACCGACCTTGCCGGGTATGTTGTCCGATACAAGCAGAATGCAGACACTGGATATGACTACGTGAATGTCCCTGTCGGAACAACATCAATTATTATCGGTGGTCTCACCGTAGGTGTTCAGTACAATTTTGGTGTACAGGCTTATGACCGTAGCACAAACAGGAGCGCTTACTCTACGAATGTAAATGCGACGGCAGCCAATACCGCCCCGTCAACTCCTGCCGCTCCAACTGCTGTCGCAGATGTTATGAGTATTCAGGTAAGTCACTCATTGCAGAAGGCAACCTCTGGACGCCTTGAAGCAGACGTAAGCTATCTCGAAGTTCACCTGGGAACCACCTCTACATTCACCGCAAGCGACTCTACAATGATTGGGCAATTGCAGGTCGAGCCTGGTAGCACCTTCGTTTCTGAAGTTTTCAATACGCCTGCTCAAGACTCTGCTTTGGCTCGTTGGGTTCGAGTTATTGCTGTTGACCGAGGTGGACTGAAGTCAGCATCTTCTGCTGTTGCATCAGTCACTGTCGGTCTAATCAGCAATGCCTACATCGCCAATGCAACCATTACCTCAGCCAAGATTAGCAATCTAGACGCCAACAAGATTACGGCTGGTACAGGTATTATCAATGCTCTGCTTATCAAGAACTCATTGACAGTAGACACTGGCGGTACTATCAAGAGCACCAACTACGTAGCTGGCACGACCGGATACCAGCTATCCAATAACACCCTTGAAATCAATGGTGGAACAATTCGTGCCGCAGCTCTATTGCTACAGGATGCTCCAAACATCATTCTTCCTCAGTACGCAGACTTTGAATTCCAGTCAACCTGGTACACAGGAAAGCAAGTCACCTTCAATGATGGAGGAACAACGTCATGGACAATTGCTACTGCCCCTGAATTGACTCCTAAGTTCGGCACTCAATGTCTTAAGCACACCTGGACTGGTGGAGGAACATTCTCCAGAGTTTATCAGGGTTCAAGCTACACAGACTACAATGTCGTTGTAGAACCAAACACTGATTATATCGCTTCTGTATGGGTATTCAATCCATCAGGTTCTGGTGACAAGACAGTCGGATTCGGTGTCAAGATGGGAGACGGTGTCACTTATCCACAGCCTGGTGGAACTCCAATTGTTGTCGCTAATGGAACATGGACCAGAATTTCTGGAACATTCAATACTGGGGCAAACAGCACTCTCATGACTTACATGAGTCTGTACAATACTGGCTCTGTGTATTTCGATGGTATTCAGATTGAGCGAAAGCTAACAAGCTCAACTGTTGCTTCTCCATGGCGTGCGCCAAGTACCACCTCAATTGATGGTGGAATTATTCGTACTGGTGAAATTCGTTCCACTGCTCTGGCCAATGGTCTTTCTGGTCAGCCAGCATGGTCAATCAATATGACTGGTGGAGCACAGTTTGGTGACGCTACTGTCCGAGGACGAATTGTTGTTGGTGACCCAAGCAATCCATCAGCCGATGGTGTTAACTCTCGTATCCATTCATCAAACTATGTGGCCGGTACGAGTGGTTGGATTATCCGCAATGACGGATACGCTGAATTCCGTAACCTTGCAGTCAACTCAATCAAGGTAACAGCCCTTGACGCTCCAATGCAGAACAATACCTACGCAAAGCTATTTGACTACATGCAGGACGGTAGCCTATGGCTATCAAATGGTGCAGTTTTGCAGAAGACCGACCCTGGAGCTTATTCCGCTGAATCACTATTTGAGTTCACTGGCTCTGGTCTGATTCTGCGTAATGCTGTCGGTGTCACCAAGGTTGCCTACGACCCAACGATTCTCTACCGAATCTCTGCTCGTGTCCGTGCGTACTCCGTAGCAACCCTCAACGCCAATCCAGGCTTTGAAACAAACACGACTGGGTGGTTTGCCTATGGTACAAACAGCATTACGCGAGACACCACGAAGTTCTTCACAGGGGTCGCATCTGTTCGATGGGACCAGGTGGGCTCATCAAACGGTGTCTACGGAATGGGAACAGTTGTCAACGTAAAGGCTGGATACACTTACACATTCTCAGCTAGAATGCTTCCAAACAGCACAGTCATCAGAGACAATCTCAAGATGAACATTGTCTGGAAGGACGCTGCGAATGCAACAATTAGCACGACTTTCAATGACATGCCACCTCCAGTCGATGTAAACGGAACTCCAATTCCAATTGATGGAACGACATGGTCACAGTTCTCATCCACGGGAACTGCTCCAACAGGTGCAGTGACTGCTAGCTTTGAAATCCAGGCCGGTATCTCAGGAAGTCCGGTAGCTGGAATTCAGGGATGGTTTGATGATGTAACTATTACCACTCCTCCACGCATCAAGGTAGGTCTGTTCGGATTCGACAACAACAATAACATCATTGACTGGGATTATGTTGACGATGCGACAACGCCAACCAAGAAGCATGCCATGCCAACCGATTACAGCCTGCTTTCTGGATATTCTGCAAATCAGTATATGATGGTTCAGAATAATTCAGAAGTACAAATTGCGACCGGTAGCTCAGCAACCACTGCTGACTGGATTACTGTAACTGGATATGTTCGTGGTCGAGGTGGAGCCGGTGCAACAGGTGTTCTCGGTACTCAGGGAGAGCATCAGGACCCATATAGCCCAGCATCCCTCAACCAGTCCGTTCGTTACCTTGTTCCTTATGTGGAATGGGATGTTGCAACAGGCTCAATTGCTCAGCTTGACCAGTTCTCCATTGAAGCATATGAAAATGGTGCCCCTGCAAAGGTCGCTACGACAGATGTCAATGGTCAGAAGGCAGTCTCTGTTGAGAACATTCAGGGTTCAATCTTTGACCACGCCATTAGGTTCTACAGTGGCGAGGCTGATGAAATCTATCCTGGAATGATTGGTCATGTAATGGATGGTGACTGGAACGATGCATCTCACATCAGAATAGCACCTGCGCTCATCAACAAGAATTCCGACTATGGCTCTGTGTTCATTGGAGTTTATGACCGTAATCCAAACTACATCTATGATGCTACATTTGAGGATGGTATTACGGGATGGACCGGAATGGCGAATACCACGCTTTCTCAGGAAACGACAGTCGGTAGAGAAGACACAAACTCTCTGAAGATTCTGGCTACAGGAACCATCTCAAATCCAGCAACAACTGAGCTTCTTGGTAAGTACAATGTAAGCACTCTGGTCAATCAGGAACTCATCGGTCAGAAGGTAACGGTTACTGGTTATGCAATGATGGGAACCGCGACCGGCAGGAATGTTCGCCTTGTTGTTAAGTTCCTTGATGAAGCCGGAGCCATGATTAATGGTTACTTTATCGAAAAGGCTGTCACCAATACGGCATGGGTGAACTTCTCATTCATCTCTCCAATTGTCATTCCAGACACCTGCTACTCTGTTGAGTTCTCATTCTCATGGTTCAATGGTGCAACTGGCGACATTGTGTACGTTGATGATGTCCAGCTTGAAATGGGAACAAGAACAGACTTCCGTACCGCATCTGCAAGCAAGATTATGCTTCAGTCCGACTACGTAAAGAGCAATGGTGGAATCATCATTTCAAAGTCCGAGCTTGACCTTCCTGACAATGTCTGGGGTTCAACAAACGGTGGGCGTCGTGACACACCATTCTATCCTGGTGTAATTCTACAGTCTGAAGGTGGAACTGGTGGATTCCGTTACGTAAACTACACAGACTCTGCTGGTAACCGGGCATCAACTCAGGTAACGAACTTCTCTCCATCTGGAGTCGAAGAACACGGAATTCGATTCTATGGAATGAATGACGCAACGTATCCTGGACGATGGGTTCTCACGAACGCTACGGGTCAGTTTGTAATGTCTAGCTATGCAAATACTGATGAGGACATGACGACTGCTCGAAACGTTCGAGTATATGGCCACCTTGATGTTGAAGGCGCACCGGCTTGGGCTTCTGCAACACTTCTTAATGGAGCTACCGCAGTTTCTGGTGCATACACTCCTTCATACGTTTTGAACAATTCAACAACGTATTTTCGTGGCGCGGTAGCTGGTTGGACAAAGGGGTCAGGAACTCCATTTATGACCCTCCCATCTGGCTTGAGACCAGCAAAGACTATTTACCTGTCAACAGTTTCATACACAACTACTTCCGACGCTCAGGCAACGGTTCTTGTTGTTACAACTGCTGGTAACGTATACGTCTATTCATCTGTTGCAACAAAGACAAACGTAATGTTGGACGGTCTTTCATTCTCTACTGCTCCTGATACATATACGACTCCACCAACTGGTGATACGACAGCTCCTGGAACCCCTACCGGATTCAAGATTACACCATTGTCATCAAGCACCACAACTGGTACTTATCGTCTGAACTGGACCAACCCTTCAGCATCAGACACGGCCGGTGTCAAGGTTATCTGGAGAAGCGACAGATATCCTACTGTAACAATTGCAGGAAGCGGTACTAAGACTCTTACTACAGATGGAAAAATCATTACCGTAACAGGTGGTGCAAGCGCTGCAAAGCAGTACGACCACTCAGGTCTACCAGTTAACAAGACCATCTACTACCGAGTTGTTTCATATGACACAAGTGGTAACCACTCAACATATGTTTCAGCAAGCAGGTATCTACTGGCTTCACCAGTCACTGTTACAGCGAACTCTTCAGACTCCTACCGTCTTGGATATGGTGGTATGTGGAGAAACGACGGTGACGAAGTCTATCAGGGTGACTGGACAGGCAATGACAATCACCGAGGAATCTATCTGTATGGAACGAAGATTTATGATGCTCTCAATACGGGCGGCGTTGTAAGAACTCCTACAAAGGCTACTATTTACCTCAAGCGACTAAGCACAGCTCATGGTAACAACACTGGAGTAGGAATTAATCTTCGAGGTCATATCTATCAGACTAAGCCTTCTGGTGACCCTGTTGGAGGTATGACTAATGAAGGCTCTGATGGAGATGACATTGTGTTCCTTTCAAGAGGAGAGGCAGCGACAGTAACAATTCCATCAAGCTGGTATAACAATATTGTCGATTCAACTGCTGCAAACCGAATTGAAGGATTTGGTGTTTATGGAAGTACTACAAGTGACTACGCAGTAATGTACGGAGTCAGTTCAGGTTCTTCTTACGGAAAGATTACGCTCTACCACAAGGGCTGA

Genome Context

Tertiary structure

PDB ID

4a1d33062bd44104154f1eff828361270c5d98c6ca6f56d45ef4ab6e6a10fd3b

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7134

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence