Protein

View in Explore

Genbank accession

QFP92956.1 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,90

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MSTITQFPSGNTQYRIEFDYLARTFIVVTLVNSSNPTLNRVLEVGRDYRFLNPTMIEMLVDQSGFDIVRIHRQTGTDLVVDFRNGSVLTASDLTNSELQAIHIAEEGRDQTVDLAKEYADAASSSAGNAKDSEDEARRIAESIREAGLIGYITRRSFEKGYNVTTWSEVLLWEEDGDYYRWDGTLPKNVPAGSTPETSGGIGLGAWVSVGDAALRSQISNPEGAILYPELHRARWLDEKDVRGWGAKGDGITDDTAALTSALNDIPVGQKINGNGKTYKVTSLPDISRFINTRFVYERIPGQPLYYASEEFVQGELFKITDTPYYNAWPQDKAFVYDNVIYAPYMGSDRHGVSRLHVSWVKSGDDGQTWSTPEWLTDLHPDYPTVNYHCMSMGVCRNRLFAMIETRTLAKNALTNCALWDRPMSRSLHLTGGITKAANQQYATIHVPDHGLFVGDFVNFSNSAVTGVSGDMTVAAVIDKDNFTVLTPNQQTSDLNNAGKNWHMGTSFHKSPWRKTDLGLIPRVTEVHSFATIDNNGFVMGYHQGDVAPREVGLFYFPDAFNSPSSYVRRQIPSEYEPDASEPCIKYYDGVLYLITRGTRGDRLGSSLHRSRDIGQTWESLRFPHNVHHTTLPFAKVGDDLIMFGSERAENEWEAGAPDDRYKASYPRTFYARLNVNNWNADDIEWVNITDQIYQGGIVNSGVGVGSVVVKDNYIYYMFGGEDHFNPWTYGDNSAKDPFKADGHPSDLYCYKMKIGPSNHVSRDFRYGAVPNRAVPVFFDTNGIRTVPAPMEFTGDLGLGHVTLRASTSSNIRSEVLMEGEYGFIGKSIPTDNPAGQRTIFCGGEGTSSTTGAQITLYGANNTDSKRIVYNGDEHLFQTADVKPYHDNVIALGGPSNRFTTAYLGSNPIVTSNGEKKTEPVVFDDAFLDAWGDVHYIMYQWLDAVQLKGNDARIHFGVIAQQIRDVFIAHGLMDENSTNCRYAVLCYDKYPRMTDTVFSHNEIIEHTDEEGNVTTTEEPVFTEVVIHEEGEEWGVRPDGIFFAEAAYQRRKLERIEARLSALEQK

Physico‐chemical properties

protein length:	1064 AA
molecular weight:	118998,81830 Da
isoelectric point:	5,12770
aromaticity:	0,10996
hydropathy:	-0,44662

Domains

Domains [InterPro]

DC_0041
STR
1–134

DC_0041 G3DSA:2.10.10.80 G3DSA:3.30.750.60 IPR024428 IPR024430 IPR030392

IPR005604
ATT
10–114

IPR005604 IPR040775 IPR036278 SSF69349 cd10144

DC_1280
ATT
95–287

DC_1280 IPR001724 IPR001724 IPR024427 IPR001724 IPR001724 IPR001724 IPR044914 IPR030392 G3DSA:3.30.2460.10 G3DSA:1.20.5.100

IPR024429
ENZ
246–312

IPR024429 G3DSA:2.120.10.10 IPR001724 IPR001724 G3DSA:1.20.5.1240 Coil

IPR023366
STR
424–510

IPR023366

IPR001724
Unmapped
498–521

IPR001724

QFP92956.1

1 1064

Architecture

ATT

STR

CHP

RBD

CHP

RBD

ATT 1-312 | STR 313-910 | CHP 911-923 | RBD 924-975 | CHP 976-1034 | RBD 1035-1064

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0041	STR	DC_0041	1	134	Novel HMM	DC_0041	Central	Low	Positional only	179 proteins / 179 hits
IPR005604	ATT	DC_0240	10	114	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
DC_1280	ATT	DC_1280	95	287	Novel HMM	DC_1280	N-terminal	Low	Positional only	90 proteins / 90 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	150	220	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR040775	RBD	DC_0821	156	211	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
G3DSA:3.30.750.60	ATT	G3DSA:3.30.750.60	241	312	Merged direct domain	G3DSA:3.30.750.60	N-terminal	Low	Positional only	2 proteins / 2 hits
IPR036278	STR	IPR036278	245	760	Merged direct domain	Sialidase superfamily	Central	Low	Positional only	56 proteins / 56 hits
IPR024429	ENZ	DC_0802	246	312	InterPro cluster	Endosialidase, N-terminal extension domain	N-terminal	High	Text match	84 proteins / 84 hits
IPR024428	ENZ	DC_0114	313	754	InterPro cluster	Endosialidase, beta-propeller domain	Central	High	Text match	92 proteins / 92 hits
IPR001724	Unmapped	-	314	338	InterPro	Glycosyl hydrolase 58	-	-	-	-
G3DSA:2.120.10.10	STR	G3DSA:2.120.10.10	314	754	Merged direct domain	G3DSA:2.120.10.10	Central	Low	Positional only	42 proteins / 42 hits
IPR001724	Unmapped	-	379	407	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR024427	ENZ	DC_0382	424	506	InterPro cluster	Endosialidase, beta-barrel domain	Central	High	Text match	86 proteins / 86 hits
IPR023366	STR	IPR023366	424	510	Merged direct domain	ATP synthase subunit alpha, N-terminal domain-like superfamily	Central	Low	Positional only	44 proteins / 44 hits
IPR001724	Unmapped	-	498	521	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR001724	Unmapped	-	568	594	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR001724	Unmapped	-	646	672	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR001724	Unmapped	-	702	726	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR024430	ENZ	DC_0521	757	910	InterPro cluster	Endosialidase, C-terminal domain	C-terminal	High	Text match	95 proteins / 95 hits
IPR044914	RBD	IPR044914	757	910	Merged direct domain	Endosialidase, C-terminal domain superfamily	C-terminal	Low	Positional only	39 proteins / 39 hits
SSF69349	STR	SSF69349	761	910	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR001724	Unmapped	-	803	829	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR001724	Unmapped	-	835	862	InterPro	Glycosyl hydrolase 58	-	-	-	-
IPR030392	CHP	DC_0088	911	1064	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
cd10144	CHP	DC_0088	911	1050	InterPro cluster	cd10144	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	915	971	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
G3DSA:1.20.5.1240	RBD	G3DSA:1.20.5.1240	924	975	Merged direct domain	G3DSA:1.20.5.1240	C-terminal	Low	Positional only	1 proteins / 1 hits
G3DSA:3.30.2460.10	Unmapped	-	976	1034	Gene3D	None	-	-	-	-
G3DSA:1.20.5.100	RBD	G3DSA:1.20.5.100	1035	1064	Merged direct domain	G3DSA:1.20.5.100	C-terminal	Low	Positional only	8 proteins / 8 hits
Coil	Unmapped	-	1044	1064	Coils	Coil	-	-	-	-

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QFP92956.1

1 1064

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	255	255	0,9969
Central domain	256	577	323	0,8657
C-terminal	578	1064	486	0,5961

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-255

Central
256-577

C-terminal
578-1064

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Escherichia phage vB_EcoP_PR_Kaz2018 [NCBI]	2651149	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Escherichia coli [NCBI]	562	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QFP92956.1 [NCBI]

Genbank nucleotide accession

MN510331.1 [NCBI]

CDS location

range 32666 -> 35860
strand +

CDS

ATGTCCACGATTACACAATTCCCTTCAGGAAACACTCAGTACAGGATTGAGTTCGACTACCTCGCCAGAACGTTTATTGTTGTTACGCTGGTGAATAGCTCTAACCCTACCCTGAACCGTGTACTGGAAGTTGGTCGAGATTACCGATTCCTTAATCCAACGATGATTGAGATGTTGGTTGACCAATCAGGTTTCGACATCGTTCGTATTCACCGTCAGACTGGAACTGACTTAGTGGTAGACTTCAGGAATGGCTCAGTGTTGACAGCTAGTGACCTGACCAATTCAGAGCTTCAGGCTATCCATATTGCAGAAGAAGGTCGAGACCAAACGGTTGACTTAGCGAAGGAATATGCCGATGCTGCTAGTAGCTCTGCTGGCAACGCTAAGGATAGCGAGGACGAAGCACGACGAATCGCTGAGAGTATCAGGGAAGCTGGTCTAATTGGCTATATTACCCGTCGCTCCTTCGAGAAAGGCTACAACGTTACAACATGGAGCGAGGTCCTGCTATGGGAAGAGGATGGTGATTATTACCGCTGGGATGGTACGCTTCCAAAGAACGTTCCTGCTGGTTCAACTCCTGAAACTTCCGGTGGGATTGGATTAGGTGCGTGGGTTAGTGTTGGTGATGCTGCTTTAAGAAGTCAGATTTCAAATCCTGAAGGGGCAATACTCTACCCTGAATTACATAGAGCACGCTGGCTTGATGAAAAAGATGTTCGTGGTTGGGGTGCTAAAGGTGATGGTATCACTGATGATACAGCAGCGTTAACGAGCGCATTAAACGACATACCGGTTGGACAAAAGATTAATGGCAATGGGAAGACATATAAGGTCACATCCCTGCCTGACATTAGTCGCTTCATCAACACTCGTTTCGTTTATGAGCGCATTCCCGGACAACCTCTTTATTATGCCTCTGAGGAATTTGTTCAGGGTGAGTTGTTCAAAATAACGGACACCCCTTATTACAATGCGTGGCCTCAGGATAAAGCGTTCGTATATGATAATGTGATATATGCACCTTACATGGGTAGCGATCGTCATGGTGTTAGTCGTCTGCATGTATCATGGGTTAAGTCTGGTGATGATGGGCAAACATGGTCTACTCCAGAGTGGTTAACTGATCTGCATCCAGATTACCCTACAGTGAACTATCACTGTATGAGTATGGGTGTATGTCGCAACCGTCTGTTTGCCATGATTGAAACACGTACTTTAGCCAAGAACGCATTAACCAATTGTGCATTGTGGGATCGCCCCATGTCTCGTAGCCTGCATCTTACTGGTGGTATCACTAAAGCTGCAAATCAGCAATATGCAACAATACATGTACCAGACCACGGACTATTCGTGGGTGATTTTGTTAACTTCTCTAATTCTGCGGTAACAGGTGTCTCCGGTGATATGACTGTTGCAGCCGTAATAGATAAGGACAACTTCACGGTTCTTACACCCAACCAGCAGACTTCAGATTTGAATAACGCTGGAAAGAATTGGCACATGGGTACTTCTTTCCATAAGTCTCCATGGCGTAAGACAGACCTTGGTCTAATCCCTCGTGTCACAGAGGTGCATAGCTTTGCTACTATTGATAACAATGGCTTTGTTATGGGTTATCATCAAGGCGATGTAGCTCCACGCGAAGTTGGGCTTTTCTATTTCCCTGACGCTTTCAATAGCCCATCTAGTTATGTTCGTCGTCAGATACCATCTGAGTATGAACCAGATGCGTCAGAGCCATGCATCAAGTACTATGACGGTGTATTATACCTTATCACTCGTGGCACTCGTGGGGATAGGCTAGGTAGCTCTTTGCATCGTAGTAGAGACATAGGTCAGACTTGGGAGTCACTGAGATTTCCACATAATGTTCATCATACTACATTACCTTTTGCTAAAGTAGGGGATGACCTTATTATGTTTGGTTCAGAACGTGCAGAAAATGAATGGGAAGCAGGTGCACCAGATGATCGTTACAAGGCATCTTATCCTCGCACCTTCTATGCACGCTTGAATGTAAACAATTGGAATGCAGATGATATTGAATGGGTTAACATCACTGACCAGATTTATCAGGGCGGAATAGTTAACTCAGGTGTAGGTGTTGGTTCGGTAGTTGTGAAGGATAATTACATCTACTACATGTTTGGTGGAGAGGACCATTTTAACCCATGGACCTATGGAGATAACTCAGCGAAGGACCCATTCAAAGCGGATGGTCATCCCTCAGATTTGTATTGCTACAAAATGAAGATTGGCCCAAGCAATCATGTTTCCCGTGATTTCAGGTATGGTGCTGTACCTAACAGAGCTGTTCCCGTGTTTTTTGATACGAATGGGATTCGCACTGTTCCTGCGCCAATGGAATTTACAGGGGATTTGGGTTTAGGCCATGTGACCCTTAGAGCCAGCACCAGTAGTAACATTCGCTCTGAAGTTTTAATGGAAGGTGAATATGGGTTTATCGGGAAGTCTATACCGACTGATAACCCGGCAGGGCAGCGCACCATATTTTGCGGAGGTGAAGGCACCAGTTCAACGACTGGCGCACAGATTACGCTTTATGGTGCAAATAACACCGACTCAAAGCGAATAGTTTACAATGGTGATGAGCATCTGTTCCAGACTGCTGACGTTAAGCCTTATCACGATAACGTCATTGCGCTTGGTGGACCAAGTAACCGTTTCACAACTGCATATCTCGGAAGCAACCCTATTGTTACTTCTAATGGGGAGAAGAAAACAGAGCCGGTAGTTTTTGATGATGCTTTCCTCGATGCCTGGGGTGACGTTCACTACATCATGTATCAATGGTTAGATGCTGTTCAACTGAAAGGCAATGATGCTCGTATTCACTTCGGGGTTATTGCTCAGCAAATTCGTGATGTATTCATTGCACACGGTCTGATGGATGAAAACAGTACGAATTGTCGTTATGCCGTTCTGTGTTATGACAAGTATCCACGGATGACCGATACGGTATTTTCGCACAATGAAATCATTGAACACACTGACGAGGAGGGTAATGTCACTACTACGGAAGAGCCTGTATTCACTGAGGTGGTTATCCATGAAGAGGGTGAGGAGTGGGGTGTTCGGCCTGACGGAATTTTCTTTGCTGAAGCCGCTTATCAGAGAAGAAAACTGGAAAGAATCGAAGCCAGACTTTCTGCTCTTGAACAGAAGTAA

Genome Context

Tertiary structure

PDB ID

537ec7d3984bfe923330656714f49d55a20b2407eb6fc59dcda0f4d3f07fedc5

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2881

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Complete Genome Sequence of T7-Like Bacteriophage	Alexyuk,M., Bogoyavlenskiy,A., Alexyuk,P., Moldakhanov,Y., Turmagambetova,A., Anarkulova,E. and Berezin,V.	2019-12-05	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature