Protein

View in Explore

Genbank accession

QNM37888.2 [GenBank]

Protein name

tail spike protein

RBP type

Evidence Phold

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,86

Evidence RBPdetect2

Probability 0,78

Protein sequence

MSTITQFPSGNTQYRIEFDYLARTFVVVTLVNSSNPALNRVLEVGRDYRFLNPTMIEMLVDQSGFDIVRIHRQTGTDLVVDFSNGSVLTASDLTNSELQSIHIAEEGRDQTVDLAKEYADAAGISAGNAKDSEDKARQIASSIKSAGLIGYIARRSFKKGFNITAWNEALLWEADGDYYRWEGALPKNVPAGSTPESSGGISAGAWVNVGDGPGAWVNVGDIFEQKVYVVVITGQSNAQGANSGGPNPASPNVKVWDGTTNTWGVVIIRNYLSPKAPLMVMAGITTLLWLLLIVYLINIGIPKFTLSTILLAGVLLTIGSVLALHPFVTPQSKLKRLHWLHLNYSLPVKLRLITSSGRKGRRCTDWYHYGLPCSVSNLGYTIPFRSVDGESYPLFVMGMSGLHTRYQVWQGQLSYCENQNRNCIYVNSMGLKTQYDVSGTGDYTHWLGDSLWEHGYHRIWYALQERGITHRNQLAPFYGRGTGPWDGQPDAIAMFSSLVSIDSATSQFPTNSVAATGSITWGLNCAADGNYTFAGGHTVTTDNTCNYSAAWGRSISLGPGAQYSASFGRENNVTGNHQFAVGRGHTTSSDGETCLGTYSFYVSEQENKVKLQVGVGSSSSVKKNAITAREDGAVEINVSSSHEPAQKVKWYSMQNLILRYVSKFVVLMV

Physico‐chemical properties

protein length:	669 AA
molecular weight:	73122,45890 Da
isoelectric point:	7,23733
aromaticity:	0,10314
hydropathy:	-0,15770

Domains

Domains [InterPro]

IPR005604
ATT
10–113

IPR005604 G3DSA:2.10.10.80 DC_0394

IPR005604
ATT
10–105

IPR005604 DC_1280 IPR011049

IPR040775
RBD
155–211

IPR040775 IPR011049

QNM37888.2

1 669

Architecture

ATT

RBD

STR

RBD

ATT 10-213 | RBD 451-499 | STR 500-634 | RBD 635-659 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR005604	ATT	DC_0240	10	113	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
IPR005604	ATT	DC_0240	10	105	InterPro cluster	Bacteriophage T7 tail fibre protein-like, N-terminal domain	Central	Medium	Text match	1326 proteins / 1328 hits
DC_1280	ATT	DC_1280	105	210	Novel HMM	DC_1280	N-terminal	Low	Positional only	90 proteins / 90 hits
G3DSA:2.10.10.80	ATT	G3DSA:2.10.10.80	150	213	Merged direct domain	G3DSA:2.10.10.80	N-terminal	Low	Positional only	383 proteins / 383 hits
IPR040775	RBD	DC_0821	155	211	InterPro cluster	Tail spike TSP1/Gp66, N-terminal domain	Central	High	Text match	1281 proteins / 1285 hits
DC_0394	RBD	DC_0394	451	659	Novel HMM	DC_0394	C-terminal	Low	Positional only	49 proteins / 49 hits
IPR011049	STR	IPR011049	500	608	Merged direct domain	Serralysin-like metalloprotease, C-terminal	Central	Low	Positional only	81 proteins / 81 hits
IPR011049	STR	IPR011049	512	634	Merged direct domain	Serralysin-like metalloprotease, C-terminal	Central	Low	Positional only	81 proteins / 81 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QNM37888.2

1 669

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	346	346	0,8901
Central domain	347	554	209	0,8086
C-terminal	555	669	114	0,8614

Note: Constraints were applied during segmentation.
Fixed 28 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-346

Central
347-554

C-terminal
555-669

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Citrobacter phage NS1 [NCBI]	2766968	Uroviricota > Caudoviricetes > Autographivirales > Studiervirinae > Kayfunavirus
Host	Citrobacter freundii [NCBI]	546	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

QNM37888.2 [NCBI]

Genbank nucleotide accession

MN715150.2 [NCBI]

CDS location

range 32955 -> 34964
strand +

CDS

ATGTCCACGATTACACAATTCCCTTCAGGAAACACTCAGTACAGGATTGAGTTCGACTACCTAGCCAGAACGTTTGTTGTTGTTACGCTGGTGAATAGCTCTAACCCTGCCCTGAACCGTGTACTGGAAGTTGGTCGAGATTACCGATTCCTTAATCCAACGATGATTGAGATGTTGGTTGACCAATCAGGTTTCGACATCGTTCGTATTCACCGTCAGACTGGAACTGACTTAGTGGTAGACTTCAGTAATGGCTCAGTGTTGACAGCTAGTGACCTGACCAATTCAGAGCTTCAGTCTATCCATATTGCAGAAGAAGGTCGAGACCAAACTGTTGACTTAGCGAAGGAATATGCCGATGCTGCTGGTATCTCTGCTGGCAACGCTAAGGATAGCGAGGACAAAGCGCGACAAATTGCTTCGAGTATCAAGTCAGCCGGTCTAATTGGCTATATCGCCCGTCGCTCCTTCAAGAAAGGCTTCAACATTACAGCATGGAACGAGGCCCTGCTATGGGAAGCGGATGGTGATTATTACCGCTGGGAAGGTGCGCTTCCAAAGAACGTTCCTGCTGGTTCAACTCCTGAATCATCTGGTGGTATTAGTGCCGGGGCTTGGGTTAATGTTGGTGATGGTCCGGGTGCTTGGGTTAATGTTGGTGATATCTTTGAGCAGAAGGTTTACGTAGTAGTAATCACTGGGCAGTCAAATGCTCAGGGTGCTAACTCCGGTGGACCTAATCCAGCGTCACCTAATGTTAAAGTATGGGATGGTACTACTAATACTTGGGGAGTAGTGATTATACGCAATTACCTTTCTCCCAAAGCACCCCTAATGGTAATGGCGGGAATAACAACATTGCTCTGGCTTTTGCTCATCGTCTACTTGATCAACATAGGAATTCCAAAGTTTACGTTATCTACGATCCTGTTGGCGGGCGTCCTATTAACGATTGGGTCGGTTCTGGCACTGCATCCATTCGTTACGCCGCAATCAAAGCTAAAGAGGCTGCATTGGCTACACCTGAATTACTCACTGCCGGTAAAACTAAGATTGATTACCTCATCTGGGCGCAAGGGAAGGAGATGCACTGACTGGTACCATTACGGTTTACCGTGCTCAGTTTCAAACCTTGGATACACAATTCCGTTCCGAAGCGTGGATGGAGAATCATACCCCCTGTTTGTGATGGGTATGTCTGGTCTTCATACTCGTTATCAGGTATGGCAAGGACAATTGAGTTACTGTGAGAACCAGAACCGTAACTGTATTTACGTTAACTCTATGGGCCTAAAGACTCAGTATGACGTATCAGGTACAGGTGATTATACACACTGGTTGGGTGATTCACTGTGGGAGCATGGTTATCATCGTATCTGGTATGCACTCCAAGAACGAGGCATTACTCACCGTAACCAACTGGCTCCGTTCTATGGACGTGGTACTGGTCCGTGGGATGGGCAGCCTGATGCAATTGCTATGTTTAGTTCTCTGGTAAGTATTGACTCAGCAACATCTCAGTTTCCAACCAATAGTGTAGCTGCTACTGGTTCCATTACTTGGGGACTGAACTGTGCAGCAGATGGTAACTACACCTTCGCAGGCGGTCATACTGTAACAACGGATAATACATGTAACTACTCTGCTGCATGGGGTAGGAGCATCTCACTGGGACCCGGTGCTCAGTATAGTGCAAGTTTCGGTAGGGAGAACAACGTAACTGGTAATCACCAGTTTGCAGTTGGTCGAGGCCACACTACCAGCAGTGACGGTGAAACCTGTCTAGGTACTTACTCGTTCTATGTGTCAGAGCAAGAAAACAAGGTGAAGCTACAGGTTGGCGTTGGTTCCTCCTCTAGTGTTAAGAAGAATGCCATCACAGCAAGGGAAGATGGTGCGGTAGAGATTAATGTATCATCTAGCCATGAGCCAGCACAAAAGGTGAAATGGTATTCCATGCAGAATCTAATACTTCGTTACGTATCAAAGTTCGTGGTACTGATGGTGTAG

Genome Context

Tertiary structure

PDB ID

dd85cdc0841beeedf5672c512f92760c863ae8becbc5d22e1f740453bda231c7

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6405

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence