Protein

View in Explore

Genbank accession

NP_690646.1 [GenBank]

Protein name

pre-neck appendage protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,94

Protein sequence

MQKPELRRFEKLGEMMVQVYERYLPTAFDESMTLLEKMNKIIEYLNQIGRLTNDVVEEWNKVMEWILNDGLEDYVKETLEKWYEEGKFADLVIQVIDELKQFGVSVKTYGAVGDGKTDDIEAFEKAIASGYPVYIPNGKFAVSRSIKIPSNTVITGAGIDNAVVTFLDSVPLGDSLMINDNYATGNENIYLSDFTLDGNCQRFGVNAIGSGGSRDSNLSIHASKNVHINRIKSINATLHGIDITCGGLDYPYMGDGTTAPYPSRDIYISDCEAPSLGDDGITTNNSEYITISNCNCHDPRLLNNCNGIEIDDGSRHVQLSNNISKNCFGGVEVKAHGNVPAAYNVSINGHMSIGDVRSYNFRHIGHHSATDPESMSAKNIICNNLMSVNPNNKRGFQNNAAPRVLAVSAYYGVVVNGLSAYTTEPANLTETAISVQFRARNVSLSGIVMTGFSMAENAIYVIGGSRGGDSVNISNVTLNNSGRNGVAIGSGIDNVSISNVSAIGDGIANPIAIVKTVNSNPQISGVNGIGYPTVCQVAGVAYNDGLTLFNGAFRGATSSSEFIHSEGFVLGSTSKSGATASKSGVVSSSNSIAKAERSLIAGSASCTTSGSYNTILSSLNCETTDTGNLISTSSASKATGNRNIILASYGVLASGSYKVNGGYGGEGTPSASNIKLGNSLNGHIKAKNTVTGANTWSDYGEYFESVDGQAIETGYLVTLEGSKIRKAQEGEKIIGAISETAGIILGESTWNWQGQYLKNEFGGLIYETVEIDEGVFEKMPKINPSYNPKLEYLSRGERPEWNIVGLIGQIMVRIDDTVKIGSGISAKDGIATDGDTGIVMQITTPYESSKGYGVAKVLLK

Physico‐chemical properties

protein length:	860 AA
molecular weight:	91740,44940 Da
isoelectric point:	5,09751
aromaticity:	0,07442
hydropathy:	-0,19209

Domains

Domains [InterPro]

IPR012334
STR
83–550

IPR012334 G3DSA:2.160.10.20 G3DSA:2.40.300.10

IPR011050
STR
102–463

IPR011050 IPR006626 DC_1692 IPR021865

IPR024535
ENZ
104–331

IPR024535 IPR006626 IPR006626 G3DSA:4.10.80.40

IPR006626
Unmapped
186–212

IPR006626 IPR006626 IPR006626 IPR006626 IPR006626

NP_690646.1

1 860

Architecture

STR

RBD

STR

RBD

STR 83-550 | RBD 551-574 | STR 575-630 | RBD 631-860

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR012334	STR	IPR012334	83	550	Merged direct domain	Pectin lyase fold	Central	Low	Positional only	867 proteins / 867 hits
IPR011050	STR	IPR011050	102	463	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
IPR024535	ENZ	DC_0410	104	331	InterPro cluster	Rhamnogalacturonase A/B/Epimerase-like, pectate lyase domain	Central	High	Text match	420 proteins / 426 hits
IPR006626	Unmapped	-	186	212	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	223	245	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	263	285	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	286	312	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	314	335	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	376	417	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	439	463	InterPro	Parallel beta-helix repeat	-	-	-	-
IPR006626	Unmapped	-	468	490	InterPro	Parallel beta-helix repeat	-	-	-	-
G3DSA:2.160.10.20	RBD	G3DSA:2.160.10.20	551	691	Merged direct domain	G3DSA:2.160.10.20	C-terminal	Low	Positional only	6 proteins / 6 hits
DC_1692	STR	DC_1692	575	630	Novel HMM	DC_1692	Central	Low	Positional only	23 proteins / 23 hits
IPR021865	CHP	DC_0580	643	860	InterPro cluster	Peptidase G2, IMC autoproteolytic cleavage domain	C-terminal	High	Text match	84 proteins / 84 hits
G3DSA:2.40.300.10	RBD	G3DSA:2.40.300.10	698	858	Merged direct domain	G3DSA:2.40.300.10	C-terminal	Low	Positional only	19 proteins / 19 hits
G3DSA:4.10.80.40	RBD	G3DSA:4.10.80.40	751	790	Merged direct domain	G3DSA:4.10.80.40	C-terminal	Low	Positional only	3 proteins / 3 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

NP_690646.1

1 860

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	116	116	0,9871
Central domain	117	653	538	0,9802
C-terminal	654	860	206	0,8990

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-116

Central
117-653

C-terminal
654-860

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage B103 [NCBI]	2994042	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus subtilis [NCBI]	1423	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

NP_690646.1 [NCBI]

Genbank nucleotide accession

NC_004165 [NCBI]

CDS location

range 11046 -> 13628
strand +

CDS

ATGCAGAAACCTGAGTTAAGACGTTTTGAAAAGTTGGGAGAAATGATGGTGCAAGTTTACGAACGCTATCTCCCTACTGCTTTTGATGAAAGTATGACCTTGTTAGAGAAAATGAATAAAATCATTGAGTACCTCAATCAGATTGGGCGCTTAACCAATGATGTTGTTGAGGAATGGAACAAGGTTATGGAATGGATTCTCAATGACGGTTTAGAAGACTACGTTAAAGAGACACTTGAGAAATGGTATGAAGAAGGAAAATTTGCCGATCTTGTTATTCAGGTGATAGACGAATTAAAACAGTTTGGCGTTAGTGTTAAAACATATGGTGCTGTGGGTGACGGAAAAACAGATGACATTGAGGCGTTTGAAAAAGCCATTGCTTCTGGATACCCTGTTTACATTCCAAATGGTAAATTCGCCGTATCACGATCAATTAAAATTCCATCAAACACAGTTATTACAGGGGCAGGGATTGACAACGCTGTAGTCACATTTCTTGATAGTGTTCCGTTAGGCGATAGCCTTATGATAAACGATAACTACGCAACTGGTAACGAAAATATCTATCTGTCTGATTTCACCCTTGACGGTAACTGTCAGCGATTCGGTGTAAATGCGATTGGTAGTGGCGGATCACGTGATAGTAACCTGTCAATTCACGCAAGTAAAAACGTGCATATTAATCGAATTAAATCTATTAACGCCACACTTCACGGAATTGACATTACCTGTGGTGGTCTTGATTACCCTTACATGGGTGACGGGACAACTGCACCGTATCCGTCAAGAGATATTTATATCTCAGATTGTGAAGCGCCTTCTTTGGGTGATGACGGTATAACAACAAACAATAGTGAGTATATCACAATCAGCAATTGTAACTGTCATGACCCACGTTTACTTAATAACTGTAACGGCATTGAAATTGATGATGGTTCTAGACACGTTCAACTATCTAATAACATATCTAAGAACTGTTTTGGTGGTGTTGAAGTTAAAGCACACGGAAACGTACCTGCCGCATACAACGTTAGCATCAATGGTCATATGTCCATTGGAGACGTTCGATCATACAATTTCCGTCACATTGGACACCATTCAGCAACAGACCCAGAGTCAATGTCTGCAAAAAACATTATCTGTAACAACTTGATGTCTGTTAACCCTAACAATAAACGTGGATTTCAAAACAATGCCGCACCAAGGGTTTTGGCTGTATCAGCGTATTACGGGGTGGTGGTTAACGGGCTGAGTGCATACACTACTGAACCAGCGAACTTAACAGAAACGGCAATTAGTGTTCAATTTAGAGCGAGAAACGTTAGTCTCTCTGGAATTGTTATGACAGGATTCAGTATGGCAGAAAACGCAATATATGTAATCGGCGGTAGCCGTGGTGGCGACAGCGTTAACATTTCAAACGTTACATTAAACAACTCTGGAAGAAACGGTGTTGCTATTGGTTCAGGTATTGACAACGTTTCTATCTCAAATGTTAGTGCCATCGGTGACGGTATTGCAAATCCAATTGCTATTGTGAAAACAGTTAATAGCAATCCACAAATATCTGGTGTGAATGGTATTGGATACCCTACTGTGTGTCAAGTTGCTGGAGTTGCCTACAATGACGGTCTCACACTCTTTAACGGTGCATTCCGTGGAGCAACGTCATCAAGTGAATTCATTCACAGTGAGGGTTTTGTGTTAGGTTCGACAAGTAAATCAGGTGCAACAGCATCAAAGTCTGGTGTTGTATCGTCTAGTAACTCTATTGCTAAAGCTGAGCGTTCACTAATTGCGGGTAGTGCTAGCTGTACAACGAGTGGTTCATATAACACAATACTTAGCTCATTGAACTGTGAAACAACAGACACTGGTAATCTTATTTCAACATCCTCAGCGTCTAAGGCAACTGGAAACCGAAATATTATTCTTGCAAGTTACGGTGTTCTAGCGTCTGGTTCATACAAAGTAAACGGTGGGTACGGTGGAGAAGGAACACCGAGTGCGTCTAACATTAAATTGGGGAATTCTCTCAACGGTCATATCAAAGCCAAAAACACTGTTACTGGAGCGAACACATGGAGTGACTATGGTGAATACTTTGAAAGTGTTGATGGACAAGCCATTGAAACAGGTTATCTTGTCACCCTTGAAGGCAGTAAGATTCGGAAAGCTCAAGAAGGTGAAAAAATCATTGGTGCTATTTCTGAAACGGCTGGTATTATTCTTGGTGAAAGCACATGGAACTGGCAGGGACAATACCTGAAAAATGAGTTTGGTGGCTTAATCTATGAAACTGTGGAAATAGATGAGGGTGTATTTGAAAAAATGCCTAAAATCAATCCATCTTATAACCCTAAACTAGAATACTTGTCACGTGGTGAGAGACCTGAGTGGAACATTGTTGGCTTGATTGGACAAATTATGGTTCGTATTGATGACACTGTGAAAATTGGTAGTGGAATCTCTGCTAAGGATGGAATCGCAACAGACGGTGACACTGGTATTGTTATGCAAATCACAACACCTTATGAGTCTAGTAAAGGTTATGGTGTAGCAAAAGTGTTACTGAAATAG

Genome Context

Tertiary structure

PDB ID

e2da030749b7a157202b423e5800978f74b58af90210fec1c3ece660e72e403a

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3397

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence