Protein

View in Explore

Genbank accession

YP_007003420.1 [GenBank]

Protein name

tail protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,56

Protein sequence

MPQLKLRYNGRWVTIGGGLSGGDTGEIVDYIDQIKKELQNNLEKISTDLNNTDIYIDGAFRDGIITETEAKKIKAYLNTLNTSKVQLDQRFEEIYKNIYLPAFNKEGLVSANNTYQTAYENLHKTILDAIVDGKATEEESNAVDTAFDVYTRALSLLVSALEVSVDAINNAKNKETLDNSKKYTDDLYVPLDERVVKAESEIKTTKEQISLRVTKEEFTQGLNNNLDSAKQYSDTQKKALETDLSTLRGDLQETDEYINGAFRDGIVYDSEKIQIEGYLNTIKTSKSQYDNRYQSVHDNSYLPETPKLNLESAKTDYDTKYNMLVLAITNAIDDQLADDDETAKVNAAFDAYNQALALLTLSLEVAIDAISKAKAEEARKLAEGYADELKQGLDKDIANVQQSIKETDDYITHAFRDGLVSETEAKRIEGYLLGLAQNHQAIMERYTEIYENPMLAGTAKTDLYQKQTDYATAYDSLVTTINDATSDGQTTAEESNNVQLKFYDYNNRFKELTKAIETAIDFISTSKANKSEENSKDYTDGKVTPIETRLTTAESNITQNAKEISLRVKEETYNQGMQLVDGIDTRLKSAESTIVQHADAISQRVTIENFDTKAKQLQLDADNARKAADAAQQTADAAKSGVDDAVKSISDLTSDNKLSQSEKTEAKREWEAIKAEKITLEKQATDYGITTAKTNYIAAYNSLEAFLTPLIADLSTISDVDGETFRAKFKAYYDTRSTLLQAIASASKKQSDDLDTRLTNLKYVNANILAGSMFGEGDVLPIDSGTVVRVQPNDGDVNSLQVKQYSPSSAVYGFKTTRQTTEFKTGTVYTLSMQVAIGDVTKLDEIYIKSAEGGSQKLPSIPITWSDTAYRTVTLTFTSNISTSRGYIQVATADLSSTRIEYFYIKKLKIEEGGVATPYIPSGADTGTLGSQVAKAESEIKQNAEQIQLRVSKTDFNGKNVVSMINQTADEVLIEASKIKLNGDVNVGGFSNYVQDPDCEKALSLNWTVTSTGSGGFSYAVLPTNDVPPAGEPNFPPPTRYGIKLQVNEKKLYEMKQPKFDVEPGTPLAISCYTYKKLNETAIYSGWFAVNFYNARGSLLQDEFYVPLRGNDDEPLWSLVRAEMKVPATAAKAEVYIRFKPLADEEYPLTYYIGSPKVSKPGTMDVDSIYSYLVYSQRVTVNKTLDFGYRGNIKQQGYLAPYGDIKMQDGVLTSTKSDYKLHIGNGHISAVKYYDIDSDSLNPRMILDAVGLHAFSSGSNKNAMFSTDGNLEMYRDAAIVFKSSPSSMTFNKYGNLTPTTPSSASATASWNVGHVNGGNVIKAFFGSSGGSNNAYGIQLIPGGSGNGFEFVNLDSTNIGMKGPNQIIKFLGRSSTTQFRNRADSDYASITVGGLTNHSYRDSKTGIEKSTMNASDIIKNLIVREYYKGSDLVVKDECGNDLYCELPDSTVLLSPKKQIGLIWDEAADCIRNPDGIDLYKFCTLLLKALQETDERLTAGGL

Physico‐chemical properties

protein length:	1500 AA
molecular weight:	165614,62770 Da
isoelectric point:	4,88960
aromaticity:	0,08533
hydropathy:	-0,48487

Domains

Domains [InterPro]

DC_1272
STR
20–225

DC_1272 DC_1272 Coil

DC_1272
STR
221–387

DC_1272 DC_0015

Coil
Unmapped
607–634

Coil

YP_007003420.1

1 1500

Architecture

STR

STR 20-1050 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1272	STR	DC_1272	20	225	Novel HMM	DC_1272	Central	Low	Positional only	32 proteins / 32 hits
DC_1272	STR	DC_1272	221	387	Novel HMM	DC_1272	Central	Low	Positional only	32 proteins / 32 hits
DC_1272	STR	DC_1272	379	617	Novel HMM	DC_1272	Central	Low	Positional only	32 proteins / 32 hits
DC_0015	STR	DC_0015	583	1050	Novel HMM	DC_0015	Central	Low	Positional only	187 proteins / 187 hits
Coil	Unmapped	-	607	634	Coils	Coil	-	-	-	-
Coil	Unmapped	-	649	669	Coils	Coil	-	-	-	-

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage SP-10 [NCBI]	941058	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Bacillus subtilis [NCBI]	1423	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

YP_007003420.1 [NCBI]

Genbank nucleotide accession

NC_019487 [NCBI]

CDS location

range 87255 -> 91757
strand +

CDS

ATGCCGCAACTAAAACTAAGGTACAACGGTAGATGGGTTACAATTGGTGGAGGTCTCTCAGGCGGAGATACGGGAGAAATTGTAGACTACATCGATCAAATCAAAAAGGAACTTCAAAATAATCTTGAAAAAATATCAACAGACCTTAACAATACTGATATCTACATTGACGGCGCTTTTCGAGACGGTATTATAACAGAAACTGAAGCCAAGAAAATAAAGGCATATCTTAACACTCTTAATACCTCGAAAGTACAGCTTGACCAGCGTTTCGAAGAGATTTATAAAAATATATACTTGCCGGCTTTTAACAAAGAAGGACTAGTGAGCGCGAACAACACTTATCAGACAGCTTACGAGAACCTTCATAAAACAATTTTAGATGCTATTGTTGACGGAAAAGCGACTGAAGAAGAGTCAAACGCTGTAGATACTGCGTTCGATGTTTATACAAGAGCTCTGTCCCTTCTTGTCTCAGCATTAGAAGTCTCAGTTGATGCTATTAACAACGCAAAGAACAAAGAGACGTTAGATAACTCCAAAAAGTACACTGATGACCTTTATGTTCCATTAGACGAGAGAGTTGTAAAAGCTGAATCTGAGATCAAAACAACTAAGGAGCAGATTTCTCTTAGAGTTACTAAAGAAGAGTTTACACAAGGGTTAAACAACAACTTAGACTCTGCTAAGCAGTACTCTGATACGCAGAAAAAGGCTCTCGAGACCGACTTGTCAACTCTTCGGGGAGACCTTCAGGAAACAGACGAATACATCAATGGAGCGTTTAGAGATGGAATTGTATACGACTCCGAAAAGATACAGATTGAGGGGTACTTGAATACGATCAAAACTTCAAAGAGTCAGTATGATAATCGTTACCAAAGTGTTCATGATAACTCATATCTCCCAGAGACCCCTAAACTAAACCTGGAGAGCGCTAAGACAGACTACGATACGAAATATAACATGCTTGTACTAGCCATTACAAATGCTATTGACGACCAGCTAGCGGACGATGACGAAACGGCCAAAGTCAACGCAGCCTTTGACGCTTATAACCAAGCGTTAGCGCTTCTTACCCTATCTTTGGAGGTCGCTATAGATGCGATTAGCAAAGCGAAGGCAGAAGAGGCTAGAAAGCTTGCAGAGGGCTACGCTGATGAGCTGAAGCAAGGGCTAGACAAAGACATTGCGAATGTACAACAGTCGATTAAGGAAACTGATGATTATATTACCCATGCGTTCCGGGATGGACTAGTTAGTGAGACAGAAGCCAAACGAATCGAAGGTTACTTACTAGGTTTGGCTCAGAATCATCAAGCTATTATGGAGCGTTACACAGAGATTTATGAGAATCCAATGCTAGCTGGAACAGCGAAGACTGACTTGTACCAAAAACAAACTGATTACGCGACGGCTTACGACTCACTTGTAACGACAATAAATGACGCGACATCAGACGGTCAGACAACAGCGGAAGAGAGCAACAATGTTCAACTAAAGTTCTATGACTATAACAATAGGTTCAAAGAGCTTACAAAGGCGATAGAGACAGCCATTGACTTCATCTCTACATCAAAAGCGAATAAATCAGAAGAGAACTCAAAAGATTACACAGATGGGAAAGTAACACCAATTGAAACCAGACTCACAACTGCAGAGTCAAATATAACTCAAAACGCAAAGGAGATATCGCTGAGAGTTAAAGAAGAGACATATAATCAAGGTATGCAACTAGTCGATGGAATTGACACACGTCTTAAGTCGGCAGAGTCAACTATTGTTCAACACGCAGATGCAATCAGTCAGCGCGTTACGATAGAGAATTTTGATACAAAAGCAAAACAGCTACAACTAGATGCTGACAACGCGAGAAAAGCGGCAGACGCAGCTCAACAAACAGCGGACGCGGCCAAGTCTGGAGTAGATGACGCGGTCAAATCAATCTCTGACTTAACATCTGACAACAAGTTGTCTCAATCTGAAAAGACTGAAGCTAAACGTGAGTGGGAAGCGATCAAAGCAGAAAAGATAACACTCGAGAAACAAGCAACCGACTATGGAATAACGACAGCAAAGACTAACTATATCGCTGCTTACAATTCTCTCGAGGCGTTTTTAACTCCTCTGATTGCAGACTTGTCTACTATATCTGACGTCGATGGCGAGACGTTCCGAGCGAAGTTCAAGGCTTACTATGACACTCGCTCTACGCTACTTCAGGCAATCGCATCGGCTTCTAAAAAGCAATCTGACGACTTAGACACTAGGTTAACAAACTTGAAGTATGTAAACGCCAACATACTTGCTGGATCAATGTTCGGGGAAGGAGATGTCCTTCCTATTGATTCAGGTACTGTTGTTAGAGTACAGCCAAATGATGGCGATGTTAACAGCTTACAAGTAAAGCAGTACTCTCCTTCTTCTGCGGTCTATGGATTTAAGACTACTAGACAGACAACTGAGTTTAAAACAGGAACTGTATACACCCTGTCAATGCAAGTGGCTATTGGAGACGTTACAAAACTTGATGAGATTTATATTAAGTCTGCTGAGGGAGGATCTCAGAAGCTGCCTTCAATCCCCATAACTTGGTCTGATACTGCGTATAGAACTGTAACACTCACGTTTACAAGTAACATTTCAACGTCTAGAGGTTACATTCAAGTCGCAACAGCAGACTTAAGTTCAACAAGAATCGAGTATTTCTATATCAAAAAGTTGAAGATTGAGGAAGGCGGTGTTGCGACACCGTACATCCCTTCTGGCGCAGACACGGGTACGCTTGGAAGTCAGGTAGCTAAGGCTGAGTCTGAAATAAAGCAAAACGCAGAGCAGATACAGTTGAGAGTTTCAAAGACCGACTTTAATGGTAAGAACGTAGTATCTATGATTAACCAAACAGCCGACGAAGTTCTCATTGAGGCCAGCAAGATAAAACTAAATGGGGACGTTAATGTCGGGGGTTTTTCAAACTATGTACAAGACCCTGACTGCGAAAAAGCTTTATCTCTGAACTGGACAGTAACGTCGACAGGTTCAGGAGGATTTTCATACGCAGTCCTGCCGACAAACGATGTACCGCCGGCAGGTGAACCAAACTTTCCCCCGCCAACCAGATATGGAATAAAATTACAAGTCAACGAGAAGAAGCTTTACGAAATGAAACAGCCAAAGTTTGATGTTGAGCCGGGAACTCCATTGGCTATTAGCTGTTACACTTATAAAAAGCTAAATGAAACGGCCATATATTCCGGATGGTTTGCGGTTAACTTTTACAACGCAAGAGGTTCATTACTGCAAGACGAGTTTTATGTACCATTGAGAGGGAACGACGACGAACCTTTATGGTCACTAGTAAGAGCCGAGATGAAAGTTCCGGCAACAGCTGCGAAAGCAGAAGTGTATATAAGGTTCAAACCACTAGCAGATGAGGAGTACCCATTAACTTACTATATTGGTAGTCCAAAGGTTTCTAAACCCGGTACGATGGATGTTGACTCTATATACTCTTATCTAGTTTACTCTCAACGTGTTACAGTTAACAAAACGCTAGATTTTGGGTACAGAGGTAACATAAAACAACAAGGTTACTTAGCGCCTTATGGAGACATAAAGATGCAAGATGGAGTGTTGACTTCTACAAAGAGTGACTACAAGTTGCACATCGGTAACGGGCATATCTCTGCTGTTAAGTACTATGACATTGATAGCGATTCCTTGAATCCGAGGATGATACTAGACGCTGTTGGACTACACGCGTTCTCGTCAGGCAGCAATAAGAACGCTATGTTTTCAACTGATGGGAATCTGGAGATGTATCGCGACGCGGCGATAGTTTTCAAATCTTCACCGTCTAGTATGACTTTTAACAAATATGGGAACTTGACTCCAACAACACCTAGCAGCGCTTCTGCAACAGCAAGTTGGAACGTTGGTCACGTAAATGGTGGGAATGTAATCAAAGCTTTCTTCGGTTCAAGCGGAGGAAGTAATAACGCTTATGGAATTCAACTTATCCCGGGAGGGTCAGGTAACGGATTTGAGTTCGTAAATCTCGACAGCACGAACATCGGCATGAAAGGTCCAAACCAGATTATTAAGTTTCTAGGCAGGAGCAGTACAACACAGTTTAGAAACAGGGCTGACTCTGACTACGCCTCAATAACTGTCGGAGGATTAACGAACCACTCGTATCGAGACTCAAAGACAGGGATTGAAAAATCTACTATGAACGCGTCAGATATTATTAAAAACCTCATTGTAAGGGAGTACTACAAAGGGTCAGACTTAGTTGTAAAAGACGAATGTGGAAACGATTTATATTGTGAGTTACCTGACTCTACAGTGTTGTTGTCACCCAAGAAGCAGATTGGGTTGATCTGGGACGAAGCTGCGGATTGTATACGAAACCCAGATGGAATTGATTTATACAAGTTCTGTACGTTGTTACTAAAGGCGTTACAGGAGACAGATGAAAGACTAACTGCAGGAGGCTTATAA

Genome Context

Tertiary structure

PDB ID

04c0b730de00f81ec36ba9f718343c6d4c189a5c9d19123cb3aafa5b695f0fba

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6261

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence