Protein

View in Explore

Genbank accession

XMN69188.1 [GenBank]

Protein name

tail fiber and host specificity protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect2

Probability 0,92

Protein sequence

MDLNKKGYKVEITAYSLGLELNQEERGAHKPANAMSFAEYLAYYDPEHALEVGVNEVADKRIKLEWTGTDTILARLFSIANSFDAELEFTVELNQDYSLKRQVLNIYKKGNLGSNRAASPIRVGRGLKVINYSDNLKELRTAVRATGKDGLTIDGLNKKVYDDDGNLLYYSNANTVYAPQSRDKYPSVGKKSNDNWIIKELGETEYSTKEALWGYMLGELKKICVPEITYDIEGAVDGDVGDTRTLIDDVHYDPPLYVQGRISELTEDLITGKVTKSTLTNFERKYSQVASELLKQVEQLANDAAPYIVRLSTDNGYNFKNGKGSSTVTASLEKYGKIVNANWKWLINNSIVSDKNSVTINASQVIGTLNVVAVATVDGKEVAREYITFTNSDDGVGIKSIKRYYTTNDQAEGVTAGGQNWSTKPATVTADNKYMWSYDVITYTNDTSLVTEPAVIGARGDDGLDADTTGVTEALDKAKQELTALSANIEKVRDDSLAAVEEAKQQLTTVADDLSKVKTDLQTQASQLTAQANAQSELTKRVSSVEETANGTTTAVSELSKTVDSNTKNISSVTARTKTVEDDLTSTKTTLSQVQTTANSASQKTATLETGLDGVKADLAATTATADTTKTNLASYQASNNQAVANLQSSLQTTNGYVSSLQTQVAAVPGQITSAVSAVEGKIPTEIGGRNLYALSKNDGIYSPGTNDFRQNISSGEISFEVTNTSAAGFGAYSSRIGTSYNKLYGVKIPVVQGKDILVNLTDDKLGRIYVHFWDENNALVKPTLKYTSNKIKVLASLLIDVSSITLQCAVKTDVEIGTLIKTKIKVEYGNVYTGWSPAPEDTAIQISSLSSQIRQTADGMTLLATKTELNSAKTDLQAGISTATSKADSAQATANSNAQTISTHTTQISALNTGLQSKVSQSDFDSLSGDVDDLSSKLTQTASSITASVSSVETKADNAQTTANSAVSKADAAQAGVNTLDSTTVKSASLNLDNNGFVTKVGKTIDGNTFATMIAQNANNVKIIADEMQVTADMIVDGAVTAEKLDVNNLSAVTANLGDMTSGSITNTFTSGTRSGSVKIGNGVEITTVDTSGYLPEKAKTYSRFSDDALSFSSSTSNDEPTHSMMIMPEMISYTKHNYDNSSGGTGGWKLRHNGHYSMLEVDMVWQNVRLSNTSELPYGVRADYVRIGNLVTISVNRQITSIADVTEDKLANETIPEGFRPISQAHLTLTGNTGSTIDATCIVHLNPDGTIRFTNNKSGNRVWTGTVTYTCVEAMPYSTSNNNISTI

Physico‐chemical properties

protein length:	1289 AA
molecular weight:	138532,08630 Da
isoelectric point:	5,03420
aromaticity:	0,06129
hydropathy:	-0,36276

Domains

Domains [InterPro]

DC_0690
STR
1–633

DC_0690 DC_0899

G3DSA:1.10.287.1490
STR
461–682

G3DSA:1.10.287.1490 DC_0578

SSF57997
STR
473–649

SSF57997

PTHR43941
Unmapped
474–980

PTHR43941

Coil
Unmapped
475–495

Coil Coil

XMN69188.1

1 1289

Architecture

STR

RBD

STR 1-682 | STR 734-1116 | RBD 1117-1280 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0690	STR	DC_0690	1	633	Novel HMM	DC_0690	Central	Low	Positional only	29 proteins / 29 hits
G3DSA:1.10.287.1490	STR	G3DSA:1.10.287.1490	461	682	Merged direct domain	G3DSA:1.10.287.1490	Central	Low	Positional only	5 proteins / 5 hits
SSF57997	STR	SSF57997	473	649	Merged direct domain	SSF57997	Central	Low	Positional only	14 proteins / 14 hits
PTHR43941	Unmapped	-	474	980	PANTHER	STRUCTURAL MAINTENANCE OF CHROMOSOMES PROTEIN 2	-	-	-	-
Coil	Unmapped	-	475	495	Coils	Coil	-	-	-	-
Coil	Unmapped	-	500	531	Coils	Coil	-	-	-	-
DC_0899	STR	DC_0899	734	1116	Novel HMM	DC_0899	Central	Low	Positional only	49 proteins / 49 hits
DC_0578	RBD	DC_0578	1097	1280	Novel HMM	DC_0578	C-terminal	Low	Positional only	23 proteins / 23 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptococcus phage PY4 [NCBI]	3390255	Viruses >
Host	Streptococcus equinus [NCBI]	1335	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Lactobacillales

Coding sequence (CDS)

Genbank protein accession

XMN69188.1 [NCBI]

Genbank nucleotide accession

PQ621715.1 [NCBI]

CDS location

range 15080 -> 18949
strand +

CDS

ATGGACTTGAACAAGAAAGGCTATAAGGTTGAAATCACAGCTTATTCGCTCGGTCTAGAGCTTAACCAAGAAGAGCGAGGTGCACACAAGCCAGCTAATGCAATGAGTTTCGCTGAATATTTGGCTTATTACGACCCTGAACACGCTTTAGAGGTTGGTGTTAACGAAGTAGCAGACAAACGTATCAAACTTGAATGGACGGGCACAGACACGATTCTGGCGCGTCTTTTTTCAATTGCCAATAGTTTCGACGCAGAGCTTGAATTTACTGTCGAGTTGAATCAAGACTACTCGTTAAAACGTCAAGTTTTAAATATCTACAAAAAAGGTAATCTTGGTTCTAATCGAGCAGCAAGTCCAATTCGTGTTGGCCGTGGCTTAAAAGTCATTAATTACAGCGATAATTTGAAAGAATTGCGTACAGCGGTACGTGCTACTGGTAAAGACGGATTGACCATTGACGGTCTGAACAAAAAAGTCTACGACGATGACGGCAATCTGCTTTACTACTCAAATGCTAACACTGTTTATGCGCCTCAAAGCCGTGATAAATACCCGTCAGTCGGCAAGAAGTCAAATGATAACTGGATTATTAAAGAACTCGGGGAAACCGAATATAGCACGAAAGAGGCGCTCTGGGGTTACATGCTCGGTGAACTCAAAAAGATTTGCGTACCAGAGATTACATACGACATCGAAGGCGCTGTTGACGGTGACGTCGGTGACACGCGCACATTGATTGATGACGTGCATTATGACCCACCGCTATACGTTCAAGGGCGTATTTCGGAGCTTACAGAGGATTTAATCACTGGCAAGGTTACGAAGTCAACGCTTACGAATTTTGAACGTAAGTACTCGCAAGTCGCTAGCGAATTGCTAAAACAAGTTGAACAGCTAGCAAACGACGCAGCACCTTACATCGTCCGTTTATCAACCGACAACGGCTACAATTTTAAAAACGGCAAAGGTTCTAGCACAGTTACTGCTAGCCTTGAAAAATACGGCAAAATTGTAAATGCAAATTGGAAGTGGCTAATTAATAACAGCATTGTTAGCGATAAGAACAGTGTCACAATCAATGCTAGTCAAGTTATTGGCACACTAAACGTCGTAGCTGTTGCAACCGTTGACGGGAAAGAAGTAGCTCGTGAATACATCACATTCACCAATTCTGATGACGGTGTTGGTATTAAGTCAATCAAACGCTATTACACGACTAACGACCAAGCAGAGGGCGTCACAGCAGGCGGTCAAAACTGGTCTACTAAACCAGCGACTGTCACAGCAGACAACAAGTACATGTGGTCTTACGATGTTATCACGTACACAAATGACACAAGTTTAGTTACTGAACCAGCCGTTATTGGTGCTCGAGGGGATGACGGTTTGGACGCAGATACGACAGGTGTCACAGAAGCACTTGATAAAGCTAAGCAAGAATTGACTGCTTTATCAGCGAATATCGAAAAAGTGCGAGACGATTCGCTTGCAGCAGTCGAAGAAGCCAAACAGCAACTCACTACTGTAGCTGACGACTTGTCTAAAGTCAAGACAGACTTGCAAACACAGGCTAGTCAGTTGACTGCACAAGCCAATGCACAGTCAGAATTGACTAAACGTGTAAGTAGCGTTGAAGAAACTGCTAATGGCACAACGACGGCTGTTAGCGAGTTAAGCAAAACAGTAGATAGTAATACCAAAAATATTAGTAGTGTTACTGCACGAACTAAGACAGTTGAAGATGACCTGACAAGTACTAAAACAACATTGTCACAAGTTCAAACGACTGCTAACAGTGCTAGTCAAAAAACAGCTACACTTGAAACTGGCTTGGATGGTGTCAAGGCTGATTTAGCTGCAACTACAGCAACTGCCGACACGACCAAAACCAATCTTGCTAGCTATCAAGCGTCAAACAACCAAGCTGTCGCAAACTTGCAATCTAGCTTGCAGACCACGAACGGCTATGTAAGCAGTCTGCAAACACAGGTTGCTGCAGTCCCGGGACAGATTACAAGTGCTGTCAGCGCAGTTGAGGGGAAGATACCTACTGAAATTGGTGGACGAAATTTATACGCATTGTCTAAAAATGACGGAATATATTCGCCAGGCACTAACGATTTTAGGCAAAACATAAGTAGCGGAGAAATCAGCTTTGAGGTAACTAACACATCCGCAGCTGGTTTCGGTGCTTATAGTAGCCGCATTGGAACAAGTTATAACAAACTGTACGGTGTCAAAATCCCAGTCGTGCAAGGTAAAGACATACTTGTTAATTTGACAGATGACAAATTAGGTCGAATATATGTACATTTTTGGGACGAAAACAATGCGTTAGTAAAGCCAACGCTAAAGTACACATCTAACAAAATTAAAGTTTTAGCCAGCTTGTTGATTGATGTCAGCTCCATCACTTTGCAGTGCGCAGTCAAGACAGACGTTGAAATTGGTACTTTGATTAAGACCAAAATAAAAGTCGAATATGGCAATGTGTACACAGGCTGGTCTCCAGCCCCCGAAGACACAGCTATACAAATCAGCAGCTTGTCTAGCCAGATTCGGCAAACTGCTGACGGCATGACGTTGTTAGCGACTAAAACAGAGCTAAACAGTGCTAAAACCGACTTGCAAGCTGGCATTTCGACAGCGACAAGCAAGGCTGACAGTGCACAAGCTACCGCTAACAGCAACGCGCAAACAATCAGCACACACACGACTCAAATCAGCGCGTTGAACACTGGTTTGCAAAGTAAAGTTTCTCAAAGTGATTTTGATTCATTGAGCGGTGATGTCGACGATTTATCAAGCAAGCTTACTCAGACAGCAAGTTCAATCACCGCAAGTGTGTCAAGTGTTGAGACTAAAGCAGATAATGCTCAAACGACTGCTAACAGTGCGGTCTCAAAAGCAGACGCGGCGCAAGCTGGTGTCAATACGCTAGACAGCACGACTGTTAAGAGTGCTAGCTTGAACCTTGATAACAATGGATTCGTGACAAAGGTTGGAAAAACTATCGACGGCAACACGTTTGCGACCATGATTGCGCAAAACGCTAACAACGTCAAAATCATCGCTGATGAAATGCAGGTCACTGCTGACATGATTGTCGACGGTGCAGTCACAGCCGAGAAACTAGACGTCAATAATTTGTCTGCAGTTACTGCAAATCTTGGTGACATGACATCTGGTTCGATTACTAACACATTCACTTCTGGAACACGAAGCGGAAGCGTCAAAATAGGTAATGGCGTTGAAATAACAACGGTTGACACATCTGGTTATTTGCCAGAAAAAGCCAAAACATACTCACGTTTCTCTGACGACGCGCTTTCGTTTAGCTCTAGCACTTCAAACGATGAACCGACACATTCGATGATGATAATGCCGGAAATGATTAGCTACACCAAACACAATTACGACAATTCAAGTGGCGGAACAGGAGGCTGGAAACTGCGCCACAATGGTCACTATTCAATGCTTGAGGTCGACATGGTTTGGCAGAACGTTCGACTTAGCAATACGTCTGAATTACCTTATGGAGTTCGAGCAGATTATGTTAGAATCGGAAATTTGGTAACTATTTCCGTCAATCGTCAAATTACAAGCATAGCAGATGTCACTGAAGATAAATTAGCAAATGAAACAATCCCAGAGGGTTTCAGACCAATTTCACAAGCACATTTAACGTTGACTGGGAATACTGGTTCGACCATCGATGCGACTTGTATTGTACACTTAAACCCTGACGGAACCATTCGCTTTACTAACAACAAATCAGGAAACCGCGTCTGGACGGGCACAGTGACATACACATGTGTTGAAGCTATGCCTTACAGCACATCAAACAACAATATTTCAACAATTTAA

Genome Context

Tertiary structure

PDB ID

27fda1647485a95a90e8be38b03ac8890a881b3f374b46586295d7773ab7a484

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6315

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence