Protein

View in Explore

Genbank accession

QRE00909.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,91

Evidence RBPdetect2

Probability 0,91

Protein sequence

MATITTRINTASAYEVQTKNPLLQVGEPFYEQDTGGFKVGNGSQRYNELPYAGIILSQGPPGEQGPPGEPGDDGASAYQVALNGGFVGSQAAWLASLVGPAGPAGSTGATGATGATGATGATGPTGPQGETGHGLDIDHSVAAYADLTSIVGAVEGDVAFVEANDMVYVYSGSAWPAEVDGIEIGGVPGPTGPQGPQGPTGLTGPQGETGATGATGPAGTTTWGGITDKPVVIAAGATAADARTAIDAAPTSHTHSIANVNLLQAALDAKAPTAGPTFTGNLTVPTVKITGGSPGVGKVLTSDADGDAVWADPDVTTAELNAKVVDNIVDGITGSAPSQNAVFDALAGKAGLSSPVFTGVLTTPAIKVTGGAPGAGKVLTSDADGDATWETPAGGTQKWYKEVVAFSSTVPRVSGYGEGIGGVVVSAAGTLVSVYVRIPDWAATIGGTGNLTIDVKKGTFSTEGTSLQTFTFASGTRGGLATLTTPAALAADDVIRIQVTVGSTTGNGLMYELRGTLT

Physico‐chemical properties

protein length:	518 AA
molecular weight:	50959,65800 Da
isoelectric point:	4,32700
aromaticity:	0,05792
hydropathy:	0,02066

Domains

Domains [InterPro]

DC_1473
STR
2–193

DC_1473 DC_1239

SSF69349
STR
17–199

SSF69349

IPR050149
Unmapped
59–220

IPR050149

QRE00909.1

1 518

Architecture

STR

RBD

STR 2-199 | RBD 206-497 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1473	STR	DC_1473	2	193	Novel HMM	DC_1473	Central	Low	Positional only	59 proteins / 59 hits
SSF69349	STR	SSF69349	17	199	Merged direct domain	SSF69349	Central	Low	Positional only	153 proteins / 153 hits
IPR050149	Unmapped	-	59	220	InterPro	Collagen superfamily	-	-	-	-
DC_1239	RBD	DC_1239	206	497	Novel HMM	DC_1239	C-terminal	Low	Positional only	21 proteins / 21 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Nocardia phage NC1 [NCBI]	2805752	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Nocardia asteroides [NCBI]	1824	cellular organisms > Bacteria > Bacillati > Actinomycetota > Actinomycetes > Mycobacteriales

Coding sequence (CDS)

Genbank protein accession

QRE00909.1 [NCBI]

Genbank nucleotide accession

MW452562.1 [NCBI]

CDS location

range 21131 -> 22687
strand +

CDS

GTGGCAACGATTACTACCAGGATCAACACCGCTTCGGCGTACGAGGTTCAGACCAAGAACCCGCTGCTCCAGGTAGGAGAGCCCTTCTACGAACAGGACACCGGCGGGTTCAAGGTCGGCAACGGCTCCCAGCGCTACAACGAGCTGCCCTACGCCGGGATCATCTTGTCTCAGGGTCCTCCCGGAGAACAGGGTCCTCCCGGCGAGCCTGGCGATGATGGTGCGAGTGCCTATCAGGTGGCTCTGAACGGCGGGTTCGTCGGCTCGCAGGCGGCCTGGCTGGCATCTCTGGTAGGTCCTGCCGGTCCTGCGGGCTCAACCGGCGCTACGGGGGCTACCGGGGCGACCGGGGCCACCGGCGCGACCGGCCCCACGGGTCCGCAGGGAGAGACGGGGCACGGCCTCGACATCGACCACAGCGTGGCCGCCTACGCGGACCTGACTTCCATCGTCGGCGCGGTCGAGGGCGACGTCGCGTTCGTCGAGGCCAACGACATGGTCTACGTCTACAGCGGCTCGGCGTGGCCCGCCGAGGTCGACGGCATCGAGATCGGCGGCGTGCCAGGACCGACCGGACCCCAGGGTCCCCAAGGCCCCACCGGGCTCACCGGACCGCAGGGCGAGACCGGAGCCACGGGAGCAACCGGCCCCGCCGGGACGACCACCTGGGGTGGGATCACCGATAAGCCTGTCGTCATCGCCGCCGGAGCGACGGCCGCCGACGCGCGCACCGCGATCGACGCCGCCCCGACCTCGCACACGCACAGCATCGCGAACGTCAACCTGCTCCAGGCCGCGCTGGATGCGAAGGCCCCGACAGCAGGACCGACCTTCACCGGCAATCTCACCGTGCCGACCGTGAAGATCACCGGCGGCTCGCCGGGTGTCGGCAAGGTCCTCACCTCCGACGCCGACGGCGACGCGGTCTGGGCCGACCCGGATGTCACCACGGCGGAGCTGAACGCCAAGGTCGTCGACAACATCGTGGACGGGATCACCGGGTCCGCACCGAGCCAGAACGCGGTGTTCGACGCGCTGGCAGGGAAGGCCGGGTTGAGCTCGCCGGTGTTCACCGGTGTCCTGACCACCCCGGCCATCAAGGTAACCGGCGGCGCTCCCGGCGCGGGCAAGGTGCTCACCTCGGACGCTGACGGCGATGCGACCTGGGAGACCCCGGCTGGCGGGACGCAGAAGTGGTACAAGGAGGTCGTCGCCTTCTCCTCCACCGTCCCGCGAGTGAGCGGCTACGGCGAAGGCATCGGCGGCGTCGTAGTGTCGGCCGCAGGCACTCTGGTGAGCGTCTACGTACGCATCCCGGACTGGGCCGCGACGATCGGTGGCACCGGCAACCTGACGATCGACGTGAAGAAGGGGACGTTCAGCACCGAGGGGACCAGCCTCCAGACCTTCACCTTCGCGTCAGGTACCAGGGGCGGTCTCGCCACCCTGACCACCCCGGCCGCCCTGGCGGCCGACGATGTGATCCGCATCCAGGTCACCGTCGGCTCGACTACCGGCAACGGCCTGATGTACGAGCTGCGAGGAACTCTGACATGA

Genome Context

Tertiary structure

PDB ID

e658d799f6170e937673d4fee5096e0c5899bc3c183b60ad0c8d7c9e34a3d463

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,7642

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence