Protein

View in Explore

Genbank accession

QBQ72452.1 [GenBank]

Protein name

putative tail fiber protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

Evidence RBPdetect

Probability 0,85

Evidence RBPdetect2

Probability 0,96

Protein sequence

MAGYSRQSVADIIANAVIKAAPVNAEYNAIRDAFAFSGGHKHDGSSTEGAYVPLIADTDALNKVVVDTANNRIGIFTEVSSAAVEQIRIQDGAIVPVTDNDIDLGTSSLKYKNIYVNGIASIGSITLSGGTIDNTVIGGTTPAAADFTTMDASGNATVGGTLGVTGNTTIGGTLGVTGVTTLGTANITSVDIGSGAMDGTTIGATTAAAGTFTNLTATGTTTLTTVDINGGAIDGTAIGATSASTGAFTTLSATGTSTLSTVDINAGNIDGTIIGASSAAAGSFTTVSTSGQATLATADINGGTIDGAVIGATTPAAITGTTVTATSFVGPVTGNITGNVTGNVTGNVTGDVTGNVTASSGTSTFNNVTVNGTLNMDAGTTATITNLTSPTNTNDAATKGYVDTSVANLVDSAPGTLDTLNELAAALGDDPNFSTTITNSIATKLPLAGGTMTGAIAMGTNKITGLGDPTAAQDAATQNYVTTNFLGLTGGTMTGAIDMGSAKITTTYTPTNAADLTTKTYVDGILGSATAAAASATAAATSETNAATSETNAANSATAAASSATSAAASYDSFDDRYLGAKASAPALDNDGDALVLGALYFNTTTDIMYVYGSSGWQAAGSSVNGTAERNTYTATSGQTTFSATYDPGYVDVYLNGVKLLANTDFTATSGTSIVLTTGAATGDIVDIVAYGTFVVADTYTKSQSDARYVEVAGDTMTGTLNGTSAVFSGNLTVDTNTLHVDSTNNRVGVGTTSPSRQLHLSGSTPIIRLTDTDTNAYGEISSSSSDGNLMFYADQGNTQANTTIRFYVDTSERMRIDSSGNVGIGTSSFANLLNLHQSDASSNSYLHVTHVDSGTGASNGLSIGLESNGIDAAFRNRESGSVKLYTGNSERMRIDSSGNLLVGTTVTPVNLLTATSGGGMGFDPTDNYLVVAREGTNSSKPVIRLNQTGVDGSIAEFRKDGTTVGSIDTHGGVIQFGQGNVNLAFENGADVIYPANDNGTNNNGDIDLGTSSARFKGLYLSGGVVENTTTVTYASSIALTYNNGSIQTVTLTGNVTFTNSLADGEAIVYRMHPQTLIFM

Physico‐chemical properties

protein length:	1080 AA
molecular weight:	108354,92610 Da
isoelectric point:	4,19258
aromaticity:	0,05648
hydropathy:	0,00731

Domains

Domains [InterPro]

DC_2007
ATT
76–179

DC_2007 DC_2007 DC_1795 DC_1386

DC_2007
ATT
164–226

DC_2007 DC_2007 IPR051934

DC_2093
STR
434–811

DC_2093

QBQ72452.1

1 1080

Architecture

ATT

STR

ATT 76-299 | STR 339-940 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2007	ATT	DC_2007	76	179	Novel HMM	DC_2007	N-terminal	Low	Positional only	16 proteins / 16 hits
DC_2007	ATT	DC_2007	164	226	Novel HMM	DC_2007	N-terminal	Low	Positional only	16 proteins / 16 hits
DC_2007	ATT	DC_2007	220	261	Novel HMM	DC_2007	N-terminal	Low	Positional only	16 proteins / 16 hits
DC_2007	ATT	DC_2007	256	299	Novel HMM	DC_2007	N-terminal	Low	Positional only	16 proteins / 16 hits
DC_1795	STR	DC_1795	339	445	Novel HMM	DC_1795	Central	Low	Positional only	19 proteins / 19 hits
IPR051934	Unmapped	-	373	500	InterPro	Bacteriophage Tail Fiber Structural Protein	-	-	-	-
DC_2093	STR	DC_2093	434	811	Novel HMM	DC_2093	Central	Low	Positional only	75 proteins / 75 hits
DC_1386	STR	DC_1386	795	940	Novel HMM	DC_1386	Central	Low	Positional only	62 proteins / 62 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

QBQ72452.1

1 1080

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	129	129	0,2839
Central domain	130	479	351	0,6591
C-terminal	480	1080	600	0,5380

Note: Constraints were applied during segmentation.
Fixed 88 C-terminal predictions appearing before Central domain

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-129

Central
130-479

C-terminal
480-1080

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Roseobacter phage CRP-1 [NCBI]	2559280	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Rhodobacteraceae bacterium [NCBI]	1904441	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Alphaproteobacteria > Rhodobacterales

Coding sequence (CDS)

Genbank protein accession

QBQ72452.1 [NCBI]

Genbank nucleotide accession

MK613343 [NCBI]

CDS location

range 33886 -> 37128
strand -

CDS

ATGGCAGGTTATAGCAGACAATCAGTAGCAGATATTATCGCTAATGCGGTTATCAAAGCTGCACCAGTAAACGCAGAATACAACGCTATTCGTGATGCGTTTGCTTTCTCAGGCGGTCACAAACACGATGGTAGCTCTACTGAAGGTGCTTACGTACCTTTGATTGCTGACACTGATGCATTAAACAAAGTTGTAGTAGATACAGCTAACAACCGCATAGGTATCTTTACTGAGGTATCTAGTGCTGCAGTAGAACAGATACGTATTCAAGACGGTGCTATTGTTCCTGTAACAGACAACGACATTGACCTTGGTACTTCATCACTAAAATATAAAAACATTTATGTAAACGGTATTGCAAGCATTGGCTCCATCACACTGTCAGGTGGTACAATAGACAATACTGTTATTGGTGGTACTACTCCTGCCGCTGCTGACTTTACTACAATGGATGCATCAGGTAATGCTACTGTCGGTGGTACTCTTGGTGTCACAGGTAACACAACAATAGGTGGCACACTAGGTGTAACAGGTGTAACTACACTAGGCACTGCTAACATTACCTCTGTAGACATTGGCTCTGGTGCAATGGATGGAACTACTATTGGTGCCACAACTGCTGCAGCAGGTACATTTACTAACCTGACTGCTACAGGTACAACTACTCTTACAACAGTAGATATTAACGGTGGTGCTATTGATGGCACTGCTATCGGTGCAACTAGTGCATCTACTGGTGCTTTTACTACTCTGTCTGCCACAGGTACATCTACACTAAGCACAGTAGACATTAACGCAGGTAATATAGATGGTACTATTATTGGTGCTAGCAGTGCTGCTGCTGGTAGTTTTACAACTGTATCGACATCTGGACAAGCTACCTTGGCGACTGCTGACATTAATGGTGGCACTATTGACGGTGCTGTTATTGGTGCAACAACTCCAGCAGCTATCACAGGCACGACAGTTACAGCAACTTCTTTTGTTGGGCCAGTCACAGGTAACATCACAGGAAACGTTACAGGCAATGTAACTGGTAATGTCACAGGTGATGTAACAGGTAACGTTACTGCTTCAAGTGGTACATCTACATTTAACAACGTTACTGTTAATGGTACGTTGAACATGGATGCAGGTACAACTGCTACCATTACTAACCTAACAAGTCCAACTAACACAAATGATGCTGCCACTAAGGGGTATGTAGATACCTCTGTAGCTAACCTTGTAGACTCAGCCCCAGGTACACTAGACACACTAAACGAACTAGCTGCTGCTCTAGGTGATGACCCTAACTTCTCAACTACTATTACTAACAGCATAGCAACCAAGCTACCACTAGCAGGTGGTACGATGACTGGTGCTATTGCTATGGGTACAAACAAGATTACTGGCTTGGGTGATCCTACTGCAGCACAGGATGCAGCTACACAAAACTATGTAACAACTAACTTCTTAGGCTTAACAGGTGGCACTATGACAGGTGCTATCGACATGGGTAGTGCTAAGATTACAACTACCTATACACCTACTAACGCTGCTGATTTGACTACTAAAACATATGTAGACGGTATTCTAGGTAGTGCTACAGCCGCTGCTGCTAGTGCAACTGCTGCTGCTACATCGGAGACTAATGCAGCAACAAGTGAAACTAATGCGGCTAACTCAGCCACTGCTGCTGCAAGTTCAGCAACCAGTGCTGCAGCATCATATGATTCATTTGATGATCGTTACTTAGGTGCTAAAGCTTCTGCTCCTGCCCTAGATAATGACGGTGATGCTCTTGTACTTGGTGCATTGTACTTCAATACTACTACAGACATTATGTATGTCTATGGTAGCTCTGGGTGGCAAGCTGCAGGTTCATCTGTAAACGGTACAGCAGAACGTAATACTTACACAGCCACATCTGGTCAGACAACATTCAGTGCTACTTATGATCCAGGCTATGTAGATGTATATTTGAATGGTGTTAAGTTACTAGCTAATACAGACTTCACTGCTACATCAGGTACATCTATTGTACTAACTACAGGCGCAGCTACAGGTGACATCGTTGATATTGTAGCTTATGGTACATTCGTTGTAGCTGATACTTATACTAAGTCACAGTCTGATGCTCGTTATGTTGAAGTAGCTGGCGATACTATGACTGGTACACTTAACGGTACATCAGCAGTATTCAGTGGCAATCTGACAGTAGATACAAACACACTACACGTTGATAGCACAAATAATCGTGTTGGGGTTGGGACAACTTCGCCTAGCAGACAGCTTCATCTTTCTGGTTCTACACCAATCATTAGGCTGACCGACACAGATACAAACGCATATGGGGAAATTAGTAGTTCATCTTCGGATGGGAACTTAATGTTCTATGCTGACCAAGGCAACACACAAGCAAATACAACAATACGGTTTTATGTTGATACTTCAGAACGCATGCGCATCGACAGTTCTGGTAATGTTGGGATCGGGACGAGTTCGTTCGCCAACCTTTTAAATCTCCACCAGTCGGATGCATCCTCAAACTCTTATCTTCATGTAACTCATGTTGATAGTGGAACTGGTGCATCAAATGGTTTGTCTATTGGGCTAGAAAGTAACGGTATAGACGCAGCATTTAGAAACCGTGAAAGCGGCAGTGTTAAACTGTATACTGGTAACTCAGAACGCATGCGCATCGACAGCAGCGGTAACTTGCTGGTGGGGACTACTGTTACACCTGTTAACTTGCTAACTGCAACAAGCGGCGGTGGCATGGGGTTTGATCCAACTGATAATTACTTGGTCGTTGCGAGAGAGGGAACTAACAGCTCAAAACCTGTTATTCGATTAAATCAAACAGGCGTTGATGGGTCTATTGCAGAGTTCCGCAAAGACGGCACCACTGTGGGGAGTATTGATACCCACGGCGGTGTTATTCAGTTTGGTCAGGGTAATGTAAACCTAGCATTCGAAAATGGTGCAGATGTAATCTATCCCGCAAACGATAATGGCACCAACAATAATGGAGATATAGATTTAGGTACGTCAAGTGCTCGCTTCAAAGGCCTCTACCTCTCTGGGGGCGTAGTAGAAAACACAACCACAGTTACATACGCATCATCTATTGCTCTTACCTACAACAATGGTTCTATCCAAACAGTCACACTTACAGGCAACGTCACATTTACTAACAGCTTGGCAGACGGTGAAGCCATTGTGTATCGGATGCATCCTCAAACTCTTATCTTCATGTAA

Genome Context

Tertiary structure

PDB ID

4f1e798988fbd9cd2d0671323d8a55636f9eca547a048d5a85e255162910ebe6

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,2882

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Diverse, abundant and novel viruses infecting the marine abundant Roseobacter RCA lineage	Zhang,Z.F., Chen,F., Chu,X., Zhang,H., Luo,H.W., Zhai,Z.Q., Yang,M.Y. and Zhao,Y.L.	2019	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature