Protein

View in Explore

Genbank accession

CAI7679411.1 [GenBank]

Protein name

Glycerophosphoryl diester phosphodiesterase domain-containing protein, putative tail fiber protein

RBP type

TSP

Evidence RBPdetect

Probability 0,68

Protein sequence

MANKILRLDISKIPDLTPIIYGRVADGLVQTVDVYVTNNGEPFDLTGWVINFEGNTSGNRTYVKDLDGIVMVDRTKGHFTYTFPLIAFSTAGKYERAYFSFVKGDQRESTSDFNIQVFENADITVEEAHTVITEYEELVDELNRIFLEAQTELQQDFDEFKKNYDTRYNNYITDLTNKINAAQNKIDILNSNYDKANAKLTDLEERMNDLVNKGLLKMEDVLSFLGGKNVKIKVPIDFTGKIRESTVENPNVMKLSTMPATDINIVATATSGEELSSDDAEATMWNNYKSVSALDGKLAQAQQMLNGYVTYHLARIDAVSEISRRFPNLFINVGATTRSQQKEQLIKKATFVSATAYGFGSVGDVYKYTIGRSNWTTTGTTWQGWTGWGIDNNSHSSSKPNPVTAGVGSVNTIMDENGVMAFIMGVPTPSDGTKMLRTNLDYFVCEITLNLNINDLIPKPDLSKYYTKDEMNEAFTEHSLYSNSLDFGNYDYSGNPNLMANINADSFSQGTGALSVVDDGDEVVVTLDPNNKLDLFKTKSQPALVVGKTYTLSAEIMLEDDFTGDPSKLSLRYIKMPNWLSALTTRFTLTNDKGVWQKVTITDTMTTAINDAESWFIMLHNRDVNNSLSGKLRLRHVKIEEGSTATPYQPNLLDVPYYLSKVALGENIANKSVAFPIKSSAFNIYEGNMEEDFMIGQTYTITLKGTKPASQTFRAYNNSTVNFGELKPVEGLTDVWSLTFTPTKLDPDFPKNLRIYQFFKETLGACQIDWLKIEKGDTRTPNLNDPFKYKGIGFTKSSNPKDYNWNSAPENVDFIKENAASNEARIDEIDKNVVKTSGNQNITGLKNFTGTLQSSGVEVAKKGDSYTKTETYTKTEVDSKYIPKTQENTFVKTIGNQNVVGTKNFSDPRKNDALMYALTDEAMRPSDFNFAGNFTKVMTARSMRVMQRRLPWMKTFGWFGTGEGSANDIDEGFKQYIQTNTTTDADITSYQFIRKGRKVQFFGRIKFTSATGTDVVTFAQVPTGFRLSNAAKYTYWNVPLTCVQYNAPERINYKGFVERLGTNNIKIGTATYTGNTYWYGEWETSDPYPTSFTDEVTERMMAHRGATVSYPENTLEAFKAAIDLGYGGVELDPRLTSDGKLYLMHDDTVDRTTNGTGNFADLTEAQVKALNIKIDPVKYPNLVGKTLKVPSLSSVLLALRGTDLTINFDGSKIDLSVASTAKMIHDMIVSYGLEKRVFFVISNKTQRDAFHKLYPQYPVSWLWNSPGSRAAGAVNEIYAYGKHGGALLSIPMAVLNDDTSMRDIQASGIYYQVYGVQTEADYETCRLMRVPMIETDQLYPNLDFL

Physico‐chemical properties

protein length:	1345 AA
molecular weight:	150633,55140 Da
isoelectric point:	5,25388
aromaticity:	0,10706
hydropathy:	-0,41777

Domains

Domains [InterPro]

G3DSA:2.60.40.3350
ATT
1–122

G3DSA:2.60.40.3350 Coil Coil DC_2057 G3DSA:6.10.140.2190 DC_0134

DC_1249
STR
1–430

DC_1249 IPR017946

IPR018913
ATT
4–143

IPR018913 IPR030395

PTHR46211
Unmapped
1099–1337

PTHR46211

cd08566
ENZ
1101–1301

cd08566

IPR017946
STR
1101–1338

IPR017946

IPR030395
ENZ
1103–1337

IPR030395

CAI7679411.1

1 1345

Architecture

ATT

STR

ATT 1-143 | STR 144-430 | STR 461-675 | STR 815-856 | STR 865-1345

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
G3DSA:2.60.40.3350	ATT	G3DSA:2.60.40.3350	1	122	Merged direct domain	G3DSA:2.60.40.3350	N-terminal	Low	Positional only	41 proteins / 41 hits
DC_1249	STR	DC_1249	1	430	Novel HMM	DC_1249	Central	Low	Positional only	83 proteins / 83 hits
IPR018913	ATT	DC_0557	4	143	InterPro cluster	BppU, N-terminal	Central	Medium	Text match	333 proteins / 333 hits
Coil	Unmapped	-	125	152	Coils	Coil	-	-	-	-
Coil	Unmapped	-	172	213	Coils	Coil	-	-	-	-
DC_2057	STR	DC_2057	461	675	Novel HMM	DC_2057	Central	Low	Positional only	53 proteins / 53 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	815	856	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
DC_0134	STR	DC_0134	865	1111	Novel HMM	DC_0134	Central	Low	Positional only	15 proteins / 15 hits
IPR017946	STR	IPR017946	1084	1344	Merged direct domain	PLC-like phosphodiesterase, TIM beta/alpha-barrel domain superfamily	Central	Low	Positional only	31 proteins / 31 hits
IPR030395	ENZ	DC_0002	1098	1345	InterPro cluster	Glycerophosphodiester phosphodiesterase domain	Central	High	Text match	63 proteins / 165 hits
PTHR46211	Unmapped	-	1099	1337	PANTHER	GLYCEROPHOSPHORYL DIESTER PHOSPHODIESTERASE	-	-	-	-
cd08566	ENZ	DC_0002	1101	1301	InterPro cluster	cd08566	Central	High	Text match	63 proteins / 165 hits
IPR017946	STR	IPR017946	1101	1338	Merged direct domain	PLC-like phosphodiesterase, TIM beta/alpha-barrel domain superfamily	Central	Low	Positional only	31 proteins / 31 hits
IPR030395	ENZ	DC_0002	1103	1337	InterPro cluster	Glycerophosphodiester phosphodiesterase domain	Central	High	Text match	63 proteins / 165 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAI7679411.1

1 1345

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	325	325	0,9936
Central domain	326	621	297	0,7398
C-terminal	622	1345	723	0,1993

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-325

Central
326-621

C-terminal
622-1345

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Enterococcus phage Planchet [NCBI]	3014452	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAI7679411.1 [NCBI]

Genbank nucleotide accession

OX422066 [NCBI]

CDS location

range 21100 -> 25137
strand +

CDS

ATGGCAAATAAGATATTACGTCTTGACATTTCAAAAATTCCAGATTTGACTCCTATCATCTATGGGCGGGTCGCTGATGGACTCGTCCAAACTGTTGATGTATATGTCACGAATAATGGAGAGCCTTTTGACCTAACAGGTTGGGTCATTAACTTTGAAGGTAACACAAGCGGGAACCGAACATATGTAAAAGATCTTGACGGAATCGTCATGGTTGATCGCACGAAAGGTCATTTTACTTACACATTTCCACTGATCGCTTTTTCAACAGCTGGAAAATATGAACGAGCATATTTTTCATTTGTGAAAGGAGATCAAAGAGAATCAACTTCAGACTTTAACATTCAAGTATTCGAAAATGCAGACATCACTGTTGAGGAAGCTCATACAGTCATTACAGAATATGAAGAATTGGTTGATGAATTAAATCGTATTTTCTTGGAAGCACAAACTGAATTACAACAAGACTTCGATGAGTTCAAGAAAAATTACGATACGAGGTACAATAACTACATTACTGATCTTACGAATAAGATTAATGCTGCTCAGAATAAAATCGATATTTTAAACAGTAATTACGATAAAGCTAACGCAAAACTCACTGACCTAGAAGAAAGAATGAATGATTTAGTGAATAAAGGGTTACTAAAAATGGAAGATGTGCTTTCATTCTTAGGTGGTAAAAATGTTAAAATTAAGGTGCCTATCGATTTTACTGGAAAAATTAGAGAGTCGACTGTTGAAAATCCCAACGTAATGAAACTTAGCACAATGCCCGCTACCGACATAAACATCGTCGCGACAGCAACATCTGGAGAGGAATTATCTTCTGATGATGCAGAAGCAACAATGTGGAATAACTATAAAAGTGTTTCTGCATTAGATGGGAAACTTGCTCAAGCACAACAAATGTTAAATGGCTATGTTACTTATCATTTAGCAAGAATTGATGCAGTGTCAGAAATCAGTCGTCGTTTTCCAAACTTATTCATCAATGTAGGAGCAACTACTCGTTCACAACAAAAAGAACAATTAATAAAGAAAGCTACTTTTGTTAGTGCAACTGCTTATGGCTTCGGATCAGTAGGAGATGTATATAAATATACAATTGGCCGATCTAACTGGACGACAACTGGAACGACTTGGCAAGGTTGGACTGGTTGGGGCATTGATAATAATAGTCACAGTTCTTCCAAACCTAATCCTGTAACAGCAGGTGTAGGATCTGTTAACACAATAATGGATGAAAATGGAGTTATGGCTTTTATCATGGGCGTACCTACTCCGTCGGATGGAACGAAAATGTTAAGAACAAATTTAGATTATTTCGTTTGCGAAATAACTTTAAATTTAAACATTAATGATCTAATTCCTAAGCCAGACTTAAGTAAGTATTATACCAAGGATGAAATGAATGAAGCTTTTACTGAACATTCATTATATTCTAATTCATTAGACTTTGGTAACTATGATTATAGTGGGAATCCGAATTTAATGGCTAATATAAACGCTGACAGCTTCTCGCAAGGTACTGGTGCTTTATCTGTTGTGGATGATGGTGACGAGGTAGTAGTCACACTTGACCCAAACAATAAATTAGATTTATTCAAAACGAAAAGTCAACCAGCTTTAGTAGTAGGAAAAACATATACTCTGAGTGCAGAAATTATGTTAGAAGATGATTTCACTGGAGACCCTAGTAAGTTAAGTCTAAGATATATTAAAATGCCCAACTGGTTATCAGCACTAACAACGCGTTTTACATTAACTAATGATAAAGGCGTATGGCAAAAGGTAACTATTACTGATACAATGACTACTGCGATTAATGACGCTGAAAGCTGGTTTATAATGCTCCACAATAGGGACGTTAATAACAGTCTATCTGGCAAGCTACGTTTGAGACATGTTAAGATTGAAGAAGGCTCAACAGCCACACCTTATCAGCCTAATTTACTAGACGTACCATATTATTTGAGTAAAGTGGCTTTGGGTGAAAATATTGCTAATAAGTCTGTTGCGTTTCCAATTAAATCTAGCGCGTTCAATATATATGAAGGTAACATGGAAGAAGATTTTATGATAGGTCAAACGTATACTATCACGCTTAAAGGAACAAAGCCAGCAAGTCAAACCTTTAGAGCGTATAACAACTCGACCGTTAACTTCGGTGAGCTAAAACCAGTTGAGGGATTGACAGACGTATGGTCTCTAACATTCACACCGACGAAACTTGACCCGGATTTTCCTAAAAACCTTAGAATTTATCAGTTCTTTAAAGAAACATTAGGTGCATGTCAAATCGACTGGCTCAAGATCGAAAAAGGTGATACACGAACACCAAATTTAAATGATCCTTTTAAATATAAGGGAATTGGTTTTACTAAGTCATCTAATCCTAAAGATTATAATTGGAACAGTGCTCCCGAAAATGTAGATTTCATTAAAGAAAATGCAGCTTCAAATGAAGCAAGAATTGATGAAATTGATAAGAATGTAGTGAAAACTTCAGGTAATCAAAATATCACCGGTCTTAAAAACTTTACAGGCACACTTCAAAGCAGCGGGGTCGAGGTTGCTAAAAAAGGTGATTCATATACGAAAACTGAAACGTATACGAAAACTGAAGTAGATTCAAAATACATTCCAAAAACACAAGAAAATACATTCGTAAAAACTATTGGAAATCAAAATGTTGTAGGAACAAAAAATTTCAGTGATCCAAGAAAAAATGACGCTTTAATGTATGCTCTTACTGATGAAGCAATGCGCCCGTCAGATTTTAACTTCGCTGGTAATTTTACTAAAGTTATGACAGCGCGCTCAATGAGAGTTATGCAAAGACGTTTACCTTGGATGAAAACGTTTGGTTGGTTTGGAACGGGTGAAGGATCAGCGAATGATATTGACGAAGGATTTAAGCAATACATTCAAACGAACACAACGACCGATGCTGACATCACTAGTTATCAATTCATTAGAAAAGGACGGAAAGTACAATTCTTTGGCCGAATTAAATTTACTAGCGCCACAGGAACAGATGTTGTTACTTTTGCGCAGGTTCCTACTGGTTTTCGCTTAAGCAATGCAGCAAAATATACTTATTGGAATGTTCCTTTAACATGTGTTCAATATAATGCTCCAGAACGCATTAATTATAAAGGTTTCGTTGAACGATTAGGTACAAACAATATTAAAATTGGCACAGCAACTTACACAGGAAACACTTATTGGTATGGAGAATGGGAAACATCTGACCCTTACCCAACAAGTTTTACTGATGAAGTAACTGAGCGAATGATGGCTCATCGAGGAGCTACGGTATCATATCCTGAAAATACTCTTGAGGCATTTAAAGCTGCGATTGACTTAGGATATGGTGGAGTAGAATTGGATCCTCGTTTAACTAGTGATGGGAAATTATATTTAATGCATGATGACACTGTTGATCGAACAACTAATGGAACGGGTAATTTTGCAGATTTAACTGAGGCTCAAGTTAAAGCATTAAATATTAAAATTGATCCAGTAAAATATCCTAATCTTGTCGGTAAAACACTTAAAGTTCCTTCATTATCATCTGTTCTTTTAGCATTGAGAGGAACCGATTTAACAATCAATTTTGATGGAAGTAAAATTGACTTAAGCGTTGCATCAACTGCAAAAATGATTCATGATATGATTGTAAGTTATGGTTTAGAAAAACGAGTATTTTTCGTTATCTCTAATAAAACGCAACGAGACGCTTTTCATAAGCTTTATCCTCAATATCCTGTTTCATGGCTTTGGAATAGCCCAGGATCTAGAGCTGCTGGAGCAGTAAATGAAATTTATGCATATGGAAAACATGGAGGAGCACTCCTTTCAATTCCTATGGCCGTTTTAAATGATGATACGTCTATGAGAGACATTCAAGCATCAGGTATTTATTATCAGGTTTATGGTGTTCAAACTGAAGCCGATTATGAAACATGTAGATTAATGCGTGTTCCTATGATCGAAACTGATCAACTATATCCTAATTTAGATTTTTTATAA

Genome Context

Tertiary structure

PDB ID

ab9bb58e0f35f7f7b1bb43112fe2e0efbcd177de04b580c99a61f0794d26d198

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6587

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence