Protein

View in Explore

Genbank accession

XPP60774.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence RBPdetect

Probability 0,57

Protein sequence

MAFAPTLTPARIDHMGHMQVPHDIFVYVTTVEGWSLDIENYQPANRQHYLQSILYWMDLNAACIIRSASDSRFAAIKDITQCATILYGKQNVSGDTDPVPVSDFTLSVDPVSGRLPRPVTATLTLNPAHNIPLIRVDWGDGSAPVIVTATGSEVEVSYVYALGASTVTAVTAQAWDRKLEIGVGELHTQAVEFEEPPVSNFMINVIPDRETSPVTATMEITLGADHTAFPIEVSYGDGTGYRIESDTQRPVTTLTHAYAEDAEGEFLVTAQAVDEAMGGIPVGPLQSVTLTIVAPPAPVSDFTIDMQPTSGYVPLTATLTITCTAAHTAPSVEVNWGDGTLPSTIATGPSAVVTLTHLYTQGPFGTVSVQAQSKEGGDKFGEELTETIEVKDPPVANYTSTVTPLQAYLPTSVTLVLTPAANHNVPYIFVNWGDGTAVEKVSVTPSVATNVVHAYNGIGRVSAISLQPSNDIDGTELIGSARNIAVSYRVRPVAGISLALDQTDVVQPATVTATVTTDASNTVEVVEINWGDGSGVETITGLARSGTYTKTHTYNTGSNQTVNVSAQGIENDPIGGRIPVGGLVQTPLTLRIPLVANFNATITPTSGTLPLATTLTITTGATNTAPTYEVDWGDGTAKSSTSVTANDTKTLAHTFALGTSPKRTVTIQGKDGSGVNVGTAKTIEVTLAEPAVAAFTLSIDPTNATTPVFVTATLVASSTHTAPTITVDWGDGSGASIVPIVANETKTVGHTFTVAGTINIVAQAKSSDNAAVGSPRTSVLTLKAPPVSNFTQSLSPTSGTTPLEVTATVIAGSTHTAPTVTIDWGDGTTGSFVNIAAGETKTATHTYAAGLSGVKTVTFQAKDGNTVVGSSQASTVSLSLPVTASFTFTVLPTSGTLPLPVQVTLNTGADNTVPKIRVDWGDGTAVTDVVVGVSDTKTANHTYAVGTNPSKTITMTGLNSSNTPVGTAKTQVVTLNEPPVIPSNGPGPGELIAGDANAGLFGDLSVSELVTIEQIEALATVALPGTATNRSVTNLWVKYSFNNKILYIPKRPVRGGLNWNDIYKAGFVYGTDNNGLYPGANTPTNQLKIVEKLDSSGKTWRFKVRLISVVAADPTSAWAATDAVTRNSEFAKLVERTVPSVNVDIVWASYGNMGTVVGQSTWSAATEYSIMAGINTNAYSRQQVQKISNTAWLPVLELIPD

Physico‐chemical properties

protein length:	1201 AA
molecular weight:	125402,95930 Da
isoelectric point:	4,81622
aromaticity:	0,06245
hydropathy:	0,03239

Domains

Domains [InterPro]

IPR035986
STR
99–161

IPR035986 IPR035986 IPR035986 IPR035986 DC_0638

IPR035986
STR
355–459

IPR035986 IPR035986

XPP60774.1

1 1201

Architecture

STR

ATT

STR 99-161 | STR 263-459 | STR 551-647 | STR 652-867 | ATT 943-1201

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR035986	STR	IPR035986	99	161	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
IPR035986	STR	IPR035986	263	371	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
IPR035986	STR	IPR035986	355	459	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
IPR035986	STR	IPR035986	551	647	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
IPR035986	STR	IPR035986	652	769	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
IPR035986	STR	IPR035986	747	867	Merged direct domain	PKD domain superfamily	Central	Low	Positional only	4 proteins / 4 hits
DC_0638	ATT	DC_0638	943	1201	Novel HMM	DC_0638	N-terminal	Low	Positional only	20 proteins / 20 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XPP60774.1

1 1201

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	19	19	0,6821
Central domain	20	1000	982	0,0752
C-terminal	1001	1201	200	0,9878

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-19

Central
20-1000

C-terminal
1001-1201

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage Milchi [NCBI]	3374953	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

XPP60774.1 [NCBI]

Genbank nucleotide accession

PQ464597 [NCBI]

CDS location

range 118915 -> 122520
strand +

CDS

ATGGCATTCGCACCCACACTAACACCAGCACGTATTGACCACATGGGTCATATGCAAGTGCCGCATGACATTTTTGTCTATGTGACCACTGTTGAGGGTTGGTCTCTTGATATCGAGAATTACCAGCCAGCAAACCGTCAGCATTACCTACAATCTATCCTGTATTGGATGGATCTGAATGCTGCATGTATCATTAGATCTGCATCAGACTCAAGATTTGCTGCTATCAAGGATATCACACAATGTGCTACCATTCTATATGGTAAGCAAAACGTAAGCGGCGACACAGACCCAGTTCCTGTTTCCGATTTTACACTATCGGTTGACCCGGTTTCTGGTAGACTTCCAAGACCAGTTACTGCTACACTTACACTTAACCCGGCCCACAACATTCCGTTGATCCGAGTTGATTGGGGTGATGGTTCGGCTCCAGTGATCGTAACTGCTACTGGCTCCGAGGTAGAGGTTTCTTATGTCTACGCACTTGGTGCGTCTACAGTAACTGCTGTTACTGCTCAGGCATGGGATAGAAAATTGGAAATTGGTGTAGGTGAACTACACACCCAAGCCGTTGAGTTTGAAGAACCACCAGTTTCAAATTTCATGATCAATGTGATCCCAGACCGTGAAACGTCTCCGGTTACCGCAACCATGGAAATCACACTTGGTGCTGATCATACAGCATTCCCAATTGAAGTATCGTATGGTGATGGTACAGGCTACCGCATCGAATCCGACACACAGCGTCCAGTTACAACACTGACCCACGCTTATGCGGAAGATGCCGAGGGTGAATTCCTAGTCACCGCACAAGCAGTTGATGAGGCTATGGGTGGGATTCCTGTTGGTCCGCTACAAAGCGTTACACTGACAATCGTGGCACCACCAGCACCTGTATCAGATTTCACTATTGATATGCAGCCGACTTCTGGTTATGTTCCACTGACAGCAACACTGACTATCACATGTACAGCTGCGCACACCGCCCCAAGCGTTGAAGTTAACTGGGGTGATGGTACACTACCTTCGACAATTGCTACAGGCCCAAGCGCTGTTGTAACATTGACACACCTTTACACCCAAGGACCATTCGGTACTGTAAGTGTTCAGGCTCAGTCGAAAGAGGGTGGTGATAAATTCGGTGAAGAACTTACCGAGACTATTGAGGTTAAAGATCCTCCTGTAGCGAACTACACTTCGACGGTAACCCCGTTGCAAGCGTACTTGCCAACATCGGTAACACTTGTTCTGACACCAGCTGCAAACCACAATGTCCCATACATCTTTGTAAACTGGGGTGATGGTACTGCGGTTGAAAAAGTTTCGGTTACACCATCGGTAGCTACTAACGTAGTCCATGCGTATAACGGTATCGGTCGTGTTTCGGCAATTTCTCTGCAACCATCTAATGATATTGATGGTACTGAGTTGATTGGTAGTGCAAGAAACATTGCGGTTTCGTACCGCGTTCGTCCGGTTGCTGGTATTTCACTTGCATTGGATCAAACTGATGTAGTGCAACCTGCTACAGTTACAGCGACAGTTACCACTGATGCATCAAACACTGTTGAAGTGGTTGAAATTAACTGGGGTGATGGATCCGGTGTTGAAACAATCACTGGTCTTGCAAGATCTGGCACATATACCAAGACTCACACATATAACACTGGATCAAACCAGACTGTTAACGTGTCGGCTCAAGGTATTGAAAACGATCCTATTGGTGGAAGAATCCCTGTAGGTGGACTTGTTCAAACTCCGCTGACCCTGCGTATTCCGCTGGTTGCGAATTTCAACGCTACGATTACACCAACATCAGGTACGTTGCCACTGGCTACAACCCTGACTATCACTACAGGCGCAACTAACACTGCTCCTACGTATGAAGTCGATTGGGGTGATGGTACTGCGAAGTCCAGCACATCGGTCACTGCAAATGATACAAAGACTTTGGCGCACACATTCGCATTGGGTACATCCCCTAAGCGTACTGTTACCATCCAAGGTAAAGACGGTTCTGGTGTAAACGTTGGTACCGCTAAGACAATTGAAGTTACACTGGCAGAACCAGCTGTAGCCGCATTTACATTGTCTATCGATCCGACTAACGCTACAACTCCTGTATTTGTTACCGCAACTCTTGTTGCTAGTTCGACCCATACTGCTCCAACAATTACTGTTGATTGGGGTGATGGTTCCGGTGCATCGATTGTTCCAATTGTTGCTAACGAAACTAAAACAGTAGGTCACACATTTACAGTAGCTGGTACTATCAACATTGTTGCACAAGCTAAGTCTAGCGATAATGCAGCGGTTGGTTCACCTAGAACTTCTGTATTGACACTGAAAGCTCCACCTGTATCAAACTTTACACAATCACTCAGCCCTACCTCCGGTACTACACCGTTGGAAGTGACTGCAACGGTAATTGCCGGATCGACTCATACCGCTCCGACAGTAACAATTGATTGGGGTGATGGTACAACAGGGTCTTTCGTGAATATTGCAGCTGGTGAGACTAAAACAGCTACACATACCTATGCAGCTGGTTTGAGCGGTGTTAAAACTGTCACATTCCAAGCAAAAGATGGTAATACTGTAGTTGGTTCTTCTCAAGCTTCAACTGTGTCACTGTCCCTACCGGTAACAGCGAGTTTTACATTCACTGTTCTTCCGACTAGTGGTACACTACCTCTGCCTGTTCAAGTAACATTGAACACTGGTGCTGATAACACAGTACCTAAGATCAGAGTTGATTGGGGTGATGGTACGGCGGTAACTGATGTTGTTGTCGGTGTATCGGATACAAAAACTGCTAACCACACTTATGCGGTTGGTACTAACCCAAGCAAAACTATTACCATGACCGGGTTGAATTCTTCGAATACACCTGTCGGTACTGCCAAAACTCAAGTGGTAACACTTAATGAGCCACCGGTAATACCTTCGAATGGTCCGGGTCCAGGTGAACTGATTGCTGGTGATGCTAACGCTGGTTTGTTTGGTGATTTGTCTGTCAGCGAACTTGTGACAATTGAACAAATTGAAGCTCTTGCTACAGTCGCCCTACCGGGTACTGCGACAAACAGATCGGTTACTAATCTATGGGTTAAATACTCGTTCAATAACAAGATCCTGTATATCCCTAAAAGACCTGTTCGTGGTGGTCTGAACTGGAACGACATTTATAAAGCTGGTTTCGTGTATGGTACAGATAATAATGGACTATACCCAGGCGCTAACACGCCGACGAATCAGTTGAAGATTGTTGAGAAGCTTGATTCGTCTGGTAAAACATGGAGATTTAAAGTTAGACTAATCTCTGTAGTTGCCGCTGACCCAACATCTGCTTGGGCTGCAACTGATGCGGTAACCCGAAATTCGGAATTTGCCAAACTGGTTGAGCGTACAGTACCATCTGTTAATGTTGATATTGTGTGGGCATCTTACGGTAATATGGGTACTGTTGTTGGTCAATCAACTTGGTCGGCTGCAACAGAATATTCGATCATGGCCGGTATTAACACAAATGCCTATTCCAGACAACAGGTCCAGAAGATTTCTAACACGGCGTGGTTGCCAGTATTGGAACTCATCCCGGACTAA

Genome Context

Tertiary structure

PDB ID

68423ede33db897d0c9f4cc716a5658b9a0c4ca552bf68580bb209f70b14ba03

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,3108

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence