Protein

View in Explore

Genbank accession

YP_009300708.1 [GenBank]

Protein name

tail protein

RBP type

Evidence RBPdetect

Probability 0,53

Protein sequence

MPTYNQIPAVDENFNLPPEVRAAFSSSSDLQAAIASKIASDPNVLAAAANVAQSTAGLIPVWKANTAYTANQKVIAPDGAIVSAKTTFTSGSTYDSTNWVISEQFHNKGLLPDGTDFNNLKNLSDVGEWYVATATNLATMANAPSGATAPFIISIRRGPIGYSYTKQIVWSMGISTATYERSMSSGTTWNPWTQPSWIKATLSANTDIDALVDGIHKVASSSVSTTFVNVPALPSYAAVAGTLEKVTVGNNKSLVWTTTNSPFGMFVLLLTHNGTAWANEWRLISTNIPPSETAYTTLDAMSEGTHRITSTPKVTQLGLPENRSGIVTIVDPRTDTRTAKFETIDGNIYYNRRVNNIWGSWVLIVNAKASAMSTPSGWKTVPLALTSSRATLNAPLMGTWRLPLLWAIPSRRFRVRISLRNGRYDGLVQGGGVTLNKVYFGDQGTGNTFKSAPFKIAENVNIPDNGDAWISSWIDLPVGDNVPRMFSFTYTATTAPTYMVSYGYEHVGVDVAADLAPSGGTIKSAVPLDIHFETEIPTTVPIVAVVGDSKSNGTGTSRSLIDSTISQWARANVAAPMHLSSSGDTLANFALGTWKLNRWDGVTARPDHVILELGINDLISGNAAQMAVDRATIIGKIQQYLSNDISLVTIAVNEAHNSSQLAERKAYNNALRTALPSTVTRLFDFDSVISLSDTQIRDEYDFDGLHLNVAGYAAEASILRSVVGTAFSNLSEVPGFVAKWRPSTMYALNQWAISPRGNLMICTTPHTSTTTFSTANEANWAILNPSSRGWLPTGADLNTFIDAGTWVIPNQATADSIVNWPAGLTRAPGIFVVEGDYRFGSTIVFMQTLWTYGSNNPGKRERSKLSGATGAWNNWIDPYAMTDISGAMTSDYAMSNMALRDAFIRRRGGSLGSNGVAVLALRWDHGAVPFRDKLLPKLLEKNLPSSFVINPSAYRLGLAENLGVTWDDYNYWAKHYGIEFVDHGMDHLDAADTAALKVQILDSKDLLQTNIPTQSIDLYSPPGVTGTGLLDPWVGTSSPDYFTAKWEPARYVLESHAFSSGYGPGLYRDLDGNPSNGETHWTMDNETSSAAMITRIQTAQSLGSGIQLMLHPSQVDLTGKITLATFNEIMDFIAAERDAGRLIVTTMGGLFMANSRSSFRHNMLRNPSFNGTIGWNSTGYTLSEGVAQSNTSAGLLSQTIDLTNRAFFAGAHREITAKFTADASGAVVRLRLVHTAAGIDVDKQITLAANETKTLRIHALMPIWSGSNLPVFYAGRVSGGAVKVEDVGVLAV

Physico‐chemical properties

protein length:	1292 AA
molecular weight:	139417,23560 Da
isoelectric point:	6,08742
aromaticity:	0,09056
hydropathy:	-0,09303

Domains

Domains [InterPro]

DC_0445
STR
1–194

DC_0445 IPR036514 cd19958

cd19958
STR
108–194

cd19958 SSF52266

DC_0445
STR
169–690

DC_0445 DC_0445

cd00229
ENZ
543–722

cd00229

IPR013830
ENZ
545–714

IPR013830

YP_009300708.1

1 1292

Architecture

STR

STR 1-1148 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0445	STR	DC_0445	1	194	Novel HMM	DC_0445	Central	Low	Positional only	17 proteins / 17 hits
cd19958	STR	DC_0464	108	194	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
DC_0445	STR	DC_0445	169	690	Novel HMM	DC_0445	Central	Low	Positional only	17 proteins / 17 hits
IPR036514	STR	IPR036514	530	728	Merged direct domain	SGNH hydrolase superfamily	Central	Low	Positional only	180 proteins / 180 hits
SSF52266	STR	SSF52266	543	721	Merged direct domain	SSF52266	Central	Low	Positional only	227 proteins / 227 hits
cd00229	ENZ	DC_0001	543	722	InterPro cluster	cd00229	C-terminal	High	Text match	480 proteins / 783 hits
IPR013830	ENZ	DC_0001	545	714	InterPro cluster	SGNH hydrolase-type esterase domain	C-terminal	High	Text match	480 proteins / 783 hits
DC_0445	STR	DC_0445	706	1148	Novel HMM	DC_0445	Central	Low	Positional only	17 proteins / 17 hits
cd19958	STR	DC_0464	791	875	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Arthrobacter phage Mudcat [NCBI]	1796997	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

YP_009300708.1 [NCBI]

Genbank nucleotide accession

NC_031224 [NCBI]

CDS location

range 14819 -> 18697
strand +

CDS

ATGCCCACATACAATCAGATTCCTGCAGTTGATGAAAACTTCAACCTCCCTCCAGAGGTTCGTGCAGCTTTCTCTTCATCAAGCGACCTTCAAGCAGCTATAGCGTCTAAAATAGCGAGCGATCCAAACGTTCTTGCAGCTGCAGCAAATGTTGCACAATCTACCGCAGGCCTTATTCCTGTATGGAAAGCTAATACCGCCTACACGGCAAATCAGAAAGTAATCGCTCCTGATGGAGCTATCGTTTCAGCTAAAACAACATTTACTTCTGGTAGCACGTATGACTCAACTAATTGGGTAATTAGTGAGCAGTTTCATAATAAGGGTTTGCTTCCCGATGGTACAGACTTCAATAATCTGAAGAATTTGTCTGATGTTGGTGAATGGTATGTAGCTACAGCTACTAACCTGGCTACCATGGCTAATGCTCCATCCGGCGCAACAGCACCATTTATAATTTCGATTCGTCGAGGACCAATTGGATATAGCTATACAAAACAAATTGTATGGTCCATGGGTATTAGTACAGCTACTTATGAACGAAGCATGTCCTCTGGAACAACATGGAATCCCTGGACTCAACCTTCATGGATTAAGGCTACTCTCTCAGCAAACACTGACATTGACGCACTCGTTGATGGCATTCATAAGGTTGCTTCATCGTCTGTATCGACCACGTTTGTTAACGTTCCTGCGCTCCCAAGTTATGCTGCTGTAGCTGGAACTCTTGAAAAAGTTACTGTTGGAAACAATAAGTCTCTAGTTTGGACAACAACCAACTCGCCTTTCGGAATGTTTGTGTTGTTGTTGACGCATAATGGTACTGCTTGGGCAAATGAATGGCGTTTGATTTCGACAAACATACCTCCCTCGGAAACAGCGTATACAACTCTTGACGCTATGTCTGAAGGTACGCATCGAATTACTAGTACTCCTAAAGTAACTCAACTGGGTCTGCCTGAAAATCGCTCAGGTATTGTAACTATTGTGGACCCTCGAACCGATACTCGAACCGCAAAGTTCGAAACTATTGATGGTAATATTTACTACAATAGGCGAGTGAATAACATTTGGGGATCTTGGGTACTCATTGTTAATGCTAAGGCCTCAGCAATGTCTACGCCATCGGGATGGAAAACTGTACCGCTAGCACTGACTTCTTCTCGGGCAACCTTAAATGCGCCACTTATGGGCACTTGGCGTTTGCCTTTGTTGTGGGCTATACCAAGTCGGCGATTTAGAGTTCGAATCAGTCTTCGTAATGGCCGATATGATGGTTTGGTACAAGGTGGCGGCGTAACACTTAATAAAGTGTACTTTGGTGATCAAGGTACTGGAAACACATTTAAATCTGCCCCATTTAAAATAGCAGAGAATGTAAATATTCCAGATAATGGAGATGCATGGATTTCTTCATGGATTGATCTCCCAGTGGGCGATAATGTGCCTAGAATGTTTTCCTTTACATATACGGCTACAACTGCGCCTACCTATATGGTTAGTTATGGTTATGAGCATGTTGGGGTTGATGTTGCTGCAGATCTTGCTCCATCTGGTGGAACAATTAAAAGTGCAGTACCTTTGGATATCCACTTTGAAACGGAAATTCCAACAACTGTGCCAATTGTAGCTGTTGTTGGAGACTCTAAATCTAATGGTACTGGTACCTCTAGGTCTCTCATTGATTCGACAATTAGTCAATGGGCTCGAGCCAATGTAGCAGCACCAATGCATCTTTCTTCTTCCGGCGATACGTTAGCGAATTTTGCATTGGGTACATGGAAGCTCAATCGTTGGGATGGGGTTACTGCTCGTCCGGATCATGTCATTCTTGAATTGGGGATCAACGATCTTATCAGTGGTAATGCTGCGCAAATGGCAGTCGATCGAGCAACTATTATTGGGAAGATTCAACAGTATCTATCTAATGATATTAGTTTGGTTACTATAGCTGTTAATGAAGCGCACAATTCGAGTCAATTGGCTGAACGTAAAGCTTATAACAATGCTTTGAGAACGGCGCTTCCTTCAACCGTAACTCGCCTTTTCGACTTCGATTCAGTCATTTCACTGAGCGATACTCAAATTCGAGACGAATATGACTTTGATGGCTTGCATCTTAACGTTGCTGGATATGCGGCAGAGGCAAGTATTCTTAGAAGCGTTGTGGGAACTGCATTTTCTAACTTGAGCGAAGTTCCAGGATTTGTTGCTAAGTGGCGTCCTAGTACAATGTATGCTTTGAATCAATGGGCTATATCTCCTCGTGGCAACTTGATGATTTGTACTACACCCCACACGTCAACAACCACATTTTCTACTGCGAACGAAGCAAACTGGGCAATTCTTAATCCATCAAGTCGAGGTTGGTTGCCAACTGGAGCCGACCTTAATACTTTTATAGATGCTGGAACTTGGGTTATTCCTAATCAAGCGACAGCGGATTCAATTGTAAACTGGCCTGCTGGATTGACTAGAGCTCCAGGTATATTTGTGGTTGAGGGCGATTACCGATTTGGTTCAACGATTGTATTTATGCAAACACTCTGGACCTATGGTAGTAATAATCCTGGAAAACGAGAGCGATCTAAACTTTCTGGTGCTACAGGTGCTTGGAATAATTGGATTGATCCATATGCAATGACTGATATTTCCGGTGCTATGACTTCGGATTACGCTATGTCTAATATGGCTCTTAGAGACGCATTTATTCGTCGTCGTGGAGGATCTCTCGGTTCAAATGGTGTAGCAGTACTTGCACTTCGTTGGGATCATGGAGCAGTTCCTTTCCGGGATAAGCTTCTGCCTAAACTGCTAGAAAAGAATCTCCCCTCTTCCTTTGTGATCAACCCGAGTGCATATCGTTTGGGACTTGCTGAAAATCTCGGCGTTACTTGGGATGATTACAATTACTGGGCAAAACATTATGGTATTGAATTTGTGGATCATGGTATGGACCATTTGGATGCGGCTGATACAGCAGCTCTAAAGGTTCAGATTCTGGACTCAAAGGATTTACTTCAGACGAATATACCAACTCAGTCCATAGATCTGTATTCTCCTCCTGGAGTAACAGGTACTGGCCTCTTGGACCCATGGGTTGGAACGAGTAGCCCCGATTATTTCACAGCAAAGTGGGAACCTGCTCGGTATGTTCTTGAAAGTCATGCATTCTCCAGCGGATATGGTCCAGGTCTTTATCGAGACTTGGATGGTAATCCGTCAAATGGTGAAACCCATTGGACTATGGATAATGAAACTTCATCTGCAGCAATGATTACTCGAATTCAAACTGCGCAATCACTTGGATCGGGTATTCAGTTGATGTTGCATCCATCCCAGGTTGATCTGACTGGTAAAATCACTCTCGCTACATTTAATGAGATCATGGATTTCATAGCAGCAGAGCGTGATGCTGGACGTCTTATCGTTACAACTATGGGTGGATTGTTCATGGCAAATAGTCGGTCATCTTTCCGTCACAATATGCTTCGAAATCCCAGTTTCAATGGAACTATTGGATGGAATTCAACTGGCTATACTTTGTCTGAAGGAGTTGCTCAGTCAAATACCTCTGCCGGACTCCTAAGTCAAACAATTGATCTTACAAATCGAGCATTCTTTGCTGGTGCTCATCGTGAGATCACGGCTAAGTTCACAGCAGATGCTTCTGGAGCAGTTGTTCGACTTCGGTTAGTTCATACAGCAGCTGGCATAGATGTCGATAAGCAAATTACTCTTGCAGCAAATGAAACGAAAACTCTTCGCATTCATGCATTGATGCCTATCTGGTCTGGATCTAACCTTCCGGTATTCTATGCGGGTCGAGTTTCGGGTGGAGCCGTTAAGGTTGAGGATGTCGGTGTTCTAGCAGTTTAA

Genome Context

Tertiary structure

PDB ID

8b6f260f3d52754bc78ae002c45f32b94304524bfc961c2ac0122336a5a26d00

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,8014

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence