Protein

View in Explore

Genbank accession

AVP41361.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,52

Evidence RBPdetect2

Probability 0,96

Protein sequence

MPIPSGVETVTVSSGEPMTTPDGSFMRGHIRFVAPPLAVAPSDDYTFGGEAVAELVDGEFSIVLVAPDATGINPTGWTYTVIGEFTNAPDWETFIDISKDDPSVVFSDVVETAGTDPSFATIFVRKDGDTMTGPLILAGDPDLELEAATKQFVDNKDAQNVKLTGNQTVAGIKTFTSIPVGPAANPTDANQLARKAYVDLTQAEVDNLETEVANLDAQNVKITGDQTVNGVKTFGSIPVLPGSDPVAANEAVRKAYVDALDAQNVKITGVQSVAGAKTFTDPFKVQSALDTNLLTVQQDNTGANAGVMRLVAGHSAQQAFLGTFQGAAANSWAIRADGRFEVGSGAGARDALIARAGVGVFEVTNQIRALGATPLTAADLTRKDYVDTADNLRLLKANNLSDLVDAGDARDNLGLGNSAVLDVGMVQNTVADGEALGYNSGIILGGELSVNGSNPLHLDIGATVGFVVDYTTNPSAPTIVRVSTSPQTIPLADTVNPITWWLMDQTGVVTQQSTRPTNTQRRTHLQLGATVQTGGVAIIIDQSLPVSLAQPVNQLYDLMYALGSFSIEGNQLATNGANLTFSKTAGTVFAPSFNRFAGSTLTKDPHVSPIAAQAPVQLRYILRSTNPVPPTQTNINPGLYDVANVATAIPGGANTSTIQRVYAFPLNATADQIVIQYGQNLYSSLDLAVAAIQTETHIVNPTARDNGILLGFIVVTKSATDLTNPSHARFVQAAKFSSGSAGSGVADLSGFALLSGANFTGLVSGTLASAITVANSSLVTGDTFDRFRRFADGAMEWGSGTGARDVSLSRSSADNMTSPDTWNFGEATLGTTANVVNRQTAMKASTFIAQSDFRVAHRGSGDEFPEHTLAAYESAVAAGATAIEVSCQLTADGVLVAFHDTDLERMTGVTGSSIGAMTYAALREQVRVNAKGYLGDGWSLQEVPTVREVLDRFFGRVVIFIEPKTNPAVTPLQNLLTGGSYPRANQTVVWKVHYTSPSKTWAITNGFLVWSYIDTGTTAAQMDAVDAQTTFWGVPIEATDAKITEVVSRPGGKPVMVWAIRRRYDYDRVHALGVKGKMTSNWLYNYNNPVLPASRWELHKTVEPGTLGRVKENANYALHYDANGRAYIPAAVLPNNAVLMGGRAASIAQAAGTYKISYTMTWDTIPGSNLHSGIAFAKPDDREYIFSAANVSGGYHVVFRNTGQLQLYRHDAGNPTGVLLANLATTSTPSPGVPMTFEVDVTPTTVSVTRTDSGGPYTVSSNDTTYRGRYWHLSAGSVALDAEKPFWEDVNLA

Physico‐chemical properties

protein length:	1293 AA
molecular weight:	136752,21190 Da
isoelectric point:	4,95701
aromaticity:	0,07811
hydropathy:	-0,06736

Domains

Domains [InterPro]

DC_1109
ATT
1–239

DC_1109 DC_1977 IPR017946 DC_1530

G3DSA:6.10.140.2190
STR
144–180

G3DSA:6.10.140.2190 G3DSA:6.10.140.2190 IPR030395

Coil
Unmapped
198–225

Coil PTHR46211

DC_1293
STR
202–352

DC_1293 IPR017946

IPR030395
ENZ
857–975

IPR030395

AVP41361.1

1 1293

Architecture

ATT

STR

RBD

ATT 1-239 | STR 240-456 | STR 850-1086 | RBD 1087-1293

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1109	ATT	DC_1109	1	239	Novel HMM	DC_1109	N-terminal	Low	Positional only	79 proteins / 79 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	144	180	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
G3DSA:6.10.140.2190	STR	G3DSA:6.10.140.2190	197	239	Merged direct domain	G3DSA:6.10.140.2190	Central	Low	Positional only	15 proteins / 15 hits
Coil	Unmapped	-	198	225	Coils	Coil	-	-	-	-
DC_1293	STR	DC_1293	202	352	Novel HMM	DC_1293	Central	Low	Positional only	22 proteins / 22 hits
DC_1977	STR	DC_1977	346	456	Novel HMM	DC_1977	Central	Low	Positional only	41 proteins / 41 hits
IPR017946	STR	IPR017946	850	1085	Merged direct domain	PLC-like phosphodiesterase, TIM beta/alpha-barrel domain superfamily	Central	Low	Positional only	31 proteins / 31 hits
IPR030395	ENZ	DC_0002	852	1089	InterPro cluster	Glycerophosphodiester phosphodiesterase domain	Central	High	Text match	63 proteins / 165 hits
PTHR46211	Unmapped	-	854	1079	PANTHER	GLYCEROPHOSPHORYL DIESTER PHOSPHODIESTERASE	-	-	-	-
IPR017946	STR	IPR017946	855	1081	Merged direct domain	PLC-like phosphodiesterase, TIM beta/alpha-barrel domain superfamily	Central	Low	Positional only	31 proteins / 31 hits
IPR030395	ENZ	DC_0002	857	975	InterPro cluster	Glycerophosphodiester phosphodiesterase domain	Central	High	Text match	63 proteins / 165 hits
DC_1530	RBD	DC_1530	1087	1293	Novel HMM	DC_1530	C-terminal	Low	Positional only	5 proteins / 5 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Streptomyces phage Yara [NCBI]	2126736	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AVP41361.1 [NCBI]

Genbank nucleotide accession

MH019215.1 [NCBI]

CDS location

range 20471 -> 24352
strand +

CDS

ATGCCCATCCCCTCCGGAGTGGAGACCGTAACGGTATCGTCTGGCGAGCCCATGACGACGCCGGACGGGAGCTTCATGCGGGGCCACATCAGGTTCGTGGCTCCGCCCCTCGCAGTTGCCCCGTCGGACGACTACACCTTCGGAGGGGAGGCGGTTGCCGAGCTGGTGGACGGCGAGTTCAGCATCGTGCTGGTCGCACCGGACGCAACCGGCATCAACCCCACCGGCTGGACGTACACGGTCATCGGCGAGTTCACCAACGCCCCCGACTGGGAGACGTTCATCGACATCTCGAAGGACGACCCCTCGGTCGTCTTCTCGGATGTGGTGGAGACGGCCGGGACCGACCCGTCGTTCGCGACCATCTTCGTCCGCAAGGACGGCGACACCATGACCGGTCCGCTGATCCTGGCTGGCGACCCGGACCTTGAGCTGGAGGCTGCCACCAAGCAGTTCGTCGACAACAAGGATGCCCAGAACGTCAAGCTCACGGGCAACCAGACCGTCGCGGGCATCAAGACCTTCACCTCGATCCCGGTCGGACCGGCTGCGAACCCGACCGACGCCAATCAGCTCGCTCGCAAGGCGTACGTGGACCTGACCCAGGCCGAGGTCGACAACCTTGAGACCGAGGTGGCGAACCTGGATGCTCAGAACGTCAAGATCACCGGAGACCAGACGGTCAACGGCGTCAAGACGTTCGGCTCGATCCCGGTCCTGCCCGGCTCCGACCCGGTCGCTGCGAACGAGGCGGTCCGCAAGGCGTATGTGGACGCCCTGGACGCGCAGAACGTGAAGATCACCGGAGTCCAGTCGGTCGCCGGAGCGAAGACCTTCACCGACCCGTTCAAGGTGCAGTCTGCTCTCGACACGAACCTGCTCACCGTGCAGCAGGACAACACCGGAGCCAACGCTGGCGTCATGCGACTTGTCGCCGGGCACTCGGCTCAGCAGGCGTTCCTCGGAACCTTCCAGGGTGCGGCCGCCAACTCCTGGGCCATCCGCGCTGACGGCCGCTTCGAGGTCGGCTCCGGTGCAGGGGCTCGTGACGCGCTCATCGCTCGTGCGGGCGTCGGAGTGTTCGAGGTCACCAACCAGATCCGTGCACTCGGTGCGACTCCGCTCACGGCTGCGGACCTGACCCGCAAGGACTACGTCGACACGGCGGACAACCTGCGCCTGCTCAAGGCCAACAACCTCTCCGACTTGGTGGACGCGGGCGACGCTCGTGACAACCTGGGCCTGGGCAACAGCGCCGTCCTCGATGTCGGCATGGTTCAGAACACGGTGGCCGACGGAGAGGCCCTGGGCTACAACAGCGGAATCATCCTGGGTGGCGAGCTCTCGGTCAACGGGAGCAATCCGCTCCACCTCGACATCGGTGCAACTGTCGGCTTCGTGGTTGACTACACCACCAATCCTTCGGCTCCGACGATCGTTCGGGTCTCCACCTCTCCGCAGACGATCCCGCTCGCCGACACGGTGAATCCCATCACCTGGTGGCTGATGGATCAGACAGGCGTCGTCACGCAGCAGTCTACGCGGCCTACCAACACCCAGCGCCGGACGCACCTTCAGCTCGGCGCCACGGTCCAGACTGGTGGCGTCGCCATCATCATCGACCAGTCCCTGCCGGTCTCCTTGGCTCAGCCGGTCAACCAGCTGTACGACCTCATGTACGCATTGGGCTCGTTCTCCATCGAGGGCAACCAGCTCGCCACCAACGGCGCGAACCTGACATTCTCCAAGACGGCTGGAACGGTGTTCGCTCCGAGCTTCAACCGGTTCGCCGGTTCGACGCTCACCAAGGATCCTCACGTCTCTCCGATCGCCGCTCAGGCTCCGGTGCAGCTGCGCTACATCCTCCGCAGCACGAACCCGGTGCCGCCGACGCAGACCAACATCAACCCTGGCCTGTACGACGTCGCCAACGTTGCGACCGCAATCCCTGGCGGTGCCAACACCTCGACGATCCAGCGCGTCTACGCCTTCCCGCTCAACGCCACGGCCGACCAGATCGTCATCCAGTACGGACAGAACCTGTACTCTAGCCTGGATCTTGCCGTGGCGGCGATCCAGACCGAGACGCACATTGTCAACCCCACGGCGCGCGACAACGGAATCCTGCTTGGCTTCATCGTCGTCACCAAGTCCGCAACGGACCTGACCAACCCCTCGCACGCCCGCTTCGTGCAGGCTGCGAAGTTCTCCTCTGGCTCGGCGGGCTCCGGCGTCGCCGACCTCAGCGGGTTCGCCCTGCTGTCCGGCGCCAACTTCACCGGCTTGGTGAGCGGTACGCTCGCGTCAGCCATCACCGTGGCGAACTCCTCGCTCGTCACGGGCGACACCTTCGACCGCTTCCGCCGGTTCGCCGATGGCGCGATGGAGTGGGGTTCGGGGACCGGCGCTCGCGACGTGAGCCTGTCGCGGTCCAGCGCGGACAACATGACCTCGCCCGACACCTGGAACTTCGGCGAGGCAACCCTCGGCACGACGGCCAACGTCGTCAACCGACAGACCGCCATGAAGGCGTCCACCTTCATCGCTCAGAGCGACTTCCGAGTCGCTCACCGGGGTTCTGGAGACGAGTTCCCCGAGCACACCCTGGCCGCCTACGAGTCCGCCGTTGCCGCAGGTGCCACGGCCATCGAGGTATCCTGCCAGCTCACTGCTGACGGCGTCCTGGTCGCATTCCACGACACCGACCTGGAGCGCATGACGGGAGTGACCGGAAGCTCCATCGGAGCCATGACCTACGCCGCTCTCCGCGAGCAGGTCCGCGTCAACGCCAAGGGCTACCTCGGAGACGGCTGGAGCCTCCAGGAAGTTCCCACGGTCCGTGAGGTGTTGGACCGGTTCTTCGGTCGCGTCGTCATCTTCATCGAGCCGAAGACCAACCCCGCCGTCACGCCTCTGCAGAACCTGCTGACCGGCGGATCGTATCCGCGTGCGAACCAGACCGTCGTGTGGAAGGTCCACTACACCAGCCCCTCGAAGACGTGGGCCATCACCAACGGCTTCCTGGTCTGGTCCTACATCGACACTGGCACGACGGCTGCGCAGATGGATGCGGTGGACGCGCAGACAACCTTCTGGGGCGTCCCGATCGAGGCCACGGACGCCAAGATCACTGAGGTCGTCTCCAGGCCCGGGGGCAAGCCGGTCATGGTCTGGGCCATCCGTCGTCGGTACGATTACGACCGAGTCCACGCTCTCGGAGTCAAGGGCAAGATGACCTCCAATTGGCTGTACAACTACAACAACCCCGTCCTGCCTGCAAGTCGCTGGGAGCTGCACAAGACGGTCGAGCCCGGCACGCTCGGGCGCGTCAAGGAGAACGCCAACTACGCTCTCCACTACGACGCGAACGGACGCGCCTACATCCCTGCTGCCGTCCTTCCGAACAACGCTGTCCTCATGGGCGGTCGAGCGGCCAGCATCGCACAGGCGGCTGGAACCTACAAGATCTCGTACACGATGACCTGGGACACCATCCCCGGCTCGAACCTCCACAGCGGGATCGCGTTCGCCAAGCCGGACGACCGTGAGTACATCTTCTCGGCGGCCAACGTGTCGGGCGGGTACCACGTCGTGTTCCGCAACACAGGCCAGCTCCAGCTGTACAGGCACGACGCGGGTAACCCGACCGGCGTCCTCCTCGCCAACCTGGCCACGACCTCCACCCCGTCTCCCGGCGTCCCGATGACGTTCGAGGTGGACGTCACGCCTACAACCGTCTCCGTCACGAGGACGGACTCCGGCGGCCCGTACACGGTAAGCTCTAACGACACTACGTACCGTGGCCGGTACTGGCACCTGTCGGCTGGATCCGTCGCGCTGGACGCGGAGAAGCCCTTCTGGGAGGATGTGAACCTGGCATGA

Genome Context

Tertiary structure

PDB ID

0e0bc501a73df376f3fdc51bb818272cfca50b2d79e1051d04f079f237ce8302

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5825

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence