Protein

View in Explore

Genbank accession

YP_009010133.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,75

Evidence RBPdetect2

Probability 0,96

Protein sequence

MNTEYTMANGQTPVQGSIMSMPVLADWTGQEYVPVVDETGNNKRVLLEDLKGRDAYEVAKEAGYTGTLQEWLASLKGEKGDKGDKGDNGADGKSNYDLAVEQGYQGDLASWLLTQKGADGNDGKDGVDGMLPDFTPVAVETDHVTEADFLTLMTAAVNGAKPADVTSKMLMIDHEGAVGESSLGGWTIYPTESGRYVYVFGRNALGNGQQGNYSAYMPDGGSPQFLSWSASEKGEQGIQGIDGKPGISVVPKGTTPSQVALPVASESNAGWMFTNDGSVTASDKGTLYVSDGTQWVIQGNILGPQGLKGDKGDKGDKGDTGTAGKNAVGMQIVGIVDKEEDLPPVADFTAGDTYVVGTHLWTKVGTEWVDIGDFTGPDGLSAYQVAKANGFVGTEAEWLSSLKGADGIGLKIIGSLPSKDNLPEVGEKSGDAYIINSVMWVWDTVQWSPVGQVGPQGKSAYQSALDTGYVGTEAAWIASLKGNKGDKGDKGDQGEKGEKGDNAAAVMLRGEKADEASLPSTGNTVSDAWLVGGNMFVWTGTAWFDAGPIQGPQGIKGDKGDKGDTGDTGKSAFEVAVAGGFSGTQTQWLASLVGNAVKAKGTLADFANLAGVVSPEAGWAYNITGGASAGHQFIYDGATWVDMGDVRGAKGEKGDQGIKGDTGDAGVDGATAYEIAQGAGFTGTEAEWLKSLIGPGLVAKGHVTDSADLLNVTNPVAGWVYNVLSGDDAGHQFIYNGSDWIDMGNVRGDQGIQGDKGDKGDKGDTGATGNAVNYRGTVATSDLLPSSGNQVSDAYFVGVNLWVWNGTTWIDNGSFQGPQGLKGDKGDKGDKGDTGTTGKSAYQSAVDSGFSGTESAWVTSLKGTTGKSAYQSAVDGGYAGTEAQWVASLKGTNGTNGTSLVPKGTVADLTALNAVANPVAGWLYNMTSTGHAYVYSGSAWVDQGDWRGLQGIQGLTGDQGIKGDTGDGYRYKGTVATTGDLPTTGQVKGDTYFVGTNMKVWNGTGWDDGGNFQGPQGIQGEKGDIGAGIKILGKKDTEEDLPATADAAGDGYMVGTNFWVWDGTAFVNVGAIQGPKGDQGLRGIQGLKGDKGDKGDKGDTGDKGTAWVVLARPPAAADGRIGDYYLNSSTLQFFVKTSDVLWGPLGYLGGGNVYDGPQDGKAYARKDGTWVLVDVLEAPDDGKQYVRKGKAWVSFDHYDMPLITVTAGAVDASKGNAYKLDATVNTTIAFSNLPANRVQTLVLTMMGKGGNLTWPAALKWSNAKAPTLGTTLTNIVVYWDGTNLTGSVGQTV

Physico‐chemical properties

protein length:	1292 AA
molecular weight:	134027,00400 Da
isoelectric point:	4,51707
aromaticity:	0,08669
hydropathy:	-0,37895

Domains

Domains [InterPro]

DC_2121
ATT
5–92

DC_2121 DC_0114 DC_1065 DC_1340 DC_0114

IPR050149
Unmapped
76–1104

IPR050149 SSF58046 G3DSA:6.20.230.10

DC_1967
ATT
79–181

DC_1967 DC_1340 DC_1065 DC_2298 G3DSA:6.20.230.10

YP_009010133.1

1 1292

Architecture

ATT

RBD

STR

RBD

ATT

RBD

ATT 5-181 | RBD 256-461 | STR 462-970 | RBD 971-1149 | ATT 1150-1196 | RBD 1197-1292

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_2121	ATT	DC_2121	5	92	Novel HMM	DC_2121	N-terminal	Low	Positional only	48 proteins / 48 hits
IPR050149	Unmapped	-	76	1104	InterPro	Collagen superfamily	-	-	-	-
DC_1967	ATT	DC_1967	79	181	Novel HMM	DC_1967	N-terminal	Low	Positional only	47 proteins / 47 hits
DC_0114	RBD	DC_0114	256	495	Novel HMM	DC_0114	C-terminal	Low	Positional only	42 proteins / 42 hits
DC_1340	STR	DC_1340	462	590	Novel HMM	DC_1340	Central	Low	Positional only	192 proteins / 192 hits
DC_1065	STR	DC_1065	579	691	Novel HMM	DC_1065	Central	Low	Positional only	109 proteins / 109 hits
DC_1065	STR	DC_1065	674	771	Novel HMM	DC_1065	Central	Low	Positional only	109 proteins / 109 hits
DC_1340	STR	DC_1340	747	892	Novel HMM	DC_1340	Central	Low	Positional only	192 proteins / 192 hits
DC_2298	STR	DC_2298	882	970	Novel HMM	DC_2298	Central	Low	Positional only	339 proteins / 339 hits
DC_0114	RBD	DC_0114	946	1292	Novel HMM	DC_0114	C-terminal	Low	Positional only	42 proteins / 42 hits
SSF58046	ATT	SSF58046	1150	1174	Merged direct domain	SSF58046	N-terminal	Low	Positional only	12 proteins / 12 hits
G3DSA:6.20.230.10	ATT	G3DSA:6.20.230.10	1151	1174	Merged direct domain	G3DSA:6.20.230.10	N-terminal	Low	Positional only	46 proteins / 46 hits
G3DSA:6.20.230.10	ATT	G3DSA:6.20.230.10	1175	1196	Merged direct domain	G3DSA:6.20.230.10	N-terminal	Low	Positional only	46 proteins / 46 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Erwinia phage PhiEaH1 [NCBI]	1401669	Uroviricota > Caudoviricetes > Chimalliviridae > Iapetusvirus EaH1 >
Host	Erwinia amylovora [NCBI]	552	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Enterobacterales

Coding sequence (CDS)

Genbank protein accession

YP_009010133.1 [NCBI]

Genbank nucleotide accession

NC_023610.1 [NCBI]

CDS location

range 66573 -> 70451
strand +

CDS

GTGAATACGGAGTACACGATGGCTAACGGTCAAACCCCTGTACAGGGTAGCATCATGTCGATGCCGGTACTCGCCGACTGGACGGGACAGGAGTACGTCCCGGTCGTTGATGAGACTGGCAACAACAAACGTGTTCTTCTCGAAGACCTGAAAGGGCGTGACGCATACGAGGTAGCCAAGGAAGCGGGCTACACGGGCACTCTCCAAGAGTGGCTGGCGTCCCTGAAAGGTGAGAAGGGCGATAAAGGCGATAAGGGCGATAACGGAGCCGACGGTAAGTCGAACTACGACCTCGCCGTGGAACAGGGTTATCAGGGCGACCTGGCATCCTGGCTGCTCACGCAAAAAGGCGCGGACGGTAACGACGGTAAAGACGGTGTTGATGGCATGTTGCCAGACTTCACTCCGGTGGCTGTTGAAACCGACCACGTCACCGAAGCTGACTTCCTGACATTGATGACCGCTGCGGTCAACGGTGCGAAGCCAGCAGATGTCACCAGCAAGATGCTGATGATTGACCATGAAGGCGCGGTGGGTGAAAGCTCACTGGGCGGTTGGACCATTTACCCTACCGAATCCGGTCGTTACGTTTACGTCTTCGGTCGTAATGCGCTGGGTAACGGTCAGCAAGGTAACTATTCAGCCTACATGCCGGATGGCGGTAGTCCGCAATTCCTGTCCTGGTCCGCTTCTGAAAAGGGCGAACAGGGTATCCAGGGTATTGACGGTAAGCCGGGTATCTCCGTCGTACCGAAAGGTACCACCCCTTCTCAGGTAGCTTTGCCGGTTGCAAGTGAGTCTAACGCAGGTTGGATGTTCACGAACGACGGTAGCGTAACTGCTTCTGATAAAGGTACGCTCTACGTCTCCGACGGTACTCAGTGGGTAATCCAGGGGAACATCCTGGGTCCGCAGGGCCTGAAGGGAGACAAAGGCGATAAAGGCGACAAAGGTGATACCGGTACAGCCGGTAAGAACGCCGTCGGGATGCAGATTGTTGGCATCGTTGACAAAGAAGAAGACCTGCCTCCGGTCGCAGACTTCACCGCGGGTGATACCTACGTAGTAGGCACACACCTCTGGACGAAAGTCGGCACTGAGTGGGTCGACATCGGCGACTTCACTGGCCCTGATGGTCTGTCTGCGTACCAGGTTGCGAAAGCGAACGGGTTCGTGGGTACCGAAGCTGAATGGCTGTCAAGCCTGAAAGGTGCTGACGGTATCGGTCTGAAAATCATCGGTTCTCTGCCGTCAAAGGATAACCTCCCAGAAGTGGGCGAGAAGTCTGGTGATGCTTACATCATCAACTCCGTCATGTGGGTGTGGGATACCGTTCAGTGGTCCCCGGTAGGTCAGGTTGGCCCGCAAGGTAAATCTGCTTACCAGTCTGCGCTCGACACCGGCTATGTCGGTACTGAAGCGGCCTGGATTGCCTCCCTGAAAGGGAACAAAGGCGATAAAGGCGATAAAGGCGACCAGGGTGAAAAAGGTGAGAAGGGCGATAACGCTGCCGCAGTCATGCTGCGTGGCGAGAAGGCCGACGAAGCATCGCTGCCTTCTACCGGTAACACCGTCTCTGACGCGTGGCTGGTTGGCGGTAACATGTTCGTCTGGACCGGTACTGCCTGGTTCGATGCAGGTCCTATCCAGGGCCCTCAGGGCATCAAGGGCGATAAGGGTGATAAAGGCGACACCGGTGACACCGGTAAGTCTGCATTCGAAGTTGCCGTTGCTGGCGGTTTCTCCGGTACCCAAACCCAATGGTTGGCGTCTCTCGTAGGCAATGCTGTTAAGGCGAAAGGTACACTGGCTGACTTCGCTAACCTGGCGGGTGTGGTTTCTCCGGAAGCCGGTTGGGCCTACAACATCACTGGCGGCGCATCTGCTGGCCATCAGTTCATCTACGACGGGGCAACCTGGGTAGACATGGGTGATGTTCGCGGAGCCAAAGGCGAGAAAGGTGACCAAGGTATTAAAGGTGATACCGGCGATGCCGGTGTAGACGGTGCAACCGCTTACGAAATCGCCCAAGGTGCTGGCTTTACTGGTACCGAAGCTGAATGGCTGAAGTCCCTGATTGGTCCGGGTCTGGTAGCGAAAGGTCACGTAACCGATTCTGCTGACCTGTTGAACGTCACTAACCCAGTTGCGGGTTGGGTCTACAATGTTCTCTCCGGCGACGATGCCGGTCACCAATTCATCTACAATGGTTCCGATTGGATTGACATGGGCAACGTCCGTGGCGACCAGGGTATCCAGGGTGATAAAGGTGATAAAGGGGACAAGGGCGACACGGGTGCAACCGGTAATGCGGTTAACTACCGTGGTACTGTAGCCACCTCTGACCTGCTGCCTTCCAGCGGTAACCAGGTTTCCGATGCGTACTTCGTGGGTGTAAACCTGTGGGTATGGAACGGTACCACCTGGATTGACAACGGTAGCTTCCAAGGCCCACAAGGTCTGAAAGGCGATAAGGGTGACAAAGGGGATAAAGGTGATACTGGTACTACCGGTAAATCTGCGTACCAGTCCGCCGTTGATTCCGGGTTCTCTGGCACTGAATCTGCGTGGGTAACCTCGCTGAAAGGTACCACTGGTAAGTCCGCTTATCAGTCTGCGGTTGACGGCGGTTACGCTGGCACCGAAGCACAGTGGGTTGCTTCCCTGAAAGGGACCAACGGTACTAACGGTACGTCACTGGTTCCGAAAGGAACTGTTGCTGACCTGACCGCACTGAACGCAGTGGCTAACCCGGTTGCTGGCTGGCTGTACAACATGACCTCTACGGGTCACGCGTACGTCTACAGCGGTAGCGCATGGGTCGACCAGGGCGATTGGCGTGGCCTCCAGGGCATCCAAGGTCTGACTGGTGACCAAGGTATTAAAGGTGATACCGGCGACGGCTATCGCTATAAAGGTACCGTGGCAACGACTGGCGACCTGCCAACCACCGGCCAAGTGAAAGGTGACACCTACTTCGTAGGCACCAACATGAAGGTCTGGAACGGCACTGGCTGGGATGACGGCGGTAACTTCCAGGGTCCGCAAGGTATCCAGGGTGAAAAAGGTGACATTGGTGCGGGCATCAAGATTCTCGGTAAGAAAGACACCGAAGAAGACTTGCCAGCAACTGCCGATGCAGCCGGTGACGGTTACATGGTAGGCACCAACTTCTGGGTGTGGGACGGCACGGCATTCGTGAACGTCGGCGCAATCCAGGGGCCGAAAGGTGACCAAGGTCTCCGCGGTATCCAGGGCCTGAAAGGTGATAAAGGTGACAAGGGTGATAAGGGTGACACCGGTGACAAAGGCACCGCGTGGGTTGTCCTGGCACGTCCCCCAGCTGCGGCTGATGGTCGTATCGGTGACTACTACCTGAACTCCTCTACTCTCCAGTTCTTCGTGAAAACCTCTGACGTTCTGTGGGGCCCTCTGGGTTACCTCGGCGGCGGTAACGTGTACGACGGTCCTCAGGACGGTAAAGCGTACGCCCGTAAAGACGGTACATGGGTTCTCGTTGACGTTCTGGAAGCCCCAGACGACGGTAAGCAGTACGTACGTAAAGGTAAAGCGTGGGTTAGCTTCGACCATTACGACATGCCGCTGATTACGGTCACTGCGGGTGCGGTAGATGCGAGCAAAGGTAACGCCTATAAGCTCGATGCCACCGTGAACACCACGATTGCGTTCAGTAACCTCCCAGCCAACCGCGTGCAGACTCTGGTCCTCACGATGATGGGCAAAGGTGGTAACCTGACGTGGCCAGCAGCACTCAAGTGGTCGAATGCGAAAGCACCGACTCTGGGTACTACGCTGACCAACATCGTGGTTTACTGGGACGGCACGAACCTGACCGGCTCTGTTGGTCAGACCGTGTAA

Genome Context

Tertiary structure

PDB ID

3c9ff4b6a9a310b54e26cb95534aa037a06d9df0b4eca13aedd36ee95318d98f

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6464

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence