Protein

View in Explore

Genbank accession

XDJ14828.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence Phold

Probability 1,00

Evidence RBPdetect

Probability 0,64

Evidence RBPdetect2

Probability 0,96

Protein sequence

MAESNKKGMISGMDSLISISGEEFLEVIRLESDGSYKNYKLLVSKIRNNQGLSAYEIAVQNGFVGTVDEWLASLEGKSAYQIAVDAGFVGDEAAFIASLKGEKGEDGNEGKSIYDIALENGFIGTEADFLKTLVGKSAYQTALDNGFVGTEAEWLLSIKGDKGDDGDVGPIGPDGKSAFEVWQALPGNAGKTEDEFFEDQKGVTGDSAYEAAVAGGFVGTEAEWLKSLEGKSAYEIAKELDPTLTDESEFIKSLEGKTAFEVAKEAGFQGTEAEWLESLEGKSAYQIAKDGGFVGTESQWLASLEGSDGNDGKSAFDIYKELPGNENKTEAEFIESLKGEDGTNGTNGTNGEDGADGESAFDAYKKIPGNENKTEADFIASLKGEKGEDGTNGTDGKSAYEVAKDDGFVGTVEQWLESLVGEKGDIGQGVNVIATIEQDEYDQIVADGTSQPGDAYIVGVYLYIFNGVDWVKSNSIMGPAGQGLNYLGQWPDNVPLPLGPTYKAGDTYVWKNQGITSLYTLVITKDESGVETKREWVDIGVPGPQGASVYETWLKQPGNAGKPESEFLEAMKIKGDKGERGNDGTNGTNGVDGKSAYEVAVENGFVGTVEQWEASLVGPEGQKGDPAVAFEIKGRLTDESELPTPGVPSEAYYVGKNLFVWLADETKWENFGSLNGDSAYQTWLEQPGNAGKTEEEFLESLKGQSAYKLWADQPENAGKTEQEFLTSLKGKDGINGTNGIDGTDGKNLQVEGTKADLAEIQAIVDPQDQEAWVALDTGHLHIFAKGTWVDAGPFRGEDGKDGTNGTNGTDGKSAYETFKEIPGNEDKTEQEFIDSLKGKDGTNGTNGTDGEDGRNVQITGSVANEAALPTGAAQQDAYTVRDTGHLFMWIATTWVDLGQFKGDKGDTGDQGEIGLTGLGLNIVAEVETLADRPDPATLQSGDAVFVRENKSLYQLNAQGGWNVGINIEGPVGPDGPQGEKGDPGGGLKILGKYATLGELQAEHAQGTAGDAYLVGQNLYAWVTDAWTDLGPVVGPRGEQGPIGKTGLKGEKGVKGDRGALWLKLEDGVLVPTPVHGTPGDWAVNAQFDTYYKVDDTNWVHFGKLTAGDVWKPSELNIKMVWLNTSATTGGWVVLPVDEVSNPEEGVYYVRTRNATDPTKTEWTQLPHIADITAKSDTDQWVRVFKAAADAPEWAKLTVPDAGIPEAPTTAGKGYLRSGASGGSWIEGLTAPATAGKFLRTQTSWEQFNSYDLAYSQSAAATSAIAFDLSKQQMVEVDNSGNNAKTVTLSGIPGNGRCTTAVVVVKGNGGTVAFTAPNMLGGEVKWNSGTQPVYTAGYSVVTLLVYATSANTIVIGATGAQTLS

Physico‐chemical properties

protein length:	1363 AA
molecular weight:	144587,97880 Da
isoelectric point:	4,35389
aromaticity:	0,08804
hydropathy:	-0,46310

Domains

Domains [InterPro]

DC_1725
STR
33–77

DC_1725 IPR050149

DC_2121
ATT
74–109

DC_2121 DC_1967 DC_1725 DC_1725 DC_2121 DC_1473 DC_1065 DC_1340 DC_1065

DC_1967
ATT
100–136

DC_1967 DC_0108 DC_1065

XDJ14828.1

1 1363

Architecture

STR

ATT

STR

ATT

STR

STR 33-73 | ATT 74-178 | STR 197-231 | STR 254-374 | ATT 386-533 | STR 581-675 | STR 688-972 | STR 977-1290 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1725	STR	DC_1725	33	77	Novel HMM	DC_1725	Central	Low	Positional only	85 proteins / 85 hits
DC_2121	ATT	DC_2121	74	109	Novel HMM	DC_2121	N-terminal	Low	Positional only	48 proteins / 48 hits
IPR050149	Unmapped	-	100	1066	InterPro	Collagen superfamily	-	-	-	-
DC_1967	ATT	DC_1967	100	136	Novel HMM	DC_1967	N-terminal	Low	Positional only	47 proteins / 47 hits
DC_1967	ATT	DC_1967	132	178	Novel HMM	DC_1967	N-terminal	Low	Positional only	47 proteins / 47 hits
DC_1725	STR	DC_1725	197	231	Novel HMM	DC_1725	Central	Low	Positional only	85 proteins / 85 hits
DC_1725	STR	DC_1725	254	282	Novel HMM	DC_1725	Central	Low	Positional only	85 proteins / 85 hits
DC_0108	STR	DC_0108	279	374	Novel HMM	DC_0108	Central	Low	Positional only	22 proteins / 22 hits
DC_2121	ATT	DC_2121	386	533	Novel HMM	DC_2121	N-terminal	Low	Positional only	48 proteins / 48 hits
DC_1473	STR	DC_1473	581	675	Novel HMM	DC_1473	Central	Low	Positional only	59 proteins / 59 hits
DC_1065	STR	DC_1065	688	828	Novel HMM	DC_1065	Central	Low	Positional only	109 proteins / 109 hits
DC_1065	STR	DC_1065	816	919	Novel HMM	DC_1065	Central	Low	Positional only	109 proteins / 109 hits
DC_1340	STR	DC_1340	900	972	Novel HMM	DC_1340	Central	Low	Positional only	192 proteins / 192 hits
DC_1065	STR	DC_1065	977	1290	Novel HMM	DC_1065	Central	Low	Positional only	109 proteins / 109 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage RVTF4 [NCBI]	3236931	No lineage information
Host	Pseudomonas sp. [NCBI]	306	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Pseudomonadales

Coding sequence (CDS)

Genbank protein accession

XDJ14828.1 [NCBI]

Genbank nucleotide accession

PQ015378.1 [NCBI]

CDS location

range 216934 -> 221025
strand +

CDS

ATGGCAGAGTCGAATAAGAAAGGTATGATTTCGGGTATGGATTCGCTGATCTCGATCAGCGGTGAAGAATTCCTGGAAGTCATCCGCTTGGAGAGTGACGGTTCGTACAAGAACTACAAGTTGCTCGTATCCAAGATCCGCAACAACCAAGGTCTGTCTGCTTACGAGATCGCCGTCCAGAACGGCTTTGTTGGCACGGTAGACGAGTGGCTGGCTTCCCTCGAAGGTAAGTCGGCGTATCAGATCGCTGTTGACGCTGGCTTTGTTGGCGACGAAGCGGCCTTCATCGCTTCGCTGAAAGGTGAGAAGGGTGAAGACGGTAACGAAGGTAAGTCTATCTATGACATCGCTCTGGAGAACGGCTTCATCGGTACCGAAGCAGACTTCCTGAAAACCCTGGTCGGTAAGTCGGCATACCAAACTGCGCTGGACAACGGTTTCGTTGGTACTGAAGCGGAATGGCTGCTGTCGATCAAAGGTGACAAAGGGGATGACGGTGACGTAGGTCCAATCGGTCCTGACGGTAAATCCGCATTCGAAGTCTGGCAAGCTCTGCCAGGCAACGCTGGGAAAACCGAAGACGAGTTCTTCGAAGACCAGAAAGGTGTAACTGGTGATTCTGCCTATGAGGCAGCTGTTGCCGGTGGCTTCGTAGGAACCGAAGCCGAATGGCTGAAATCGTTGGAAGGGAAATCTGCCTACGAAATCGCCAAGGAACTCGATCCAACTCTGACCGATGAGTCCGAGTTCATCAAGTCCCTGGAAGGTAAGACTGCATTCGAAGTCGCTAAAGAAGCTGGCTTCCAGGGTACTGAAGCCGAATGGCTCGAATCCCTGGAGGGCAAGTCTGCCTACCAGATTGCCAAAGACGGTGGTTTTGTCGGCACTGAAAGTCAGTGGCTCGCTTCCCTGGAGGGTTCGGATGGTAACGACGGCAAGTCCGCGTTCGACATCTACAAAGAACTGCCGGGTAACGAGAACAAGACCGAGGCCGAATTCATCGAGTCCCTCAAGGGCGAAGATGGTACCAACGGCACGAACGGCACCAATGGTGAAGACGGTGCTGATGGCGAATCGGCTTTCGATGCCTACAAGAAAATCCCAGGCAACGAAAACAAGACCGAGGCTGACTTCATCGCTTCGCTGAAAGGTGAGAAGGGTGAAGACGGTACCAATGGTACCGACGGTAAGTCCGCTTATGAAGTTGCCAAGGATGATGGCTTCGTAGGTACTGTCGAGCAGTGGCTGGAAAGCCTGGTCGGTGAGAAGGGTGACATTGGCCAAGGCGTCAACGTGATCGCTACCATCGAACAAGATGAGTACGATCAAATCGTGGCCGATGGCACTTCCCAACCTGGTGACGCTTACATCGTCGGTGTGTACCTCTACATCTTCAACGGTGTGGATTGGGTTAAGTCGAACTCGATCATGGGCCCTGCTGGTCAAGGCCTGAACTACCTTGGCCAATGGCCGGACAACGTTCCTCTGCCTCTGGGTCCTACCTACAAGGCTGGCGACACCTACGTCTGGAAGAACCAGGGCATCACTTCGCTGTACACCCTGGTTATCACCAAAGACGAATCCGGTGTAGAAACCAAACGTGAGTGGGTAGACATCGGTGTTCCTGGTCCTCAAGGTGCTTCGGTTTACGAGACCTGGTTGAAACAACCTGGTAACGCAGGTAAGCCTGAATCCGAATTCCTCGAAGCCATGAAGATCAAAGGCGACAAGGGTGAGCGCGGTAACGATGGTACGAACGGCACCAATGGTGTTGATGGTAAGTCGGCTTACGAAGTGGCTGTTGAAAACGGCTTCGTGGGTACCGTTGAACAGTGGGAAGCATCCCTGGTTGGCCCAGAAGGTCAGAAAGGTGATCCCGCTGTTGCGTTCGAGATCAAAGGTCGTCTGACTGATGAATCCGAACTCCCAACTCCAGGTGTTCCATCGGAAGCTTACTACGTCGGTAAGAACCTGTTCGTCTGGCTGGCTGACGAAACCAAGTGGGAGAACTTCGGTTCCCTGAACGGTGACTCTGCTTACCAAACCTGGCTGGAACAACCGGGCAACGCCGGGAAGACTGAAGAAGAATTCCTGGAAAGCCTGAAAGGACAGTCGGCGTACAAACTGTGGGCTGATCAACCAGAGAACGCGGGTAAGACCGAGCAGGAATTCCTGACCTCGCTGAAAGGCAAGGACGGGATCAATGGTACCAACGGTATCGATGGTACTGACGGTAAGAACCTGCAGGTCGAAGGCACCAAAGCTGATCTCGCGGAGATCCAAGCTATCGTTGATCCACAAGATCAAGAGGCCTGGGTTGCCCTGGACACCGGTCACCTGCACATCTTTGCGAAGGGTACATGGGTAGATGCTGGTCCATTCCGTGGTGAAGACGGTAAGGATGGTACCAACGGCACCAATGGTACCGACGGTAAGTCTGCGTACGAAACCTTCAAAGAGATCCCAGGCAACGAAGATAAGACTGAACAGGAGTTCATCGATTCGTTGAAAGGTAAAGACGGTACCAACGGAACTAATGGTACTGACGGCGAAGATGGTCGTAACGTTCAGATCACTGGTTCTGTAGCTAACGAAGCTGCATTGCCAACTGGTGCTGCTCAGCAAGATGCCTACACCGTGCGTGACACAGGTCACCTGTTCATGTGGATCGCTACAACCTGGGTTGACCTTGGTCAGTTCAAAGGTGACAAGGGCGATACTGGTGACCAAGGTGAAATCGGTCTGACTGGTCTCGGTCTGAACATCGTTGCCGAAGTGGAAACACTGGCAGATCGTCCAGATCCTGCAACCCTGCAATCGGGTGATGCGGTATTCGTTCGTGAGAACAAGTCTCTGTATCAGCTGAACGCACAAGGTGGCTGGAACGTCGGTATCAACATCGAAGGTCCAGTAGGTCCAGACGGTCCTCAGGGTGAGAAAGGTGATCCTGGTGGTGGCCTGAAGATCCTCGGCAAATATGCCACTCTTGGAGAGTTGCAGGCAGAACATGCCCAAGGCACTGCCGGTGATGCCTACCTGGTTGGTCAGAACCTTTACGCTTGGGTAACCGATGCGTGGACTGACCTTGGCCCTGTTGTTGGCCCTCGTGGCGAACAAGGTCCAATCGGTAAGACCGGTCTGAAAGGTGAGAAGGGCGTCAAGGGTGACCGTGGTGCTCTGTGGCTGAAACTGGAAGACGGTGTTCTCGTTCCGACTCCAGTTCACGGTACCCCTGGTGACTGGGCCGTAAACGCTCAGTTCGATACCTACTACAAAGTGGATGACACCAACTGGGTCCACTTCGGTAAACTCACCGCTGGTGACGTATGGAAACCATCGGAACTCAACATCAAGATGGTCTGGCTCAATACCAGTGCCACTACTGGTGGTTGGGTTGTCCTGCCGGTCGACGAAGTCTCTAACCCTGAAGAGGGCGTGTACTACGTTCGTACTCGGAATGCCACCGATCCAACCAAGACCGAGTGGACTCAGTTGCCCCACATCGCAGACATCACTGCTAAGTCGGATACCGACCAGTGGGTACGTGTGTTCAAGGCTGCCGCTGACGCTCCGGAATGGGCGAAGCTGACTGTTCCAGATGCCGGTATCCCAGAAGCTCCGACTACTGCTGGTAAAGGGTACTTGCGTTCGGGTGCATCTGGCGGTAGCTGGATCGAAGGTCTGACTGCTCCAGCTACGGCTGGTAAGTTCCTTCGTACCCAGACCTCGTGGGAGCAGTTCAACTCCTACGACCTGGCATACAGCCAGTCTGCTGCCGCAACTTCGGCTATTGCATTCGATCTCTCGAAGCAGCAAATGGTGGAAGTTGACAACAGTGGTAACAACGCGAAGACAGTTACCCTGTCGGGCATTCCTGGAAATGGTCGTTGCACCACCGCTGTTGTCGTCGTCAAAGGCAATGGCGGTACCGTAGCCTTCACCGCACCAAACATGCTTGGTGGCGAGGTGAAGTGGAACAGTGGTACGCAACCGGTTTACACCGCAGGTTACAGTGTTGTTACGTTGCTTGTCTACGCGACTTCTGCGAACACCATTGTCATCGGTGCTACTGGTGCACAAACGTTGTCGTAA

Genome Context

Tertiary structure

PDB ID

d81f8210e78cb7583cc541cba134457f43ad77e9b41f3e04fb1937432f7ed361

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6473

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence