Protein

View in Explore

UniProt accession

U5PSB2 [UniProt]

Protein name

Tail fiber

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence GenBank

Probability 1,00

Evidence Phold

Probability 1,00

Protein sequence

MSEHEYSPLSGMRFQSQLSKEMKRAYKEGNNIVTLSFAEVIKVNYKYNTVDVITTKHKNSTTKNPNDNGKYSARLPIQFGGRTPQGNVYGTNTLVTVGSRVLIGFVEGNKDNPIVLNIYGAVDNQSMLTRTTMTGGDESDEGVQRELWQLFNLYPSMTYTNVDGRGNREVTFSGKSFLYVTDSDQNNEYVQDEAFDYMDLPSSRYANGELIEPESPSSPTVLYVHQGVYEKHRFTIFIKSDGTFRMGSRNEKGHGITYQQMNTDGSFSIVKKNDTTNPEEESYDQSSMEILKNGNVLLQNPKHKFEITDDGILVDGKKLSEIGGGGSGENPEYEEAIRQINKTIETMSVTMKSIEGGLETKVEKNTYEIDLDEIKGAQDALLAEIKAIIATLKVALEDLRTFIGSGFPDGVVTDARKIELNKKMQTIDASKTVLDGKYAEVMADPFLSDTLKNTLKISKDRVDGYHQALHNVIDASITDGTITAQEKTDINTAITNYVTSLNNIEPVFTSSIEASIVERIKEAVENPVNYTNKEMKKQSAIFTQLFNAISMKVSTEELTSQVQDLEVKMATKEEQKALTDELERVDQKVNGALSNLPYRVEVTSTNGTVFVNDFIDSVVSARFYKGADDITSTVGIGDIIWLRVSDDQAGDTAWNNNHKGIGNSFRLSVNDVRDRATFFCSYKTPPVATGSITVANLKDISVSKTEPTNPRQGTMWYNMTDGKLYVYMDGKWQFSADGLDFNIRNLLTNSRDCTGGGWSFQSASRTNSQYQGTYIIETAANWGSADYACSDLFTRGVVAANDEVTFCVLARLTGATGVTRNLSFFCEQSPASGTVVGSVTTEWQPFYITFKMLAAMNTAGSKMRFEVGDLTSANLKLQLCSHILVKGNTQVNWVPAPEDTQRDIDNINKDVGDIRTNVDSLGDDKKLTRFERSLIRSYLADITGTYYNPTDVPIALTEIDKPAYGKGKLYSIRQQARNIGLDTSKSPYYKKLGDAYTALIAYLNGFTPKPWDVTSSAIIDIPDRVIWNQKWNDYYNFYSLFEIEVQDRQKEYTEQQVQEMKKDTIAAISTAGNYDTVPFANPVTVTPPIATLGLPEFQGNHQDSWDWNGRNYILQSDVAYSWTGKMNDNGFSTKQLSKESVAMFDKQRVTMSLAYKLTNVVYGTVNPWVGMQLTVEYTDGTKEYPTCIGGKADGSPTTSDFVRRAGTYQINAAKSIRSLSIMLGGRDLTGTVEIKEYKIEVANKTVDQVVWTQAPEDVWGKVGRRIRPVTNPMFSSGTNLTILGMFYGNGTVNDKFAWDTSGTPVKTRYWVDGDLNDKQSWTYFTKGFNTDSVNKVIKGSGKNEYPILFDDTVENRIGRSTIAFFDDYVILTCTDGSDAFYQLGDYNMSLHGFSLGETITFSADVNCDIAGAYMSTWISDGTNWIESRGDVGGLNTWQRLKHTFTLPANTKGLFFRIYFPRTANANTKKLRIKNVQIERGSNSTPFVSANKQTFKKVKADGATYAAIGNMSEVVVKHDGKLLLRDGNVQEADSMGANATTGTLYIAIADIDSGWADAYTPTVEEIKAYFLGWRMCNGQLNGLYVSGGKVWYPHGDKNLDRAVTGRATAPTEASPSIKDNSIRPYQFLYRLVDPIQEEVSFDGILELLPKANVVTTYYPTWTSPILAGTIKYGINLATVNQDTRYIVPTMMKRIASAEQKITDEAITSTVVNSREYTLGMKSKADSSDLGNYATKDELANVDKGVNDRIQGEIDKIDFSPFAEKSQLEQTARDWNAKFSAANGMNTIKNSIGFSGTDFWDMFQVNTTVETISNSALDSLGLGSGFYFRKDGKNKGITQKVKVIPNQPYTLGFYLNKMTKGAKGDQTYRFWIQVMNSAGTITHQIDDNSDKTTNGLEGSYLTFTPLEDAVTIRFVSYANVEAIVSGIMLNIGDIPLQWTLATGELYNTNVRMNLNGLRVAQLDANGAEVGYTQITPSEFAGFYKNSNGGYEKVFYLNGDETVTKKLKATQEITLGNIKIIDVTSTDITGWAFVPTVK

Physico‐chemical properties

protein length:	2035 AA
molecular weight:	226016,59490 Da
isoelectric point:	5,25160
aromaticity:	0,09926
hydropathy:	-0,42334

Domains

Domains [InterPro]

DC_0209
STR
12–879

DC_0209 Coil G3DSA:2.60.120.260

Coil
Unmapped
555–588

Coil DC_0015

U5PSB2

1 2035

Architecture

STR

STR 12-2035

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0209	STR	DC_0209	12	879	Novel HMM	DC_0209	Central	Low	Positional only	123 proteins / 123 hits
Coil	Unmapped	-	555	588	Coils	Coil	-	-	-	-
DC_0015	STR	DC_0015	673	2035	Novel HMM	DC_0015	Central	Low	Positional only	187 proteins / 187 hits
Coil	Unmapped	-	1043	1063	Coils	Coil	-	-	-	-
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1371	1484	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Bacillus phage BigBertha [NCBI]	1406781	Uroviricota > Caudoviricetes > Herelleviridae > Bequatrovirus > Bequatrovirus bigbertha
Host	Bacillus thuringiensis serovar kurstaki [NCBI]	29339	Bacteria > Firmicutes > Bacilli > Bacillales > Bacillaceae > Bacillus

Coding sequence (CDS)

Genbank protein accession

AGY46601.1 [NCBI]

Genbank nucleotide accession

KF669647 [NCBI]

CDS location

range 55307 -> 61414
strand +

CDS

ATGTCAGAACATGAATATAGTCCATTATCTGGAATGAGATTCCAGTCACAATTAAGTAAAGAAATGAAACGAGCGTATAAGGAGGGTAACAATATTGTTACCCTTTCTTTTGCGGAAGTTATTAAAGTTAACTATAAATATAATACGGTAGACGTAATTACTACTAAACATAAAAACTCTACAACAAAGAACCCTAACGACAATGGTAAGTACTCTGCTCGTTTACCTATACAATTCGGTGGTAGAACACCACAAGGTAACGTGTACGGTACGAACACACTTGTAACTGTAGGCTCTAGAGTTCTAATCGGATTCGTAGAAGGTAACAAAGATAATCCAATCGTGCTTAACATTTACGGAGCTGTCGATAATCAATCTATGCTTACTAGAACAACTATGACAGGTGGAGACGAGTCTGACGAAGGTGTACAACGTGAACTATGGCAACTATTCAACCTGTACCCATCTATGACATATACAAATGTTGATGGTCGCGGTAATCGTGAAGTTACTTTCTCTGGTAAGAGCTTCTTATACGTTACGGACTCTGACCAAAACAACGAATACGTACAGGACGAAGCTTTTGATTACATGGATTTACCTAGCTCACGTTATGCAAACGGAGAACTAATTGAACCGGAATCACCAAGCTCACCTACAGTACTTTACGTTCATCAGGGCGTATATGAGAAACATAGATTCACAATTTTCATTAAGTCCGATGGTACATTCCGTATGGGTAGCCGTAATGAAAAAGGTCACGGTATTACATACCAACAAATGAACACGGATGGTAGTTTCTCAATTGTCAAGAAAAATGATACGACAAACCCGGAGGAAGAATCATACGACCAGTCTTCTATGGAAATCCTTAAGAATGGTAACGTACTTCTTCAAAACCCAAAACATAAGTTCGAGATTACAGATGATGGAATCCTAGTAGATGGTAAGAAGTTATCGGAGATTGGCGGAGGCGGAAGTGGAGAGAATCCAGAGTACGAAGAAGCTATCCGACAAATCAATAAAACTATCGAAACAATGTCTGTAACAATGAAATCTATTGAGGGCGGTTTAGAAACAAAGGTAGAGAAGAATACATACGAGATTGACCTTGACGAAATCAAAGGCGCACAAGACGCGTTACTTGCAGAAATCAAAGCAATCATCGCAACATTAAAAGTTGCTTTAGAAGACTTACGTACTTTTATCGGTTCTGGTTTCCCGGACGGTGTAGTAACAGATGCTCGTAAGATAGAATTGAACAAAAAAATGCAAACTATCGATGCATCTAAAACAGTACTAGATGGTAAGTATGCAGAGGTTATGGCTGACCCATTCTTATCTGACACACTTAAGAACACGTTAAAAATCTCTAAAGACCGTGTAGATGGATACCACCAAGCATTACATAACGTAATCGACGCATCTATCACAGACGGTACAATCACAGCACAAGAGAAAACAGACATCAACACAGCTATCACAAACTATGTAACTTCTTTAAATAACATAGAACCTGTGTTCACTTCTAGTATCGAAGCATCTATTGTTGAACGAATCAAAGAAGCTGTAGAAAACCCAGTCAACTACACGAATAAAGAGATGAAGAAGCAAAGCGCAATCTTTACGCAACTATTCAATGCTATCTCTATGAAAGTTAGTACAGAGGAATTAACATCTCAAGTGCAAGACTTAGAAGTTAAGATGGCTACGAAGGAGGAGCAGAAAGCGCTTACTGATGAATTAGAACGAGTTGACCAGAAAGTAAATGGCGCTCTATCTAATCTTCCATACCGAGTAGAGGTTACTTCCACAAATGGTACAGTATTCGTCAATGACTTTATCGATTCTGTTGTATCTGCTAGATTTTACAAAGGTGCGGATGACATCACATCAACAGTCGGTATCGGAGATATTATCTGGCTTCGTGTATCGGATGACCAAGCAGGAGATACAGCTTGGAACAATAACCATAAAGGTATTGGTAACTCATTCCGTTTAAGCGTAAATGACGTTAGAGACAGAGCTACATTCTTCTGTTCATACAAGACTCCTCCAGTAGCTACAGGTAGTATTACAGTAGCGAACTTAAAGGACATCTCGGTATCTAAAACAGAACCAACAAACCCACGACAAGGTACAATGTGGTACAACATGACGGACGGTAAGTTATACGTTTACATGGACGGTAAATGGCAATTCTCAGCAGATGGTTTAGACTTCAATATTCGTAACCTACTTACAAACTCACGAGATTGTACAGGTGGCGGTTGGTCGTTCCAAAGTGCTTCAAGAACAAATAGCCAATATCAAGGCACATACATCATCGAAACAGCAGCTAACTGGGGTAGTGCGGATTATGCTTGTTCTGACTTATTCACGCGTGGAGTAGTAGCAGCTAATGATGAGGTTACATTCTGTGTACTCGCTAGATTAACAGGGGCTACAGGTGTTACAAGAAACTTATCATTCTTCTGTGAGCAATCTCCAGCTAGTGGTACAGTGGTAGGCTCAGTAACTACAGAATGGCAACCTTTCTACATCACATTTAAAATGTTAGCGGCAATGAATACAGCAGGGTCTAAAATGAGATTCGAAGTAGGCGACCTGACATCAGCTAACTTGAAGTTACAATTATGTAGCCATATCTTAGTTAAAGGTAACACACAGGTAAACTGGGTTCCAGCTCCGGAGGATACACAACGAGATATCGACAATATCAATAAAGATGTTGGAGACATCCGAACAAACGTAGACTCATTAGGTGACGATAAAAAACTAACTCGTTTCGAAAGAAGTTTAATTCGTTCATACTTAGCGGATATCACTGGTACATACTACAACCCAACAGATGTTCCTATTGCGTTAACAGAGATTGACAAGCCCGCTTACGGAAAAGGTAAGTTGTACTCAATCCGACAACAAGCTCGTAACATCGGTTTAGATACATCTAAGAGTCCTTACTATAAGAAGCTAGGAGACGCTTATACAGCGCTTATAGCTTACCTTAATGGTTTTACACCTAAACCGTGGGATGTAACGTCTAGCGCAATCATAGACATCCCAGACAGAGTAATATGGAACCAGAAGTGGAATGACTACTACAACTTCTATTCTCTTTTCGAAATCGAAGTACAAGATAGACAAAAAGAGTACACGGAACAGCAAGTGCAAGAGATGAAGAAGGATACTATCGCAGCAATCAGTACAGCAGGTAACTACGATACTGTACCATTCGCAAACCCAGTAACAGTTACACCACCTATCGCTACACTAGGTTTACCGGAATTTCAAGGTAACCATCAGGATAGTTGGGACTGGAACGGAAGAAACTACATACTGCAATCAGATGTAGCTTACTCTTGGACAGGAAAGATGAACGATAATGGTTTCTCTACTAAGCAATTAAGCAAAGAGTCCGTTGCTATGTTCGACAAGCAAAGAGTAACAATGTCATTAGCTTATAAATTAACCAACGTTGTATATGGTACTGTAAACCCGTGGGTTGGGATGCAGCTAACAGTAGAATATACAGATGGTACAAAAGAGTATCCTACTTGTATAGGAGGTAAAGCAGACGGGTCACCTACTACTAGTGATTTCGTTCGTAGAGCTGGTACTTACCAGATTAATGCAGCTAAATCAATAAGGAGTCTATCCATAATGTTAGGTGGACGAGACTTAACAGGTACAGTTGAGATTAAGGAGTACAAAATCGAAGTAGCAAACAAAACTGTTGACCAAGTAGTATGGACGCAAGCACCAGAGGATGTTTGGGGTAAAGTCGGAAGACGTATTCGACCAGTAACAAACCCTATGTTTAGCAGCGGAACGAACCTTACTATACTAGGCATGTTCTATGGTAATGGGACAGTTAATGACAAATTCGCTTGGGACACTAGCGGTACACCTGTTAAAACTAGGTACTGGGTTGATGGAGACTTAAATGACAAGCAGAGCTGGACGTATTTCACTAAAGGTTTTAATACGGATAGTGTGAATAAAGTTATTAAAGGTAGCGGTAAGAATGAATACCCTATACTATTTGATGACACGGTAGAGAATAGAATCGGTAGGTCTACTATCGCATTTTTCGACGACTACGTGATACTAACTTGTACAGACGGTTCCGATGCATTCTACCAACTTGGCGATTACAACATGAGCCTTCATGGTTTTAGTTTAGGAGAAACAATTACATTCTCCGCAGATGTTAACTGTGACATTGCCGGAGCATACATGTCTACATGGATTAGTGATGGTACGAATTGGATTGAATCACGCGGAGATGTAGGTGGGCTTAACACATGGCAAAGACTTAAGCATACGTTCACACTCCCGGCAAATACTAAAGGATTATTCTTCCGTATTTACTTCCCTAGAACAGCAAATGCAAACACGAAAAAATTACGTATCAAAAACGTTCAAATAGAGCGCGGAAGTAATTCGACACCGTTCGTTTCTGCAAATAAGCAGACGTTCAAAAAAGTTAAAGCAGATGGAGCAACTTACGCAGCTATTGGAAACATGTCAGAAGTTGTAGTAAAACACGATGGTAAACTGTTATTAAGGGATGGTAATGTTCAAGAAGCCGATAGCATGGGGGCAAACGCTACTACCGGGACATTGTACATAGCTATCGCAGATATTGATAGTGGTTGGGCGGACGCATACACTCCGACAGTAGAAGAGATTAAGGCGTACTTCTTAGGCTGGAGAATGTGTAATGGTCAACTTAACGGGTTATACGTCTCTGGTGGTAAGGTTTGGTACCCTCATGGTGATAAGAACTTAGACCGAGCAGTAACAGGTCGAGCTACAGCACCTACAGAAGCGTCACCTTCTATCAAAGATAACTCTATTAGACCATACCAGTTCCTTTATAGATTAGTAGACCCAATCCAAGAAGAGGTATCGTTCGATGGAATCCTAGAGCTACTTCCAAAGGCTAACGTTGTAACAACATACTACCCAACATGGACATCGCCTATTCTAGCAGGTACCATCAAGTACGGTATAAACTTAGCAACAGTCAATCAGGACACTCGTTATATTGTTCCGACAATGATGAAAAGGATTGCTAGTGCAGAGCAGAAGATAACTGACGAGGCAATCACAAGTACCGTTGTCAACTCTAGGGAGTACACACTTGGTATGAAGAGTAAAGCCGACTCTAGTGACTTAGGTAACTACGCTACTAAAGACGAACTAGCAAACGTAGACAAAGGTGTGAATGACCGTATACAAGGGGAAATCGACAAAATCGACTTCTCACCTTTCGCGGAAAAATCACAACTAGAGCAAACAGCTAGAGACTGGAACGCAAAGTTCTCCGCAGCAAACGGTATGAATACAATCAAGAACTCTATCGGGTTCAGTGGTACAGACTTCTGGGACATGTTCCAAGTTAATACGACTGTCGAAACAATCTCTAACTCCGCACTAGATAGTCTAGGTTTAGGTAGTGGGTTCTACTTTAGAAAGGATGGTAAGAATAAAGGTATCACCCAGAAAGTAAAAGTTATTCCGAACCAACCTTACACACTAGGGTTCTACTTAAACAAAATGACGAAAGGTGCGAAGGGCGACCAAACGTACCGATTCTGGATTCAAGTCATGAATAGTGCCGGGACAATTACGCACCAGATAGACGATAACAGTGATAAGACAACAAACGGTTTAGAGGGTTCATACTTAACATTTACACCTTTAGAGGACGCAGTTACAATCCGTTTCGTATCCTATGCGAACGTTGAAGCTATCGTTTCTGGTATAATGTTAAATATAGGGGATATTCCTTTACAGTGGACACTAGCAACAGGAGAGCTATACAACACAAACGTTCGTATGAACCTAAACGGTTTACGTGTAGCACAGCTAGACGCTAATGGTGCCGAAGTTGGTTATACACAAATCACACCGTCAGAATTTGCCGGGTTCTACAAAAATAGTAACGGTGGATACGAAAAAGTGTTCTACTTAAACGGTGACGAAACTGTAACTAAGAAACTAAAAGCAACACAAGAAATAACATTGGGTAACATCAAGATAATTGACGTTACTAGTACAGACATAACAGGTTGGGCGTTCGTACCAACCGTTAAATAG

Genome Context

Tertiary structure

PDB ID

b4cca0c904dbdcd2efc6ed8b8f7173ed70cedbabb7ae19cd02a1c45e8f819d58

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,7583

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence