Protein

View in Explore

Genbank accession

XYH44901.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

TSP

Evidence RBPdetect2

Probability 0,90

Protein sequence

MAKAFYEIWKCDSTYTQELQEIFFKEVNIKKEMMKVPTFYFNIDRNAETSLSAPSIGNHIKIIRNNEEVLRGKIQDMEVRDKSIHFEGFSVAAEWKDVTATQNIWRNTTSKTAIETYAGTIGWTGGVIESNTLKKHDYTYVPLIEELELFASLFGKEFGFDEENRKINFKTQIGNDLSTVVRLIRGVNMESFGIRRQQADTYTRVIALGAGEGSKQLKKVVGTYTGIGSTRVFTDKQIKDMDDLTEYANARLAEGQGQDVVTYESRMLSPIFGVEIGDKIWVEDSLNRIDEAMRVMGIEMTFNETEQFDLVLANRNKTLIDLFQRMEKGQRTLANVHHSSAVQPNSMIVVDEDTKNPILMQVENGNFVNITTGNDLGTIENNVSTAQDTASSAQGDASNALITAGSANSKADQALTDASNAQDAASNALSQAGQAQEDASNALTEAEKRVLIETYNTERDQLASDIADKAGLTYVDGQLASKAEKSNTYTKTEVDSAVNSKVSKTTYDVDKNGIVTRLDSAESRITQTESEISTKVSSTTYETDREVSGQLGDANESASIASTNNGKWFRIAKNSGNRAWARFIVRDTTSGQHGTVEFIAGANYNNRSGLEFSLNSFSRYTLFPFSKARILTKGTYDEQYLELLFSASRDSQVSFWIKDNIQSSGWDAVPFVESTTMPEGYVADEFEISKDKATSSRLTSAESSITQHATEIASKVSNTTYQTDKDGITSRLDSAESSITQQAGQIASKVEQTTFNALESKVNTQGTTLTQKADIASLNAFKGEVASWERAYSVKNGYGHYIEDLNGNKLDFDFTYEVQARTVGTGTNTLAISLFKGDGAAFTIEKIYERGTGSNHPVFYLSGGYPAVTTAHSTYYTVELTINKYKGDRTSFNVLSDNINTRVEKNGVVSAINQSAEQITIDASKVNLNGYVTFSSQSKTSPNLIKDYDSFEGFPDGYNPPKKVYSNLTVYNVSSEFAFHGSKSLKTVNNNANSYIYPNGSAGFIPVKQGQKYVASAYAYTTSADPVQVTFAPIFRDDSGNHVSTGLSYPTTVITKVDGWVRISQSFYPPEGATSWTYYLRTVTAGTYTVYWDAISFEEVDASVDYPAPFRSGGFTTIDGDLIETGTLKWDKGFGGSINLGGADNQNGVLNILDDEGGIIASLGESNAGFGNLSADVISDVRNIVYKTSPSHPNYSDGYLNIFVDGLRGSDATGTGHQDNPYATIQYAIDNIPRYLDHSVTVFIYPMKYDENITVSGFKGEGTLTLKTYAWGVQRIRDWSSGSTANTGNHWVEIEALDNGWYSVARGKTVTTNGGNNATYPLTRITDGNKDTGQYADAGSGTGRYVEVDLAGTHDLRNINVWKYYSDGRSYNGIRTEVYQEGYGWREIWDNDGFAGAFRENSAGHRRVAYINGSIVFQSCDKVSLDSLCFDARSTKGIPVYAYNTQYADWRRLYAFADSSASYCYYCYASYVRIHDSEGNGSGTAVICGAYGARVDLFDGVTGGDSIRGLFCYSSATIAGSGDIPYGNSTATLTGTGGTITVSAWTASGYRGKKGIYTKYEDPTPPPPPPPKVVTKTWTSSSAKSWRPNFSGQWYESSVVQGIWSGYGLYRGYWFFGDSIRAAVAGKTITKVRIYLTRNNSGGYSSAQTCYIRGHNYTTQPSSTSTPSYDSSSPATASFAWGEGKWVDITSQWKADLQAGSIRGFMLYTTSTSATQYMKFSPTAKVEVTYYE

Physico‐chemical properties

protein length:	1732 AA
molecular weight:	190211,28530 Da
isoelectric point:	5,20608
aromaticity:	0,11201
hydropathy:	-0,46299

Domains

Domains [InterPro]

IPR010572
ENZ
100–323

IPR010572 Coil DC_1955 G3DSA:2.60.120.260 G3DSA:3.30.1910.20 G3DSA:2.60.120.260 DC_2111

DC_1919
ATT
296–609

DC_1919 DC_1955 IPR008979

XYH44901.1

1 1732

Architecture

ENZ

ATT

STR

RBD

STR

RBD

ENZ 100-295 | ATT 296-609 | STR 687-768 | STR 942-1100 | RBD 1199-1256 | STR 1299-1419 | RBD 1551-1732

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR010572	ENZ	DC_0675	100	323	InterPro cluster	Tail spike domain	Central	High	Text match	419 proteins / 419 hits
DC_1919	ATT	DC_1919	296	609	Novel HMM	DC_1919	N-terminal	Low	Positional only	15 proteins / 15 hits
Coil	Unmapped	-	429	449	Coils	Coil	-	-	-	-
DC_1955	STR	DC_1955	687	731	Novel HMM	DC_1955	Central	Low	Positional only	20 proteins / 20 hits
DC_1955	STR	DC_1955	721	768	Novel HMM	DC_1955	Central	Low	Positional only	20 proteins / 20 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	942	1100	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
IPR008979	STR	IPR008979	951	1100	Merged direct domain	Galactose-binding-like domain superfamily	Central	Low	Positional only	24 proteins / 24 hits
G3DSA:3.30.1910.20	RBD	G3DSA:3.30.1910.20	1199	1256	Merged direct domain	G3DSA:3.30.1910.20	C-terminal	Low	Positional only	16 proteins / 16 hits
G3DSA:2.60.120.260	STR	G3DSA:2.60.120.260	1299	1419	Merged direct domain	G3DSA:2.60.120.260	Central	Low	Positional only	264 proteins / 264 hits
DC_2111	RBD	DC_2111	1551	1732	Novel HMM	DC_2111	C-terminal	Low	Positional only	37 proteins / 37 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

XYH44901.1

1 1732

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	557	557	0,9714
Central domain	558	972	416	0,5716
C-terminal	973	1732	759	0,1798

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-557

Central
558-972

C-terminal
973-1732

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Rossellomorea phage phiT1 [NCBI]	3440538	Viruses >
Host	Rossellomorea aquimaris [NCBI]	189382	cellular organisms > Bacteria > Bacillati > Bacillota > Bacilli > Bacillales

Coding sequence (CDS)

Genbank protein accession

XYH44901.1 [NCBI]

Genbank nucleotide accession

PV767480.1 [NCBI]

CDS location

range 30150 -> 35348
strand -

CDS

ATGGCAAAGGCTTTTTATGAAATTTGGAAATGTGATTCTACTTATACACAAGAACTTCAAGAAATTTTCTTTAAAGAAGTCAATATAAAGAAAGAAATGATGAAAGTACCTACCTTCTATTTCAATATAGATAGGAATGCTGAAACAAGCTTATCTGCCCCTTCTATTGGAAATCATATCAAGATTATCAGAAACAATGAAGAGGTCTTGAGAGGTAAGATTCAGGATATGGAAGTAAGGGATAAGTCCATTCATTTTGAAGGATTTTCGGTAGCTGCAGAATGGAAAGATGTAACTGCCACTCAAAATATTTGGAGAAATACTACTTCCAAAACTGCCATTGAAACTTATGCAGGAACAATAGGGTGGACAGGTGGAGTTATTGAATCAAATACCCTAAAGAAGCATGATTATACCTATGTACCTCTAATTGAAGAGCTTGAGCTTTTTGCTAGTCTGTTTGGTAAAGAATTTGGGTTTGATGAAGAGAACAGAAAGATAAACTTCAAGACTCAAATTGGAAATGATTTATCTACAGTGGTAAGGCTTATCAGAGGGGTAAACATGGAGTCTTTTGGAATCAGAAGGCAGCAAGCTGATACTTACACTAGAGTAATTGCACTAGGGGCAGGTGAAGGTAGCAAGCAGCTAAAGAAGGTTGTGGGAACATATACCGGGATCGGTTCTACAAGGGTATTTACTGACAAGCAAATTAAAGATATGGATGATTTGACTGAATATGCAAATGCAAGGTTAGCTGAAGGTCAAGGTCAAGATGTTGTTACTTATGAGTCAAGAATGCTCTCCCCTATTTTTGGAGTGGAAATTGGAGATAAGATTTGGGTAGAAGATTCCCTAAACAGAATTGATGAAGCAATGAGGGTTATGGGAATTGAGATGACCTTCAATGAGACAGAACAATTTGATTTAGTCCTGGCTAACAGGAACAAAACACTTATTGACCTGTTTCAAAGAATGGAGAAAGGGCAAAGAACTTTAGCTAATGTTCATCACTCTTCTGCAGTACAACCTAACTCTATGATTGTGGTAGATGAAGATACAAAGAATCCGATTCTTATGCAAGTTGAGAATGGTAACTTTGTGAATATCACAACTGGAAATGATTTAGGGACAATTGAGAATAATGTTTCAACTGCTCAAGATACTGCTTCTTCTGCTCAAGGTGATGCTTCAAATGCTTTAATAACTGCAGGCTCTGCAAATTCTAAGGCAGATCAAGCACTAACAGATGCTTCAAATGCTCAAGATGCTGCAAGCAATGCTCTATCTCAAGCAGGTCAAGCTCAAGAAGATGCAAGCAATGCCCTCACTGAAGCAGAAAAGAGGGTACTTATTGAAACTTACAATACTGAAAGAGACCAACTAGCTTCTGACATTGCTGATAAGGCAGGCCTAACTTATGTAGATGGTCAATTGGCTTCAAAAGCTGAAAAGAGCAATACCTATACAAAGACAGAAGTTGACAGTGCAGTAAATTCAAAAGTCTCTAAAACAACCTATGATGTAGATAAGAATGGGATTGTGACAAGGCTAGACAGTGCTGAAAGCAGAATAACACAGACTGAAAGTGAGATTTCCACTAAGGTTTCTAGTACAACTTATGAAACTGACAGGGAAGTATCCGGTCAATTAGGTGATGCAAATGAGTCTGCAAGCATTGCTTCTACAAATAATGGCAAGTGGTTCAGGATTGCTAAAAATAGTGGAAACAGAGCTTGGGCTAGATTTATTGTAAGAGATACTACTTCCGGGCAGCATGGAACAGTGGAGTTTATTGCAGGGGCAAATTATAACAATAGAAGTGGGCTTGAGTTTTCATTAAACTCATTTTCAAGATATACCCTCTTCCCTTTCTCAAAAGCAAGGATACTAACAAAAGGAACTTATGATGAACAGTACCTTGAACTACTCTTCAGTGCAAGTAGGGATTCTCAAGTATCTTTTTGGATCAAGGACAACATTCAGTCAAGTGGATGGGATGCAGTACCATTTGTAGAATCTACCACAATGCCTGAAGGATATGTTGCTGATGAGTTTGAGATTTCAAAAGACAAGGCAACTAGCTCAAGGCTTACAAGTGCTGAAAGTAGTATTACCCAACATGCAACAGAGATTGCTTCTAAGGTGTCAAATACCACTTACCAAACTGATAAGGATGGAATCACTAGCAGGCTAGATAGTGCTGAATCAAGCATTACCCAACAAGCAGGGCAAATTGCTTCTAAGGTTGAGCAGACAACCTTCAATGCCCTTGAGAGCAAAGTAAACACTCAAGGAACTACTCTGACCCAAAAGGCTGACATTGCTTCACTAAATGCCTTTAAGGGAGAAGTGGCAAGTTGGGAAAGAGCTTACAGTGTCAAAAATGGTTATGGGCATTACATTGAGGACTTGAATGGAAACAAGCTAGACTTTGACTTCACTTATGAGGTTCAAGCAAGAACTGTTGGAACTGGAACAAATACCCTTGCAATATCTTTATTTAAAGGGGATGGAGCTGCCTTTACAATTGAGAAGATTTATGAGAGGGGAACAGGCTCTAATCACCCGGTATTTTACCTATCCGGTGGCTACCCTGCAGTCACTACTGCTCATAGCACCTACTACACCGTTGAGCTTACTATCAACAAGTACAAAGGTGACAGAACATCTTTCAATGTGCTTTCTGACAACATAAATACAAGAGTTGAGAAAAATGGAGTAGTGTCTGCAATCAATCAGTCTGCTGAACAAATAACCATTGATGCAAGCAAAGTAAACTTGAATGGGTATGTAACTTTCTCAAGTCAGAGCAAAACTTCTCCTAACTTGATTAAGGACTATGACTCTTTTGAGGGCTTCCCTGATGGGTATAACCCTCCTAAAAAGGTTTATTCAAATCTGACAGTCTACAATGTTTCAAGTGAATTTGCCTTTCATGGCTCTAAGTCATTAAAGACAGTGAATAATAATGCTAATTCATATATTTACCCTAATGGCTCTGCAGGATTTATCCCTGTTAAGCAAGGACAGAAGTATGTGGCTTCTGCATATGCTTACACTACTTCTGCTGATCCAGTGCAAGTAACATTTGCCCCTATCTTTAGGGATGATTCAGGAAATCATGTCTCAACAGGTTTAAGCTATCCTACAACTGTTATTACAAAGGTTGATGGATGGGTAAGGATTTCTCAATCATTTTATCCTCCTGAAGGAGCAACTTCTTGGACTTACTATTTAAGAACTGTTACTGCAGGCACTTATACAGTTTACTGGGATGCTATTTCTTTTGAAGAAGTGGATGCTAGTGTTGACTACCCTGCCCCTTTCAGAAGTGGAGGTTTTACAACCATTGATGGGGATTTAATTGAGACAGGTACTTTAAAGTGGGATAAAGGATTTGGTGGCTCTATTAATCTAGGAGGGGCAGACAATCAGAATGGTGTCCTAAATATACTAGATGATGAGGGTGGAATCATTGCTTCACTTGGGGAGAGCAATGCAGGTTTTGGTAACTTATCTGCAGATGTAATTTCTGATGTAAGGAACATTGTTTATAAAACTTCTCCTTCTCATCCTAACTATAGTGATGGATACCTTAACATCTTTGTTGATGGATTGAGAGGTTCAGATGCAACAGGAACAGGACATCAAGATAATCCATATGCAACTATCCAGTATGCAATTGATAATATCCCTAGATATTTGGATCATTCAGTAACAGTCTTTATTTATCCTATGAAATATGATGAGAACATTACAGTGAGTGGGTTTAAGGGTGAAGGAACATTGACCCTAAAAACATATGCCTGGGGTGTTCAAAGGATTAGGGATTGGTCAAGTGGCTCTACTGCAAATACCGGGAATCACTGGGTAGAGATAGAAGCCCTTGATAATGGTTGGTACAGTGTTGCTAGAGGGAAAACAGTAACTACAAATGGTGGAAACAATGCAACCTACCCTTTAACAAGGATAACTGATGGAAACAAAGACACCGGGCAATATGCTGATGCAGGTTCTGGAACTGGCAGATATGTTGAAGTTGACTTAGCCGGAACTCATGACCTAAGAAACATTAATGTTTGGAAGTATTATTCTGATGGCAGAAGCTACAATGGGATCAGGACAGAAGTTTATCAGGAAGGATATGGATGGAGAGAAATTTGGGATAATGATGGATTTGCCGGGGCATTCAGGGAGAACTCTGCAGGACATAGAAGGGTTGCTTATATCAATGGAAGCATTGTCTTTCAATCATGTGATAAGGTATCACTTGATTCTCTATGTTTTGATGCAAGGTCTACTAAAGGTATTCCGGTTTATGCCTACAATACTCAATATGCTGATTGGAGAAGGCTCTATGCCTTTGCTGATAGCTCTGCTTCATATTGTTATTACTGCTATGCTTCTTATGTAAGAATTCATGACTCTGAAGGGAATGGTTCAGGAACTGCAGTTATTTGTGGAGCTTATGGTGCAAGGGTTGACCTTTTTGATGGAGTGACAGGGGGAGATTCTATTAGAGGTCTTTTCTGCTACTCTTCTGCAACAATAGCAGGGAGTGGAGATATACCTTATGGGAACTCAACTGCAACCTTAACAGGAACAGGTGGAACTATTACAGTATCTGCTTGGACTGCTTCAGGGTACAGGGGAAAGAAAGGAATCTATACTAAGTATGAAGATCCTACTCCACCACCTCCACCACCACCAAAAGTTGTAACTAAAACTTGGACTTCTTCCAGTGCTAAGTCTTGGAGACCTAACTTCTCCGGGCAATGGTATGAATCTTCAGTAGTACAAGGGATTTGGTCAGGATATGGTCTGTATAGGGGTTATTGGTTCTTTGGTGATTCTATTAGGGCTGCAGTAGCAGGCAAGACAATCACTAAGGTAAGAATCTATTTAACAAGGAATAACAGTGGAGGATACTCTTCTGCACAAACTTGTTATATCAGAGGACATAACTACACTACACAACCTTCCAGTACCTCTACTCCTTCTTATGACTCTTCTTCTCCGGCAACTGCTTCATTTGCTTGGGGTGAAGGAAAATGGGTAGACATTACTTCCCAATGGAAGGCAGACCTGCAGGCAGGAAGTATCAGAGGGTTTATGCTTTATACTACTTCTACTTCTGCTACACAATATATGAAGTTTTCCCCTACTGCAAAAGTAGAGGTTACTTATTATGAATAA

Genome Context

Tertiary structure

PDB ID

5b514caa829a388dbf7086886f952900fb626567a184b395194f82f40dd42106

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,6540

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence