Protein

View in Explore

Genbank accession

XHB37482.1 [GenBank]

Protein name

tail fiber protein

RBP type

Evidence GenBank

Probability 1,00

Protein sequence

MAKKVTLPKGQTGATGTTLGQAGNILDLSDIDDIFGDTPKAKKGSPVTEFFNGIKQGLFDSVKPQQALKAFMRSAAPDGFSRMFGVYEDTMSTIRDVKDSVERTSASDLLFLTREAQDLAVKLKDKVPASVFDRLNNRLESQIENYKYAEDSNRNYKEIRRRMEAERDEDELKSAIDQVTLVQRDLAIKAEQGEVKRFAIGQAERGIRDKVSADRFDWMAKAMGQTVDNLSKLASYNEQVNYSIQKKGLEIQFRSMLHLRKIAQQTEATMELLNNGFAALVRNTGIPDHKKSSMKDLVGFNAAQRVSSSFVDNAIQTLPNFLGNFGSAVTNNATRFANENIRNFADAARAGSMFGADAWENRYNIAGQFAGSYLGDWTRNSVIPVLGRMVRPGVERFSNNYLGGRHNQASYLLDNFPAWTQEYMNNYQNTYGARGILRDIMAPFVPQFTLQDRLKTGSYQTIGQDSGFNQLTQRTIVEAIPGYLSRLLQETRMIRTGRDDITREVFDLSTGSFMSVEDSAANTERRLVSRSTVRGVSGALTDVLEAFDPNKELSIDARKALTERLIRDANMNKRFDPEAYARAGGYDRSKVSGETIKELTEYIKRQYNIGADGRMASTNENFARRQEISTLFLDVRNFSRDPIKEIERLTNAGKTDQLREMGIIITEQGIDRINYPRIWELMSSEVKYEGWGNDNPFDRYSDTPPSDDGGPGQLSPLGDQNNPHFIGPMYQSQTERKMRQAQEQVIRASKLAQEQANKGYDYAQQKVSLATDYVRDNVPNQFSELRRNINIPASMNFGDLRDQLYGQAGDMYSRAVNYSNQFNGYSDIVNQSIADLYTKANTFTPVIKGMDFLNGNLIDINTGKIVEKISDITGEIKNQAGITVVTAQEVATGLYNQRGDLLTKATDIASQLRDKAAQIAGDARERLTQGLDNVSDMAKDWYLPGREEAVILGRDLLAGEYIDTATNQVITNLKDAKGTIINRAGDVVVTAQELAKGLIRSDGFNLRRNVADASNWIQRNVLGGGSTTQKIFNAMGTVANKAKDFTLGLGRDILSNRDAYLPGMLKPVLQKVKLKAGEYYTAGGNLLKSFDEINGPVLDRDGNIVVDEEQIPELINSDGSKHTAAKNKGLFRTGLGNLARGYANMSMRYWKWLGKKSVDTAKGMAGLGYKLLGSPFKKRFSAFTGKVETQIDKKALDTTTDQLLAGIWEELRNQKPDANKPRRGSWQDLTSRVSDTLNGKNNSDEETTESKGLFGKLGDTLKNIFGKKKGDEEDEGLLEDLGLGGKKGGKWAAARQILGRGALAIGGGALSTAAAYASFGGTGASTNDKLAGAAIVTSNPIMWALKDFLIKPVLGWRGSQKFKDDLISYRMMQYGATTTDQMNKVTELEQLVSSVATRGGDASFDVRALNARDIIKIFGYGADDGPAIMRLANWIDFRFKPIFEAWLKGLSKINRSDVDISEVDSKVPNELKGQLIRSVSFPYEGNTPYLVLNNPFGEEDLSIDVASIQMKEKELLDKYSSTEKTPAAPKATSSSFKESATDVINDTITTIKSKSTDITNWFRNSTIGKAVKAVSPVESIRKMVTTVVDTIIPKANASDSLTSLQALRVHAYGMQGLDLAAVNGLLSIESLVNDKMRVANGKATYTGDIEELIKWTGQAFGMVTTSDGPDRVKVVDWLYRRFLPVFKAFIVTARSVSTSITLSQIETLTATQRLQIANAIMGATDDEGVSIWKAPSIFNIVGDMDSVEDLAKISLDEIKKEAETEVAEAPGKSKSAQIAGKNDAASGRSFASRIIDNVKSTFNSATTKVTNWMENTSARVSQVIGRAQEGITDTYYTAKYKLGAGGELTPTGQTYGQLATGNGGVWENIPMPQSNKSRDAAQATFKAVSEMTGVPVELLNIFCGIESSFNYNAKAPTSSAAGWFQFIKSTWKGMLAKYGAKFGIPADDENGSLRFDPRINALMGAMFLRDNYEYLENALGRAPTDVDLYLAHFMGPAGARKFLTRDQNSIGAEIFPDQARANRSIFFKTDGSARTLGEIYQVMENKVAKFRTGGGKNANSQSLGKPKSTEELMNDAAAAKQKDMATDKELIGGAADTSMTDSSNNKIGLGKIMSGMASPLRTNAPSMMLPGAPSSAADVSSGQQPVVDTGAATQATVRASQIEEQRKVVTSQDKAMLDIASEQLSVLKQFHADMLNYIKNKAANPSAQTGQEQANTIAPSQRPGRVVDNRPLPIRLR

Physico‐chemical properties

protein length:	2237 AA
molecular weight:	245580,81680 Da
isoelectric point:	8,68307
aromaticity:	0,07599
hydropathy:	-0,46097

Domains

Domains [InterPro]

DC_0124
STR
1–899

DC_0124 G3DSA:1.10.530.10 DC_0228

Coil
Unmapped
149–173

Coil Coil DC_0124

IPR023346
STR
1883–2015

IPR023346

IPR008258
ENZ
1885–1978

IPR008258

XHB37482.1

1 2237

Architecture

STR

RBD

STR 1-2065 | RBD 2066-2237

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0124	STR	DC_0124	1	899	Novel HMM	DC_0124	Central	Low	Positional only	152 proteins / 152 hits
Coil	Unmapped	-	149	173	Coils	Coil	-	-	-	-
Coil	Unmapped	-	738	758	Coils	Coil	-	-	-	-
DC_0124	STR	DC_0124	894	2065	Novel HMM	DC_0124	Central	Low	Positional only	152 proteins / 152 hits
G3DSA:1.10.530.10	RBD	G3DSA:1.10.530.10	1870	2052	Merged direct domain	G3DSA:1.10.530.10	C-terminal	Low	Positional only	95 proteins / 95 hits
IPR023346	STR	IPR023346	1883	2015	Merged direct domain	Lysozyme-like domain superfamily	Central	Low	Positional only	29 proteins / 29 hits
IPR008258	ENZ	DC_0010	1885	1978	InterPro cluster	Transglycosylase SLT domain 1	C-terminal	High	Text match	100 proteins / 142 hits
DC_0228	RBD	DC_0228	2053	2237	Novel HMM	DC_0228	C-terminal	Low	Positional only	28 proteins / 28 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Pseudomonas phage vB_PaeM_HUST_1 [NCBI]	3348357	Viruses >
Host	Pseudomonas aeruginosa [NCBI]	287	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Pseudomonadales

Coding sequence (CDS)

Genbank protein accession

XHB37482.1 [NCBI]

Genbank nucleotide accession

PQ227241.1 [NCBI]

CDS location

range 36397 -> 43110
strand -

CDS

ATGGCCAAGAAGGTAACATTGCCCAAAGGTCAAACTGGTGCAACCGGTACAACATTAGGGCAAGCCGGTAATATTCTTGACTTAAGTGATATCGATGATATTTTTGGTGATACACCGAAAGCTAAAAAGGGATCACCTGTCACTGAATTTTTTAATGGTATTAAACAAGGACTCTTTGACTCTGTTAAACCACAACAAGCTTTAAAAGCATTCATGCGGTCTGCGGCACCAGATGGCTTTTCACGTATGTTCGGTGTATATGAAGATACGATGTCAACTATTCGGGATGTCAAAGATTCTGTAGAACGTACGAGTGCTAGTGATTTACTCTTTTTAACAAGAGAAGCACAAGATTTAGCAGTTAAGTTAAAAGATAAAGTTCCAGCTTCTGTTTTTGACAGACTTAATAATCGATTAGAAAGTCAAATCGAAAACTATAAGTACGCTGAAGATTCAAATAGAAATTATAAAGAAATCCGTCGTCGCATGGAAGCTGAACGTGACGAGGATGAACTTAAATCCGCTATAGACCAAGTAACTCTTGTTCAACGGGATTTAGCTATAAAAGCTGAACAAGGCGAAGTTAAACGATTCGCTATTGGACAAGCTGAACGTGGAATACGCGATAAGGTATCGGCTGATAGATTTGACTGGATGGCTAAGGCTATGGGTCAAACAGTTGATAATTTATCTAAATTAGCTAGTTATAATGAACAAGTTAATTACAGTATTCAAAAGAAAGGATTAGAAATCCAGTTTCGTTCTATGTTGCATCTTCGGAAAATTGCACAGCAAACCGAAGCTACCATGGAATTATTAAATAATGGTTTTGCAGCACTTGTTAGAAACACAGGGATTCCCGATCATAAAAAGTCATCAATGAAGGATCTTGTTGGCTTTAATGCGGCTCAACGGGTATCGAGTAGTTTTGTTGACAACGCCATTCAAACATTACCAAATTTCTTAGGTAATTTTGGATCAGCCGTAACTAATAATGCTACTCGCTTTGCAAATGAAAATATCCGTAACTTTGCTGATGCAGCTCGTGCTGGAAGCATGTTTGGCGCAGATGCATGGGAGAATAGATACAATATAGCCGGTCAATTCGCTGGCTCTTATCTTGGTGATTGGACAAGGAATTCAGTTATACCTGTATTAGGTAGAATGGTTCGTCCTGGTGTGGAACGTTTTTCAAATAACTATCTAGGTGGTCGACATAATCAAGCATCTTATTTACTTGATAACTTCCCTGCCTGGACACAAGAATACATGAATAACTACCAAAACACTTATGGTGCTCGTGGTATTCTTCGTGACATTATGGCTCCATTTGTTCCACAGTTCACATTACAAGATCGATTAAAGACTGGCTCCTATCAAACAATTGGTCAGGACAGTGGCTTTAATCAACTAACACAACGTACTATAGTTGAAGCTATTCCTGGATATCTATCTAGGTTACTACAAGAAACAAGAATGATCCGGACTGGTCGTGATGATATTACACGTGAAGTGTTTGATCTCTCAACTGGTTCATTCATGTCTGTAGAGGATTCAGCTGCAAACACAGAACGTCGTCTAGTTAGTCGTTCTACTGTACGTGGTGTAAGTGGTGCTCTTACCGATGTTCTTGAAGCATTTGACCCAAATAAAGAACTATCAATAGATGCTAGGAAAGCACTAACTGAACGTTTAATTCGTGATGCCAATATGAATAAACGTTTTGATCCCGAAGCATATGCTCGTGCTGGTGGGTATGATCGTTCTAAAGTGTCCGGTGAGACGATTAAAGAATTAACGGAATATATTAAACGGCAATACAATATTGGTGCTGATGGTAGGATGGCAAGCACTAATGAAAACTTTGCTAGGCGTCAAGAAATATCTACATTATTCTTAGACGTTAGAAACTTCTCACGTGACCCTATTAAAGAAATTGAGCGTTTAACCAATGCTGGTAAAACTGATCAATTACGTGAAATGGGTATTATCATAACTGAGCAAGGTATTGATCGTATTAATTACCCACGTATTTGGGAACTGATGAGTTCAGAAGTAAAATACGAAGGATGGGGTAATGATAATCCATTTGATCGTTATAGTGATACACCACCTTCTGATGATGGTGGTCCAGGGCAACTCTCCCCACTAGGCGATCAGAATAACCCGCACTTTATTGGCCCAATGTATCAGTCACAAACTGAACGAAAAATGCGGCAAGCTCAAGAGCAAGTTATTCGTGCTTCTAAGCTGGCCCAAGAACAAGCTAATAAAGGGTATGATTATGCGCAGCAAAAAGTATCACTAGCTACGGATTATGTAAGGGATAATGTACCTAATCAATTTAGTGAATTACGCAGGAATATAAACATACCAGCGTCAATGAACTTTGGTGATTTAAGAGATCAACTGTACGGTCAAGCCGGCGATATGTATAGTCGGGCTGTTAACTATAGTAATCAGTTCAATGGATATTCTGATATAGTCAATCAGTCAATAGCTGATCTATATACCAAAGCTAATACTTTTACTCCAGTTATCAAAGGAATGGATTTTTTAAATGGAAATTTAATTGATATTAATACTGGTAAGATAGTAGAGAAAATATCTGATATCACTGGTGAAATTAAAAACCAAGCTGGTATAACTGTAGTAACCGCTCAAGAAGTAGCTACTGGTCTTTATAATCAACGTGGTGATTTATTAACCAAGGCAACTGATATTGCTAGTCAATTACGTGATAAAGCTGCACAGATCGCTGGTGATGCTAGAGAACGGTTAACTCAAGGTTTAGATAATGTTTCTGATATGGCTAAAGATTGGTATTTACCTGGTCGTGAAGAAGCCGTTATTCTTGGACGTGATCTACTAGCCGGTGAGTATATCGATACAGCAACTAATCAAGTTATAACCAATTTGAAAGATGCTAAGGGTACTATTATTAATAGGGCTGGTGATGTAGTCGTAACCGCTCAAGAACTGGCTAAAGGTTTAATACGATCAGATGGTTTCAATCTACGAAGGAATGTAGCAGATGCATCTAACTGGATACAACGAAATGTACTAGGTGGTGGATCAACTACTCAGAAAATCTTTAATGCAATGGGTACAGTTGCTAATAAAGCAAAAGACTTTACTCTTGGATTAGGTAGGGATATTCTAAGTAATCGAGATGCATATTTACCTGGTATGTTAAAACCAGTATTACAGAAAGTTAAACTAAAAGCAGGTGAGTACTACACAGCTGGTGGCAACCTATTAAAATCATTCGATGAAATTAATGGACCAGTTTTAGATAGGGATGGTAACATTGTTGTTGATGAAGAACAAATACCTGAACTTATTAACTCTGATGGATCTAAGCATACTGCTGCTAAGAATAAGGGTTTATTCCGAACTGGTTTAGGTAATCTAGCCCGTGGTTATGCTAATATGTCAATGCGTTATTGGAAATGGTTGGGTAAGAAATCTGTAGATACTGCTAAAGGAATGGCGGGTTTAGGATATAAATTACTTGGATCACCTTTCAAGAAACGTTTTAGTGCATTTACTGGTAAAGTAGAAACACAGATAGATAAGAAAGCTCTAGATACAACCACTGATCAATTATTAGCAGGTATATGGGAAGAACTGCGTAATCAGAAACCAGATGCTAATAAACCTCGTCGTGGTTCCTGGCAAGATCTAACATCACGTGTTAGCGATACTTTAAATGGTAAAAATAACAGTGATGAAGAAACCACTGAATCAAAAGGTCTTTTTGGTAAACTTGGTGATACCTTAAAGAATATCTTTGGTAAGAAGAAAGGCGATGAGGAAGATGAAGGATTATTGGAAGACCTAGGTCTTGGTGGTAAGAAAGGTGGGAAATGGGCTGCTGCCCGCCAAATACTTGGTAGAGGTGCTTTAGCTATTGGTGGTGGAGCATTATCAACAGCTGCTGCATATGCTAGTTTTGGTGGTACTGGTGCATCAACAAATGATAAATTAGCTGGTGCAGCTATTGTAACCAGTAATCCGATTATGTGGGCACTTAAAGATTTCTTAATAAAACCTGTATTAGGTTGGAGAGGAAGTCAGAAATTCAAAGATGACTTAATCAGTTATCGAATGATGCAGTACGGTGCTACAACAACTGATCAGATGAACAAGGTTACTGAATTAGAACAACTTGTATCTAGTGTAGCTACACGTGGTGGAGATGCCTCCTTTGATGTAAGGGCTCTTAATGCACGTGACATTATTAAGATATTTGGATATGGTGCTGATGATGGCCCAGCTATCATGCGTTTAGCCAATTGGATCGACTTCAGATTTAAACCGATCTTTGAGGCATGGCTTAAAGGACTATCCAAAATTAATCGTAGTGATGTAGATATCAGTGAGGTTGATAGTAAAGTACCTAATGAACTAAAAGGACAGCTCATTAGATCAGTATCATTCCCATACGAAGGTAATACACCTTATCTAGTTCTTAATAACCCATTTGGTGAAGAGGACTTATCAATTGATGTTGCTTCTATACAGATGAAAGAAAAGGAATTATTGGATAAGTATAGTTCCACAGAGAAAACACCTGCCGCACCTAAAGCAACTTCCAGTAGTTTTAAGGAAAGTGCTACTGATGTAATAAATGATACCATTACTACGATTAAGTCTAAGTCAACTGATATCACTAATTGGTTTAGGAATTCAACTATTGGAAAAGCAGTTAAAGCAGTTAGTCCAGTTGAATCTATACGTAAAATGGTAACTACAGTAGTAGACACAATTATTCCTAAAGCAAATGCAAGTGATTCATTAACTTCATTGCAAGCGCTACGTGTACACGCTTATGGGATGCAAGGTTTAGACTTAGCTGCTGTAAATGGATTACTATCGATTGAAAGTCTTGTTAATGATAAAATGCGAGTAGCTAATGGTAAAGCTACTTATACAGGTGATATAGAGGAATTAATTAAGTGGACTGGCCAAGCATTTGGTATGGTTACGACTAGCGATGGTCCTGACCGTGTTAAAGTGGTTGATTGGTTATATCGTCGATTCCTACCTGTATTTAAAGCATTTATTGTTACTGCTCGATCAGTATCTACATCGATAACGCTTAGTCAAATAGAAACATTAACAGCAACTCAGCGCCTCCAGATTGCTAATGCGATAATGGGTGCTACTGATGATGAAGGTGTTTCAATATGGAAAGCACCATCAATATTTAATATTGTTGGCGATATGGATTCGGTAGAAGATCTAGCTAAAATAAGTCTTGATGAGATAAAGAAAGAAGCTGAAACTGAGGTAGCTGAAGCTCCAGGTAAATCTAAATCTGCACAGATAGCAGGTAAGAATGATGCAGCTTCAGGACGTAGTTTTGCTAGTCGGATTATTGATAATGTTAAATCAACATTCAATAGTGCCACGACCAAAGTAACTAACTGGATGGAAAATACATCAGCACGAGTTAGTCAAGTTATTGGTAGAGCCCAAGAAGGGATAACTGATACTTACTATACGGCTAAGTATAAGTTAGGGGCAGGCGGTGAATTGACACCAACTGGTCAGACTTATGGTCAATTAGCAACTGGGAATGGTGGTGTATGGGAGAATATCCCAATGCCGCAATCTAATAAGTCTAGAGATGCAGCTCAAGCTACATTTAAAGCTGTATCAGAAATGACTGGCGTACCAGTGGAACTATTAAATATTTTCTGTGGCATTGAATCATCATTCAACTATAATGCCAAGGCACCAACCTCATCAGCAGCAGGCTGGTTCCAATTTATTAAGAGTACCTGGAAAGGGATGCTTGCTAAATATGGAGCTAAGTTTGGTATACCTGCTGATGATGAAAATGGTTCACTACGGTTTGACCCACGTATAAATGCTCTTATGGGTGCGATGTTCCTTCGTGACAATTATGAGTATTTAGAAAATGCATTAGGTAGGGCACCCACTGATGTGGATCTTTATCTAGCGCACTTCATGGGTCCAGCTGGTGCACGTAAGTTCCTTACACGTGATCAGAACTCTATTGGTGCTGAGATATTCCCTGACCAAGCTAGGGCTAATAGATCTATCTTCTTTAAAACGGACGGTAGCGCTAGAACCTTAGGTGAAATCTATCAGGTCATGGAGAATAAGGTTGCTAAGTTTAGAACTGGTGGCGGTAAGAATGCCAATAGTCAATCACTTGGTAAACCAAAATCAACAGAAGAGTTGATGAATGATGCAGCTGCTGCTAAACAAAAAGATATGGCTACTGATAAGGAGCTTATCGGCGGTGCTGCGGATACATCGATGACAGATAGTTCTAATAATAAAATTGGACTTGGGAAGATAATGTCTGGTATGGCGTCACCATTAAGGACGAATGCTCCATCAATGATGTTACCTGGCGCACCTTCATCTGCGGCCGATGTGTCTTCTGGCCAACAACCAGTTGTAGATACAGGTGCAGCAACACAGGCTACAGTACGCGCATCTCAAATAGAGGAACAGCGTAAAGTAGTTACCAGTCAAGATAAAGCCATGTTAGATATAGCAAGCGAGCAATTAAGTGTACTGAAGCAATTCCATGCCGATATGCTTAATTACATCAAAAACAAAGCGGCTAATCCATCTGCACAAACTGGACAGGAGCAAGCTAATACTATAGCTCCCTCTCAACGTCCTGGTCGGGTAGTGGATAACCGTCCATTGCCAATTAGACTACGTTAA

Genome Context

Tertiary structure

PDB ID

9d2d46059882c7ca33bfecc737bbafb1ebb9fa79f6ee6af356e2a96df7a256a1

ColabFold

Source ColabFold

Method ColabFold

Resolution 0,5171

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence