Genbank accession
YAW78895.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence Phold
Probability 1,00
TF
Evidence RBPdetect2
Probability 0,96
Protein sequence
MSSKFNSIDVYNDIKAKSAHTGEYNIELPQGEYNIDIKYASSAFVDGIYDFTISSGGSGYSEGDTLSVDGGTTLAYLEVTSVDAGEVTGLKFYLNTAQHGKTHGLNRGSGYVPSPTPVPTTTITGNGTGLEIIITELTGNPDSAPKSENLYLSSSNQYVSGDYLNDAGNLVGVIPDNVHGNKTSPELHAVATQTEAGFMSAQDKSDLDELMSTGSGAVRESRLVKLGHGIEPEEGNAPDPLKPNELDLTTDIKFKVTNGRGILVDETGVLINDAIVLTSDENSNIIDNKNITLNSNSGYLSGTGTLFGLPTPDQNSPEHQAPNKKYVDDLRAYLDGDGLKHGSKLELDLAVGSPYIINSEGKLAFDLINTSGEENAAFSDLFLFQRENTIYRATRDQLLANTYGNGIEPYSATNVKISVKAQSTKGLSVSEDGVRVDYSNMLDGSYMPTHRIMMYDQDSDSILSVPAGDMVQLSGLPGYGLVPRADGQDTYVDINTGVGGGLSVVAAAGSEISLDATNMTAASEAAGSDQIVIFTSGSPTRPKIVSKDAFLGSLTSVLKRRGTWSPDDSNPPSVGTVVGDNKNLFLYTGMPPIPDDGDFSPDGYLYICTDTGSVDLQGTGTEQVYVSGDQAIWTIDFNPDDPDWDGTTTLYSSGTRVKHNGYSYTCILDHDASAIIDDEPGTGNNWTTYWKFSGEWSKVSSGSSGFQIFTPATGVDRTGTTLVATIGDYKASMITNDSGFVSGNTLADAFENVVVTSGNQTIGGSKIFSNNVQMEATPISAKHLVTMGWVNASFLRTTGGNLTGALNITGNNLIIKTSDGSSTTLRYGNDNDGSANEFGLRFGGVGSRTQPDFVLRWPTDKENLRVSSSGNMTVSGEIYSNYIGLSNKKAGVEFLEDQSTMITSTKKLTLKESDISPRFFDGTTWYNMYHEGNTPTADQIGALRLSQFPTYTTQYDGVSNTATKELLDYHGNTLSRGEYRVRLVTAGTGTITGAIYIVNISESGTAGITDLWHNGYGSNHPELRIVDGKVHVATQHTSGYSVIAYVTSVQINTSSNFFGYEKQLYSVSNKPTATEIGALPLTGGTLTGPLNIGSNKLIVEGKNIIGVDSNLCRFGDATGASAVRIITNSVNNLSVQVGSNLYKVYNEGAKPTASDVGLGNLYRPSTGVLSWTSTSGETTIGMLNTTWNHYQTTASSGHYFYKSVNIQSGLTVGGNSSFVGKGVFSGNVDVSGYVYVAAADANPRLHIKRTNLAYNVNMAFEGSDSVKTYFGKTQDGHFAYGNNVDVNGAGYKIYSTGNKPTYNDVGISTKDIISLSGALGTTDLNSLTSSGFHFQNANANATTARHYPTAQAGSLLVQKAAGVTQTYTTYGPSTTAVYVRSYYNGSWGNWIEMYSTLNKPTPAEIGAIPITGGSVSGNLSVGGSFSAARISLGFDPGINNSIGCSGWFRSSGNTGWYNSTYNGGIYMIDSTYVRVYASKTLYVDNQIISTGNVQAYYSDARLKDITEELDTASALEAVCKWKKVRYTANETAHELGGYDTKKKEIGLLAQEIEEDYPELTSLAPFDHEVKEDGEIVSKSGENYKTLDYERVIAVQAAAIEELNKKIEALTKRLDDMQ
Physico‐chemical
properties
protein length:1617 AA
molecular weight: 172823,44820 Da
isoelectric point:4,80087
aromaticity:0,08905
hydropathy:-0,33414

Domains

Domains [InterPro]
DC_1938
ATT
944–1142
cd19958
STR
1319–1394
IPR030392
CHP
1498–1613
YAW78895.1
1 1617
Architecture
ATT
STR
ATT 944-1142 | STR 1226-1613 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Shewanella phage SA-M
[NCBI]
3417976 Viruses > unclassified bacterial viruses >
Host Shewanella algae
[NCBI]
38313 cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Alteromonadales

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
YAW78895.1 [NCBI]
Genbank nucleotide accession
PQ510825.1 [NCBI]
CDS location
range 204426 -> 209279
strand +
CDS
ATGTCATCTAAATTTAATAGTATTGACGTTTATAACGATATAAAGGCAAAATCAGCCCATACAGGTGAATATAACATAGAATTACCGCAAGGCGAATATAACATAGACATAAAGTATGCTAGTTCGGCATTCGTAGATGGTATCTATGATTTTACTATATCATCTGGTGGTTCTGGATATTCAGAAGGTGACACACTATCTGTTGATGGTGGGACAACACTTGCCTACTTAGAAGTAACATCAGTAGATGCTGGTGAAGTAACTGGATTAAAGTTTTATCTAAATACAGCTCAACATGGAAAAACCCACGGGCTTAATCGTGGGTCTGGTTATGTTCCTTCCCCGACCCCCGTACCAACAACTACTATAACTGGTAATGGTACTGGATTGGAAATAATAATAACAGAATTGACTGGTAATCCAGACTCAGCACCAAAGTCAGAAAATTTGTATCTTAGTTCGTCTAATCAGTATGTAAGTGGTGACTATCTAAATGATGCAGGTAATCTAGTTGGTGTTATACCAGATAATGTCCATGGAAATAAAACGTCTCCTGAACTCCATGCAGTAGCAACACAGACCGAAGCTGGATTTATGTCAGCTCAGGATAAATCTGATTTAGATGAACTTATGTCTACTGGTTCTGGTGCTGTTAGGGAAAGCCGACTGGTTAAATTGGGACATGGAATAGAACCAGAAGAAGGTAACGCACCAGATCCATTAAAACCCAATGAACTTGATCTAACAACAGATATAAAGTTCAAAGTAACTAATGGTAGAGGTATACTTGTTGATGAAACAGGTGTTCTTATTAACGATGCTATTGTACTTACCTCCGACGAAAACTCTAATATCATAGACAATAAAAATATAACCCTTAATAGTAACTCTGGATATTTGTCTGGTACTGGTACTTTATTTGGTCTTCCAACTCCTGATCAAAATTCTCCAGAACATCAGGCACCAAATAAAAAATATGTTGACGATCTTAGGGCTTATCTTGATGGTGATGGTTTAAAACATGGTAGTAAACTAGAATTAGATCTAGCAGTCGGCTCACCTTATATCATTAACAGCGAGGGGAAACTTGCATTTGATTTGATTAATACTTCTGGTGAAGAAAATGCTGCGTTTTCCGATCTATTCTTATTCCAGAGAGAGAATACTATATATAGAGCAACCCGTGACCAATTACTTGCTAATACCTATGGTAATGGTATAGAACCATATAGCGCCACAAACGTAAAGATATCAGTAAAAGCGCAATCAACTAAAGGTTTGTCTGTTTCTGAAGATGGAGTAAGGGTAGATTATTCTAATATGTTGGATGGTAGTTATATGCCAACACACAGAATAATGATGTATGACCAAGATAGTGATAGCATTCTTTCAGTGCCTGCTGGTGACATGGTTCAATTATCGGGATTGCCAGGATATGGTCTAGTACCACGTGCTGATGGGCAAGATACCTATGTTGATATCAATACTGGTGTTGGTGGTGGTTTATCAGTAGTGGCTGCTGCTGGTTCGGAAATAAGCTTAGACGCTACTAACATGACGGCAGCAAGTGAAGCTGCTGGAAGTGATCAGATTGTTATCTTTACTTCTGGTTCACCAACAAGACCAAAGATAGTATCAAAAGACGCATTCTTGGGGTCACTTACTTCTGTTCTTAAGAGAAGAGGTACATGGTCGCCAGATGACAGCAACCCACCTTCTGTTGGTACAGTAGTTGGTGATAATAAAAACTTGTTCCTTTATACTGGTATGCCTCCAATTCCAGATGATGGTGATTTTTCACCAGACGGGTATTTGTATATATGTACTGATACTGGTTCTGTTGACTTACAAGGTACAGGTACAGAACAAGTATATGTATCTGGTGATCAGGCAATTTGGACAATAGACTTTAATCCAGATGACCCAGACTGGGATGGAACAACGACTCTTTACTCTTCTGGTACAAGAGTAAAACATAATGGTTACTCATATACATGTATACTGGATCATGATGCATCTGCTATCATAGATGATGAACCAGGCACTGGTAATAACTGGACAACTTATTGGAAGTTCTCTGGTGAATGGTCAAAAGTTAGTTCTGGTAGTTCTGGATTCCAGATCTTTACCCCTGCTACTGGGGTTGATAGAACAGGAACCACATTAGTTGCAACCATTGGTGACTATAAAGCTTCAATGATAACAAATGATAGCGGATTTGTTAGTGGTAATACATTAGCAGATGCTTTTGAAAATGTTGTAGTCACAAGTGGTAATCAAACCATTGGTGGTTCAAAGATCTTCTCTAATAACGTTCAGATGGAAGCTACCCCAATATCAGCAAAACATTTAGTTACCATGGGTTGGGTAAATGCTAGCTTCCTCCGAACTACTGGTGGAAATCTAACTGGTGCTCTTAATATAACTGGTAATAATCTGATAATAAAAACGTCTGATGGATCGTCAACAACATTACGATATGGCAATGACAACGATGGTTCTGCCAATGAATTTGGTCTACGTTTTGGTGGAGTTGGTTCAAGAACCCAACCAGATTTTGTATTAAGGTGGCCTACGGATAAAGAAAATCTACGTGTTAGTTCCTCTGGTAATATGACTGTATCTGGTGAAATATACAGTAATTATATCGGATTATCAAATAAAAAGGCTGGAGTTGAATTCTTAGAAGACCAATCTACCATGATAACTTCAACCAAGAAATTGACACTAAAAGAATCAGACATTTCCCCTAGATTTTTTGACGGTACAACTTGGTATAATATGTATCATGAGGGTAATACTCCCACTGCCGATCAAATTGGAGCACTGAGATTATCACAGTTTCCAACATATACAACCCAATATGATGGGGTGAGTAATACAGCTACTAAAGAGTTACTTGATTATCATGGTAATACTTTATCTCGTGGTGAGTATAGGGTTAGACTTGTAACAGCAGGAACTGGAACAATAACTGGCGCAATATATATAGTTAATATTTCAGAATCTGGGACTGCTGGTATAACAGATCTATGGCATAATGGTTATGGAAGTAACCACCCAGAACTTAGAATAGTAGATGGGAAAGTTCATGTAGCAACACAACATACAAGTGGCTATTCAGTGATAGCTTATGTTACTTCTGTTCAAATTAATACAAGTAGTAATTTCTTCGGATATGAAAAGCAGTTATATTCAGTGAGCAATAAGCCCACAGCTACAGAAATTGGTGCTCTACCTTTAACAGGTGGGACATTAACTGGACCATTGAATATTGGTTCTAATAAATTGATAGTAGAAGGGAAGAACATTATAGGCGTTGATAGTAATTTATGTAGGTTTGGTGATGCAACTGGTGCTTCAGCAGTTAGAATAATAACCAATAGTGTTAATAACTTATCTGTTCAGGTTGGTTCTAATCTTTATAAAGTTTATAATGAAGGTGCCAAACCAACAGCTTCTGATGTTGGTTTGGGTAATTTATACAGACCATCTACTGGTGTGTTATCATGGACCTCCACATCAGGTGAAACCACTATCGGGATGCTAAACACAACATGGAATCACTATCAAACAACAGCTTCAAGTGGTCACTACTTTTATAAGAGTGTTAACATACAAAGTGGTCTAACGGTTGGTGGAAACTCTTCTTTTGTTGGAAAGGGTGTGTTCAGTGGTAATGTTGATGTTAGTGGTTATGTTTATGTTGCCGCTGCCGATGCTAACCCTCGCCTCCATATTAAACGAACTAATCTTGCATATAATGTTAATATGGCATTCGAGGGCAGTGATTCTGTTAAAACATATTTTGGTAAAACACAAGATGGACACTTTGCATATGGTAATAATGTTGATGTTAATGGTGCTGGGTACAAGATTTATTCTACTGGTAATAAACCAACATATAATGATGTAGGTATATCTACCAAGGATATAATATCTCTTTCGGGGGCATTGGGAACTACGGATCTTAACTCTCTAACGAGTTCTGGGTTCCATTTCCAAAACGCTAATGCCAATGCAACAACAGCAAGACATTATCCAACGGCACAAGCTGGTAGTTTATTAGTACAAAAGGCTGCTGGTGTTACCCAAACATATACTACCTATGGTCCAAGTACCACAGCAGTATATGTAAGAAGTTACTATAATGGTAGTTGGGGTAATTGGATAGAAATGTACTCTACCTTAAATAAACCAACACCAGCAGAAATAGGAGCTATACCAATTACTGGGGGTTCTGTTAGTGGTAATTTATCAGTTGGTGGCTCATTTTCTGCTGCTAGAATAAGCCTAGGTTTTGATCCAGGTATTAATAATAGTATTGGTTGTTCTGGGTGGTTTAGATCCTCTGGTAATACTGGATGGTACAACTCAACATATAATGGCGGTATATACATGATTGATAGCACATATGTCAGGGTATATGCCTCAAAAACGCTTTATGTTGATAACCAGATAATCTCTACTGGTAACGTACAAGCATACTACTCAGATGCTAGACTAAAAGATATCACCGAAGAACTTGATACAGCTTCGGCTCTTGAGGCTGTTTGTAAGTGGAAAAAGGTAAGATACACTGCTAATGAAACAGCACATGAGTTAGGTGGGTACGATACAAAGAAGAAAGAGATAGGGTTGCTTGCTCAAGAAATAGAGGAAGATTATCCAGAACTTACTTCTTTGGCACCGTTTGATCATGAAGTTAAAGAAGATGGTGAGATAGTTTCAAAATCTGGTGAAAACTACAAGACTCTTGATTATGAAAGAGTAATTGCAGTTCAAGCAGCAGCTATTGAAGAACTAAACAAGAAAATAGAAGCATTAACTAAGAGATTAGACGACATGCAATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
828a98988ce1c9ece2424380313756b5c2e30689291db99a6a555e000417ebc0
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,4944
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50