Genbank accession
XYM58625.1 [GenBank]
Protein name
short tail fiber protein
RBP type
TF
Evidence Phold
Probability 1,00
Protein sequence
MAKVLVGKGDQVQIRYPTPPTWNTQTTVQVQIGTGLDPTDVTFGTRIPDATVDQFTFVNQNGTNALNQAVQTFEKDTFYYSNTILLNGIEIVVPASISVTTSGSQNPNISNPNVFARDLTGNQSQAAFEVNSSGTWVTSANVQNGDTIRLRIKTEDWYTTTTNVTLTVGDETFGTNIGQASTRIIDTWSITTRAQSQSIGAIVFTDFVDVLEAEHGTYKSITLSTDLIDDDCVLRATATEDGQVSKDGLTWTQDLRNIVLGDTIYCRVAIGTWTEKTETDIRVFAVPSETYNDGNGNYYDNNEAGTYGRPDLGVSRRYTVVQETGDEQDDWNIWTEVKRYPDSVECKPIYIISDGDEVVVSSRNEYNYANISIEDLLGEITYGYYYADLLVSGLGVEYVGGAYLDLQEPLDITREGFVNLQPTGPIKDNFDVGGNDPNNLNDVYVLARISNGNADIRNKNVGGPWVQSMYVKNGDLITIRQRSPLVYNTSFVSTLLFEGPPFGGQNGNPTEGPDVANRSRDNITDTITIKNRQARITPYPFKATNTYNALPGEVVIRTFEVRGIDEPVTVNIANASPASGAQISKDGSTFNGNNITDVNDGDVIQVKMTASTTLGSFVFATIQIGTRSDTVYLFTGRENYDYITYQNAGDISAPITVNIPTYAQDVDFVITGAGGGNGGDDAPQSFGGAGAAGNELRGIISLPTSYLLANNQLNLYLGAAGADGITFTASAAGGAGGWGYDTGGRGGNAGPGDRSGSGGGGGGASAIQLVDGTVIAVAGGGAGGAGAGNDTEVPPDNMHGNYLTQGRLRTDLNNIGAEDADNNPSQGGGPGGGGGGWGTAGSLLTSREDVYGVEVQTDDLDTTAGQGGGAYYNTEYVTLASNLGLDVVNGETVPPQQGAAASDGGFILLGFPPQDRDPEPVTFNTLTGQPPNTTVDSNIVQVRGITGLVLVTVAENSAQVRVYDTDGVTLISDWDAPSVLVSNEQWIQLRMTTGLDYYSKYISTIDIGIKRFTWEVETGEPPDTLPNPFEIPPVFDVEPSVTGAPNLIESEPILISGINTAVELYTIGVLGAELAICDPVDNCSAYSAAGIGNPLYISNNQYFKVRLAASEDYQTTVATTVQVGSTPASPAKKFEIRTKDEPDITPDNFFFFPLEDQPLELLVTSINSVTIRGIDSPTFFRVTRDDGGSPNATIILNGDETGLSEVNVQQNDVIKLQYFTSDILGDNVEFTIECGTYETQWQVENEGSFGVNPTPFLFTDVYADPLQYGVSNEIITVTGINVPVPIYGTNGIQFDIDLTGSYETLDILDARTITNSTQFRVRLLASPVAGFDTSGIVTVGSYQTPYTVFSNAAVQDPIRGQWYSSIQTIKPGGDGQIRFSTKFEGLPIGTIMPVFQDSTALNEDGVADNWGVLNGRADSRFHGWVYCDGRFVNKLEYPLLFEVLDFDYGATSADLNLFKVPDMRNRRICGTGPIDGNSSSSPILNPLYGPAKASINASGNIPGSQGGQWFIDTISDPGVDTQGDNNEFEQVITPGEGQPAQSSPFFTIANVRTQGYSNVTGSVEFQATGEMGGVISIGQAQIRDVPRHFHDLISGAPDPSRNKGYVQWGRSAAYSNQAIEVTSKAGEDGPSIVTDVSRINIWGYATGDYTIDNPDNVPRTDISSDDDGNIPIFAASSTNWTNSSGYVGEYINNKHSSLNVDQPNVERGTSNYNEIASYINLETWSGGQSDSSGSEYRFIGAVDVPEKFIQIQAYRPTRAKHSHYISLNDPGDPDQTFSWGKGDGAGVMTAGSPFATTEVDMRFDSFQVGMEILPGTFILNQTKQLIPVPELSPQTEVPLITPYSYVHWMIKAF
Physico‐chemical
properties
protein length:1853 AA
molecular weight: 198911,23790 Da
isoelectric point:4,20969
aromaticity:0,09228
hydropathy:-0,29347

Domains

Domains [InterPro]
DC_0346
STR
642–1835
IPR049304
STR
655–870
IPR011083
ATT
1422–1466
XYM58625.1
1 1853
Architecture
STR
STR
ATT
STR
STR 3-383 | STR 411-1379 | ATT 1380-1466 | STR 1467-1835 |
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage Sf-FR1
[NCBI]
3413218 Viruses >
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
XYM58625.1 [NCBI]
Genbank nucleotide accession
PV340855.1 [NCBI]
CDS location
range 38611 -> 44172
strand +
CDS
ATGGCTAAGGTTTTAGTAGGTAAGGGTGATCAGGTACAAATTAGATACCCTACACCACCCACATGGAATACGCAAACTACTGTCCAGGTACAAATTGGTACTGGATTAGATCCTACTGACGTTACATTTGGCACTAGAATTCCTGATGCTACTGTAGATCAATTTACTTTTGTAAATCAAAATGGTACTAATGCTTTAAATCAAGCAGTACAAACATTTGAAAAAGATACTTTTTATTATTCAAATACCATTCTATTAAATGGTATTGAAATTGTTGTTCCAGCAAGTATCAGTGTAACTACTTCTGGTTCACAGAACCCAAATATTAGTAACCCAAATGTTTTTGCAAGAGATCTAACAGGTAATCAGTCTCAAGCAGCATTTGAAGTTAATAGTAGTGGAACATGGGTGACCAGTGCAAATGTCCAGAATGGCGACACTATTAGACTAAGAATTAAAACAGAAGATTGGTATACAACTACAACAAATGTCACTCTCACTGTTGGTGATGAAACATTTGGTACAAATATTGGACAAGCATCAACTAGAATAATTGATACGTGGTCGATTACTACAAGAGCACAAAGTCAATCTATTGGTGCTATTGTCTTTACTGATTTTGTTGATGTATTAGAAGCAGAACATGGTACGTATAAATCAATAACATTAAGTACAGATTTAATTGATGATGACTGTGTTCTAAGAGCAACGGCAACAGAAGATGGTCAAGTTTCTAAAGATGGTCTCACTTGGACACAAGATCTTAGAAATATTGTATTAGGAGATACTATCTATTGTAGAGTTGCTATTGGTACTTGGACTGAGAAAACAGAGACAGATATTAGAGTGTTTGCTGTTCCCAGTGAAACTTATAATGATGGTAATGGTAATTATTACGACAACAATGAGGCAGGAACATATGGTAGACCTGATCTGGGTGTAAGCAGACGATATACAGTTGTTCAAGAGACTGGTGATGAGCAAGATGATTGGAATATATGGACTGAAGTAAAGCGTTATCCAGATTCAGTAGAATGTAAACCCATTTATATTATTTCGGATGGTGATGAAGTTGTTGTATCTAGTCGAAATGAGTATAATTATGCGAACATTTCTATCGAAGATCTATTGGGTGAAATTACATATGGATATTATTATGCAGATCTGTTAGTTAGTGGTTTAGGTGTAGAATATGTTGGTGGTGCATATCTAGATTTACAGGAACCATTAGATATTACTAGGGAAGGATTTGTTAATCTCCAACCAACTGGACCAATTAAAGATAACTTTGATGTTGGTGGTAATGATCCTAACAATTTGAACGATGTATATGTTCTTGCTAGAATTTCTAATGGTAATGCAGATATCAGAAATAAAAATGTTGGTGGACCTTGGGTCCAATCCATGTATGTTAAAAATGGTGATTTAATCACCATTAGACAGCGTTCTCCTCTTGTATACAACACTAGTTTTGTTAGCACTTTATTGTTTGAAGGTCCTCCTTTTGGTGGTCAAAATGGCAACCCAACTGAAGGTCCAGATGTAGCTAATAGATCAAGAGACAATATAACTGATACTATTACTATTAAAAATAGACAAGCTCGTATAACACCATATCCATTCAAAGCAACTAATACATATAATGCTCTGCCTGGTGAAGTAGTTATTAGAACTTTTGAAGTTAGAGGTATTGATGAACCTGTCACTGTTAATATTGCAAATGCAAGTCCAGCGTCTGGAGCACAAATAAGCAAAGATGGCAGTACATTTAATGGAAATAATATTACAGACGTGAATGACGGTGATGTTATTCAAGTTAAAATGACTGCATCAACTACACTTGGTAGTTTTGTTTTTGCAACCATTCAAATTGGAACTAGAAGTGATACTGTTTATCTTTTCACTGGTAGAGAAAATTATGATTATATAACCTATCAGAATGCTGGTGATATTTCTGCGCCTATTACTGTAAACATTCCTACATATGCACAAGATGTAGACTTTGTTATTACTGGCGCTGGTGGTGGTAATGGTGGAGATGATGCTCCACAAAGCTTTGGTGGTGCTGGAGCAGCTGGTAATGAATTGAGAGGTATAATTAGTCTTCCAACTTCATATTTGTTAGCAAATAATCAACTTAATCTATACCTGGGTGCTGCTGGCGCTGATGGCATCACATTCACTGCATCTGCTGCTGGGGGTGCTGGTGGATGGGGATATGACACTGGAGGTAGAGGTGGAAACGCTGGACCTGGAGATAGATCTGGTTCTGGTGGAGGTGGAGGTGGCGCTAGTGCCATTCAATTAGTTGATGGCACTGTTATTGCGGTAGCAGGCGGTGGTGCAGGTGGTGCGGGTGCAGGTAATGATACCGAAGTTCCACCAGATAATATGCATGGAAATTATCTCACACAAGGAAGACTTAGAACTGATCTTAACAACATTGGCGCAGAAGATGCTGATAATAACCCCTCACAAGGTGGTGGACCTGGCGGTGGCGGTGGAGGATGGGGAACTGCTGGTTCCTTATTAACTTCCAGAGAAGATGTATATGGTGTTGAAGTACAAACAGATGACCTTGATACTACTGCTGGACAAGGTGGTGGTGCATACTATAATACTGAATATGTTACATTAGCAAGTAATTTAGGTCTTGACGTTGTTAATGGGGAGACTGTACCACCACAGCAGGGAGCGGCAGCTTCCGATGGTGGGTTCATCCTTCTCGGATTCCCCCCACAGGATAGAGATCCAGAACCAGTTACATTTAATACATTAACTGGTCAACCACCAAATACTACGGTTGATTCCAATATTGTACAAGTTAGAGGTATTACTGGATTAGTATTGGTAACAGTAGCGGAAAACAGTGCTCAAGTAAGAGTATATGATACTGATGGAGTTACTTTAATATCAGATTGGGATGCTCCCTCAGTTTTAGTTTCTAATGAGCAGTGGATTCAATTAAGAATGACCACTGGTCTTGATTATTATTCAAAATATATTAGTACCATTGATATTGGTATTAAAAGATTTACATGGGAAGTAGAAACTGGCGAACCACCCGATACCTTACCTAATCCATTCGAGATTCCCCCTGTATTTGATGTAGAACCAAGTGTAACAGGTGCTCCAAATTTGATTGAATCTGAACCTATTCTTATTTCGGGTATTAATACTGCGGTAGAACTTTACACCATTGGTGTTCTCGGTGCAGAACTTGCTATTTGTGATCCCGTAGATAATTGCAGTGCTTACAGTGCTGCTGGTATTGGTAATCCATTATATATTAGTAACAATCAATATTTTAAAGTACGATTAGCTGCATCTGAAGACTATCAAACTACAGTAGCTACTACTGTGCAGGTAGGATCTACACCAGCTTCACCAGCTAAGAAATTTGAAATTCGTACCAAAGATGAACCAGATATTACACCAGATAATTTCTTCTTTTTCCCGCTAGAAGATCAACCATTAGAACTTTTGGTAACCTCAATTAACTCTGTTACTATTAGAGGTATTGATTCACCAACATTTTTTAGAGTTACTAGAGATGATGGTGGATCGCCAAATGCAACTATTATTCTTAATGGTGATGAGACAGGTTTAAGCGAAGTAAATGTTCAACAAAATGATGTTATTAAATTACAATATTTCACTTCTGATATTTTAGGAGATAACGTTGAATTTACTATAGAATGTGGTACATATGAAACTCAATGGCAAGTTGAGAACGAAGGTAGTTTTGGTGTAAACCCAACTCCATTCTTGTTTACAGATGTTTATGCAGATCCTCTACAATATGGTGTATCCAACGAAATTATTACTGTAACTGGTATTAATGTTCCAGTACCAATTTATGGTACTAATGGTATTCAATTTGATATTGATCTCACTGGTAGTTATGAAACACTTGATATTTTAGATGCGAGAACTATTACAAATTCAACTCAATTTAGGGTTAGACTTCTTGCGTCTCCTGTTGCTGGTTTTGATACTAGTGGTATTGTCACTGTTGGATCATATCAAACACCATATACAGTATTTTCCAATGCTGCTGTTCAAGATCCTATTAGAGGACAATGGTATAGTAGTATTCAAACTATCAAACCAGGGGGAGATGGTCAGATCAGATTCTCTACCAAGTTTGAAGGTCTACCAATTGGAACTATTATGCCAGTGTTCCAAGACTCTACTGCACTTAATGAAGATGGAGTTGCAGATAACTGGGGTGTTTTAAATGGTAGAGCAGATTCTAGATTCCATGGTTGGGTATATTGTGATGGTAGATTTGTAAATAAATTAGAGTACCCACTATTGTTTGAAGTTCTTGATTTTGATTATGGTGCAACTAGTGCAGATCTTAATCTGTTTAAAGTTCCTGACATGAGGAATAGAAGAATATGTGGAACTGGTCCTATTGATGGAAACTCTTCATCTTCACCAATTTTAAATCCATTGTATGGTCCAGCAAAAGCATCTATTAATGCATCTGGAAACATTCCAGGTTCTCAAGGTGGACAGTGGTTTATCGATACTATTAGTGATCCTGGTGTTGATACACAGGGAGACAATAACGAGTTTGAACAAGTAATTACTCCTGGTGAAGGTCAACCAGCACAATCAAGTCCATTCTTTACCATTGCTAACGTTAGAACTCAAGGATATTCTAATGTAACTGGATCAGTAGAATTCCAAGCAACGGGAGAAATGGGGGGTGTTATTAGTATAGGTCAGGCACAAATTCGTGATGTTCCTAGACATTTCCATGATCTAATCTCTGGTGCTCCAGACCCATCTAGGAACAAAGGTTATGTTCAGTGGGGTAGATCTGCTGCTTATTCAAACCAAGCAATTGAAGTTACTAGTAAAGCAGGTGAGGACGGTCCTTCTATTGTTACTGACGTATCTAGAATCAATATCTGGGGATATGCAACAGGCGATTATACTATCGATAACCCAGATAATGTTCCAAGAACGGATATCTCATCAGATGATGATGGAAACATTCCTATTTTTGCTGCTAGTAGTACAAATTGGACTAATAGTTCTGGATATGTTGGAGAATATATTAATAACAAGCATTCTAGTTTGAATGTAGATCAACCAAACGTTGAAAGAGGTACAAGTAATTATAACGAAATTGCCTCTTATATTAACTTAGAAACATGGTCTGGTGGTCAATCAGATAGTTCTGGTAGTGAATATAGATTTATTGGTGCAGTCGATGTTCCCGAAAAATTTATTCAAATACAAGCATATAGACCAACAAGAGCAAAACATAGTCACTACATTAGTTTAAATGATCCAGGTGATCCCGATCAAACATTTAGTTGGGGTAAAGGCGATGGTGCTGGTGTTATGACTGCTGGTAGTCCATTTGCTACCACGGAGGTAGATATGAGATTTGATTCTTTCCAGGTTGGCATGGAAATTCTTCCTGGAACATTTATATTAAATCAGACTAAACAGTTGATTCCTGTTCCTGAATTATCACCACAAACTGAGGTTCCTTTGATCACACCATATTCATATGTCCATTGGATGATCAAAGCATTCTAA

Genome Context

Genome Context

Tertiary structure

PDB ID
68d64e5ce5a01b63f273f253c770d84bd9a722654074cdaf57e538f1caca61eb
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,5925
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50