Phage RBP Database

Genbank accession

YP_009779933.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MAQNTNLNVSPYYDDFDKDKNFYRVLFRPGFPIQARELTTMQSILQNQVKSVGAHLFKDGAMVIPGQVGYDLNVDAIMLQESFLGASVEQYRTQLTGKIIEGLTSGIKAKVLYSISESDSEKGYITLYVKYIESGGEGNAQTTFTNNEQLITNAEITFGSSLIEVGSPFSQLLPTNSIQTGSVAYVQTGVYFIRGFFVDVPYQYILLDQYGSSPQYRIGLDILESIVTPEDDVSLNDNAAGTSNYAAPGSHRFKIGTRLIKKLLNDDADKDFIELLRINGNRVENLVDRSAYSELERSLATRTYEESGDYVVRDFQITIRENLDDGFNNGVYQLNEITSSGNASRESLYSVELGPGAAYVRGYRVKTLSPTYVDLEKPRDTKAAQNAIVPFELGNFSILNNIYGFPNVSGTSLGNAYQTLEIRDRFTATPGIAAGNIIGYARAASMEFYQNPDGTYGNTDDEYKINIFDVQLFTVIELASNATISAGSIVKGVSSGASGLVVDAESADDHIQLYHVSGYFESGEMVTVDGINLDTIEKVYDYAYSDARQFLTRDENTNAIEFTGDVVLQDELQLQGLSFTYQNLDGNVTGTSLDVAGTGYISGTNITATGGDGTGLTVDITASSGTISSAVVNTAGSGYSVGNSVTVANSRSTGVNTLGTIATAGTGYTATTGLATTSAGSGTGLIVDITADASGAVQTVAVNSSSLSDGSGYANSEVITITNVNASGIATIDTIGAADASRTAGTYTIGASDYTTDSASGTGAEFSIVVDGTGAATVTITTDGLTYVVDDTFTVQDAQLGGGGGAALTFDVASLHGNGCTVPVSAIHGNGQTLQITAIGNSSIVGLNSNFAADLRPGDRIFFSKTEYVDVDFVSTNNLTGTGPEYIFDYSAQRVNITPPSANFPTAGDYNTLIRYRAQLSGNEENSDLLTRMPKGYIKSISDESMTVRRTFDSQTVSANSVSITLPENEQFSAISEVNYSFTVLASTNGSYPVGAQIPIDTTNSGNLGYTIFTSSDRTTIQINNLTSITSIKVTATISKNVTQRKTKSSQKMFVLKVTRTIQDLDKQNYNLAYLNIYGTRIEDQEISLGLKDAFNLHAVYESLDDNDPVIPSVTLVEPKFFEVGSIVTGKTSKARAKVVEFASGSLQLSVVYLSGQFVLGETVTGFDSNGDILTGIINDADGSVVVGSKVVTDRYFLQPGQTGFMYDCSRVIRKKGTPTPIRKLKVVLDYYSHSATGDYFGGQSYLDTVYEDIPDFEDKYLADYLDFRPGIKNLFNGTGTVSSPAFVNCSTFDFKSRVFNVSGTPTATVFDIPKLNSDFRCDYDWYLARVDKLYLDENGDFQVVKGKSAEVPNEPDDLQNAMLLAILRHQPYGFNPEKDVAIEKSDNRRYTMRDIGKIENRLNQVEYYTSLNMLESDTMNLSITDANGNNRLKNGFFVDDFTNQSMSAMNLEDFGASLDFVEGTCHPSHYTTNIALVVNDNLSSGTQTTGPIITLPYTESLIIDQPYASRVENVNPFNVFTYIGRIDLTPSSDDWIDTTRVPALVTNVEGNFESTLVAQGAGNDGFAPVQWGSWRTTWRRRRRRTRTVNTRRRSNWGRGRATDRITRVTTTRRQTREGIRTQVVPRIDNVSQGDSIIAQTSIPFIRSRNIDVNIARMKPRTSFYAFFDGKNIDDYIVPKILEVVKDSSVDARTNATPFVVGETVTGLTSGIQFRVSAPNDHYVFNPYDDADMPSSYASTTNFINVDSLALAAQAQGEYYGNVQVGEVLQGASGATAVVANRRIISDRLGQFRGSLFIPDPSVDSNPRWQTGARTLRFTTNENDSRLAGAVASSAEVEYEASGTLNTLRENVLAVRNADIVRDTVTQRRTLRTTRTNRRQVGWWDPLAQSFLIEEQGGVFVTSVEVYFNAKDDNIPISMQIRTMENGYPTTTILPFSDVTITPVDIQTSETGAIATKFVFRAPVYIPESIEHCFVLFSDSNEYQVWISRMGELDISGDRTISEQPYAGVLFKSQNATTWTADQYEDLKFSLYKAAFDTTTQSTIVLNNAELNIGNAGRLRLPVDPVQTFQPELQLVTNSTSINYTIGARIYQKTTLAEGTIIKFTESAGGNIVTINDISGSWQQGSDTGGAILNRIVSSKTLATMIVAGASGDFEVGETITGNSATAPTAEVVSWDSGTNTLTLKYVSTVFTVSTETISGGNTTVTATVDSITYSGDATSGSPLAVNDAFVSTSPTYTTGQRKVRVRHRNHGMHDVDNNVEIINVQSEVSETYLTSSISNSDTTISVNDALAFHQRINGGSVGTSNPGFIKIENEIISYSAISGDGKTITVYERGVGSTTAAAHADESIVECYNLDGIPLTEINKTHIGISSPTLDSYDVTTTSISSRGINAGGINVVATQNIQYEILAPQLQTLVMPNTSLNARVNTVSGSSINDGETSTQNSFVNDGLFNDILLEDDNYFDAPQIICSKANEDAELGGAKSFRMDVAMASENPNLSPVFDTDRMSATLISSRINSPANANSALLPTGDEHDAVYISKIAALTNPSTSIKLMFSGYRPPNTFIKPLYRVLPKGSTESIENLGFQYFPTTEATIPSTEEEEVYRDYEYEVTGLDYTQYQIKILLISSNQAYTPIIKDLRGIALAV

Physico‐chemical properties

protein length:	2645 AA
molecular weight:	287054,65160 Da
isoelectric point:	4,63888
aromaticity:	0,08885
hydropathy:	-0,22866

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR032096	12	66	InterPro	Domain of unknown function DUF4815
IPR032096	180	389	InterPro	Domain of unknown function DUF4815
IPR032096	1295	1542	InterPro	Domain of unknown function DUF4815

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage ACG-2014b [NCBI]	1493508	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

YP_009779933.1 [NCBI]

Genbank nucleotide accession

NC_047719.1 [NCBI]

CDS location

range 80779 -> 88716
strand +

CDS

ATGGCACAAAATACCAATCTTAACGTCTCCCCTTATTACGACGACTTCGATAAGGATAAGAATTTTTATCGAGTCTTGTTCCGTCCTGGATTTCCGATTCAGGCAAGAGAACTTACTACGATGCAAAGCATCTTGCAGAATCAGGTAAAGAGCGTCGGCGCTCACCTGTTCAAAGATGGTGCAATGGTCATTCCAGGTCAAGTAGGTTATGATCTGAATGTTGATGCTATCATGCTTCAGGAATCCTTCCTGGGTGCAAGTGTTGAGCAGTATAGAACTCAGTTGACAGGTAAGATTATTGAAGGTCTTACTTCTGGTATTAAAGCAAAAGTATTATATAGTATCTCCGAAAGTGATTCTGAGAAAGGTTATATCACATTATATGTGAAATATATTGAGTCTGGTGGAGAGGGTAATGCACAGACTACGTTCACAAATAATGAGCAGTTAATTACCAATGCAGAAATTACCTTCGGTAGTTCGCTGATTGAAGTTGGTTCTCCTTTTTCACAACTTCTTCCTACCAACTCTATCCAAACTGGTTCTGTTGCATATGTTCAGACTGGTGTTTATTTCATTAGAGGATTCTTTGTAGACGTTCCATATCAGTATATCCTTCTGGATCAATATGGTAGTTCTCCTCAATATAGGATTGGTCTCGATATTCTTGAGTCTATTGTTACTCCTGAGGATGATGTATCACTCAATGATAACGCTGCAGGAACATCTAACTATGCTGCTCCTGGTTCGCATAGATTTAAAATTGGTACAAGATTAATCAAAAAACTGCTCAATGATGATGCAGATAAAGACTTTATCGAACTACTTCGTATCAATGGTAATAGGGTAGAAAACCTTGTCGATAGAAGTGCATATAGCGAATTAGAAAGATCTTTAGCAACTAGAACTTACGAAGAGTCTGGTGACTACGTAGTTAGAGATTTCCAAATCACCATAAGAGAAAATCTTGATGATGGTTTTAACAATGGTGTATATCAACTTAATGAGATTACTAGTAGCGGCAATGCATCTAGAGAATCTCTGTATTCAGTAGAACTTGGTCCTGGTGCTGCATATGTTAGAGGATATCGTGTTAAGACACTCTCCCCAACATATGTCGATTTAGAAAAACCAAGAGATACCAAGGCAGCACAAAATGCTATTGTTCCCTTTGAATTAGGAAACTTTAGTATTCTTAATAATATCTATGGATTCCCCAACGTCTCAGGAACATCTCTTGGAAATGCATACCAAACTTTAGAGATTCGAGATAGATTTACAGCAACACCTGGTATTGCTGCGGGTAATATTATTGGTTATGCCAGAGCGGCATCAATGGAGTTCTATCAGAATCCTGATGGTACATACGGCAATACAGATGATGAGTATAAGATAAACATCTTTGATGTCCAATTATTCACCGTTATTGAATTGGCATCAAATGCAACTATTTCTGCTGGTTCTATCGTAAAAGGAGTATCTTCTGGTGCAAGTGGTTTAGTTGTTGATGCTGAATCAGCAGACGATCACATTCAACTGTATCATGTTTCAGGTTATTTTGAATCTGGTGAAATGGTGACAGTTGATGGTATTAATTTAGATACTATTGAAAAAGTATATGATTATGCTTATTCGGATGCAAGACAATTCCTTACTAGAGACGAAAATACTAATGCTATTGAGTTTACTGGTGATGTAGTTTTACAAGATGAACTACAACTTCAAGGTCTATCGTTTACATATCAAAATCTCGACGGTAATGTAACTGGCACATCTTTAGATGTTGCGGGTACAGGATATATTAGCGGTACTAATATTACTGCCACTGGTGGTGACGGTACTGGGTTGACGGTTGATATTACTGCGAGCAGTGGCACGATTTCATCTGCAGTCGTTAATACTGCGGGTTCTGGATATTCAGTTGGCAATTCTGTTACTGTTGCAAACTCTAGAAGCACTGGTGTTAATACATTAGGTACTATTGCTACTGCAGGCACTGGATATACTGCTACTACTGGACTTGCAACAACTTCAGCTGGTTCTGGTACTGGTCTTATTGTTGATATTACTGCGGATGCTAGTGGTGCCGTTCAAACAGTAGCAGTCAATTCTTCATCATTGTCAGATGGTAGTGGATATGCAAATAGCGAAGTGATTACGATCACAAACGTTAATGCAAGTGGTATTGCTACTATTGACACCATTGGTGCTGCAGATGCTTCAAGAACTGCTGGTACATATACAATCGGTGCTTCCGATTACACCACAGATTCTGCTTCTGGTACTGGAGCAGAATTCTCAATTGTTGTTGATGGTACAGGTGCTGCAACAGTTACTATCACCACTGATGGTTTGACTTATGTTGTAGATGATACTTTTACTGTACAAGATGCTCAACTTGGTGGCGGCGGTGGTGCTGCTCTGACCTTTGATGTTGCATCTCTGCATGGTAATGGATGTACAGTTCCTGTATCTGCGATTCATGGCAATGGACAGACTCTACAAATTACTGCAATCGGAAATTCCAGTATCGTCGGTCTCAATTCAAATTTTGCTGCAGATCTTCGTCCTGGTGATAGAATTTTCTTTAGTAAAACTGAATATGTGGATGTTGATTTTGTTTCTACTAATAATCTTACTGGAACTGGACCAGAGTATATCTTCGACTACTCTGCACAAAGAGTAAACATTACTCCCCCTTCTGCAAACTTTCCTACTGCTGGAGATTACAATACATTAATTCGTTATAGAGCACAACTTTCTGGAAATGAAGAAAACTCAGATCTTCTGACCAGAATGCCTAAGGGATATATCAAATCAATTTCTGACGAGTCTATGACAGTTAGAAGAACTTTTGATTCTCAAACTGTCTCTGCGAACTCAGTATCTATTACTCTACCAGAAAATGAACAATTCTCTGCGATCTCTGAGGTAAATTATTCATTCACGGTTCTTGCATCAACTAATGGTTCGTATCCAGTAGGTGCTCAAATTCCTATTGATACTACCAATAGCGGAAATTTAGGATATACTATCTTCACTTCTTCTGATAGAACTACCATTCAGATTAATAATCTGACTAGTATCACATCAATTAAAGTTACTGCTACCATTTCTAAAAATGTTACTCAGAGAAAGACAAAATCTTCTCAGAAAATGTTTGTCTTGAAAGTTACAAGAACTATTCAAGACTTAGATAAGCAAAATTATAACCTTGCTTATCTTAATATTTACGGTACTAGAATTGAAGACCAAGAAATATCTTTAGGTCTTAAGGATGCATTTAATTTGCATGCTGTTTATGAGTCTTTGGACGATAATGATCCCGTAATTCCATCAGTAACCTTAGTAGAACCCAAGTTCTTTGAGGTAGGTTCAATTGTTACTGGTAAAACTTCTAAAGCTAGAGCAAAAGTAGTTGAATTTGCATCTGGTTCTTTACAACTTTCTGTTGTATATCTTAGTGGTCAATTTGTTTTGGGAGAAACTGTCACTGGTTTTGATAGTAACGGTGATATCCTTACAGGTATTATTAACGATGCTGATGGTTCTGTAGTTGTAGGTTCTAAAGTAGTTACTGATAGATATTTCTTACAACCAGGACAGACTGGATTTATGTATGATTGTTCTAGAGTCATCCGTAAGAAAGGAACTCCCACTCCTATTAGAAAATTAAAAGTAGTTTTAGATTATTACAGTCACTCTGCTACTGGAGATTATTTCGGTGGTCAGTCTTACTTAGACACTGTATATGAAGACATTCCTGATTTTGAAGATAAGTATCTTGCAGATTACTTGGATTTCCGTCCTGGTATTAAAAACTTATTTAATGGTACTGGCACTGTTTCATCTCCAGCATTTGTAAACTGTTCTACGTTTGACTTTAAATCAAGAGTGTTTAACGTAAGTGGCACTCCTACAGCAACTGTATTTGATATTCCTAAGTTGAATAGCGACTTCCGTTGCGATTATGATTGGTATCTTGCTAGGGTTGATAAATTATATCTTGACGAGAATGGTGATTTCCAAGTAGTTAAAGGTAAGTCTGCAGAAGTTCCTAATGAACCAGATGATCTTCAGAATGCAATGCTACTTGCAATTCTTCGTCACCAACCATATGGATTTAATCCAGAAAAAGATGTTGCCATTGAAAAGTCTGATAATAGACGTTATACAATGCGAGACATTGGTAAAATTGAGAATAGATTGAATCAAGTTGAGTATTATACATCACTTAACATGTTGGAAAGTGATACAATGAATCTTAGCATCACCGATGCTAATGGTAATAATCGCCTTAAGAATGGATTCTTTGTAGATGACTTTACAAATCAGTCTATGTCAGCAATGAATCTAGAAGACTTTGGTGCTTCTCTAGATTTTGTTGAAGGGACATGTCATCCTTCACATTACACAACCAATATTGCATTAGTTGTAAATGATAATTTAAGTTCTGGGACGCAGACAACTGGTCCTATCATTACTTTACCATACACAGAGTCGTTGATTATTGATCAACCCTATGCGTCTCGTGTAGAGAATGTCAACCCATTCAACGTCTTCACATATATTGGTCGTATTGATTTAACACCATCTTCAGATGATTGGATTGATACAACTAGAGTTCCTGCTTTAGTTACTAATGTTGAAGGAAACTTTGAATCTACGCTCGTGGCACAAGGAGCAGGCAACGATGGGTTTGCACCTGTTCAATGGGGTTCTTGGAGAACAACTTGGAGACGTAGAAGACGTAGAACCAGGACAGTTAACACTAGACGCCGTTCTAACTGGGGAAGAGGAAGAGCAACTGATAGAATTACAAGAGTTACGACTACCAGAAGACAAACTAGAGAGGGTATTAGAACTCAAGTTGTACCTAGAATTGATAATGTTTCTCAGGGTGATAGTATCATCGCACAGACATCGATTCCTTTCATTCGTTCTAGGAATATCGATGTAAATATTGCCAGAATGAAACCAAGAACTTCGTTCTATGCATTCTTTGATGGTAAAAATATCGATGATTACATTGTTCCTAAGATTCTTGAAGTTGTAAAAGATTCTTCAGTTGATGCTAGAACTAATGCTACCCCGTTTGTTGTTGGTGAAACTGTTACTGGACTAACTTCTGGTATTCAATTCAGAGTCTCTGCTCCTAATGATCATTACGTATTTAATCCATACGATGATGCAGATATGCCTTCGTCATATGCATCTACAACTAATTTTATTAACGTAGATAGTCTTGCTTTAGCAGCACAAGCTCAAGGTGAATATTATGGTAATGTTCAAGTCGGAGAAGTTCTTCAGGGGGCGTCTGGTGCTACGGCAGTTGTTGCTAACAGAAGAATTATCTCAGATAGATTGGGACAATTTAGAGGTTCGTTATTCATTCCAGATCCCAGTGTAGATTCTAATCCTAGATGGCAAACTGGTGCTAGAACTCTTCGTTTCACAACTAATGAGAATGATAGCAGACTTGCTGGCGCAGTTGCTTCTTCTGCAGAAGTTGAGTATGAAGCATCTGGTACTTTGAATACATTAAGAGAAAACGTTCTTGCTGTTCGTAATGCTGATATCGTTCGTGATACAGTAACTCAAAGAAGAACTCTTCGTACAACTCGTACAAACCGCCGTCAAGTTGGTTGGTGGGATCCTCTAGCACAATCATTCCTTATTGAAGAGCAAGGTGGTGTATTCGTAACATCCGTTGAGGTTTACTTTAATGCTAAGGATGATAATATTCCCATCTCTATGCAGATTCGTACAATGGAAAATGGTTATCCAACAACAACCATTCTTCCCTTCTCTGATGTTACTATTACACCAGTTGATATTCAAACATCAGAAACTGGTGCAATCGCAACCAAGTTTGTATTTAGAGCACCTGTTTACATCCCAGAATCCATCGAACATTGCTTTGTTCTATTCTCAGACTCTAACGAGTATCAGGTTTGGATTTCTAGAATGGGTGAACTAGATATTTCTGGTGATAGAACAATCTCTGAGCAACCTTATGCTGGTGTATTGTTCAAATCACAGAACGCAACTACTTGGACAGCAGACCAGTACGAGGATCTTAAGTTCTCTCTGTATAAAGCAGCATTTGACACTACAACACAGTCTACTATTGTTTTAAATAACGCTGAGTTGAATATTGGTAATGCTGGCAGACTGAGACTCCCCGTTGATCCTGTTCAAACATTCCAACCTGAATTGCAATTGGTTACTAATTCAACATCAATTAACTATACTATTGGTGCTAGAATTTACCAGAAGACGACTTTGGCAGAGGGTACTATTATCAAGTTTACCGAAAGTGCTGGTGGTAACATTGTTACTATCAATGATATTTCTGGTAGTTGGCAGCAAGGTTCTGATACTGGTGGTGCCATCCTTAATAGAATCGTTTCATCTAAGACATTAGCAACAATGATTGTTGCTGGTGCATCTGGTGACTTTGAAGTTGGTGAAACAATTACTGGTAACTCAGCAACTGCTCCTACTGCAGAAGTTGTTTCTTGGGATAGTGGAACTAATACGTTAACACTTAAGTATGTCTCTACAGTCTTTACTGTTAGTACTGAAACTATTAGTGGTGGAAATACTACGGTAACTGCAACTGTAGATTCAATCACATATTCTGGTGATGCAACATCAGGTTCGCCTCTTGCTGTAAATGATGCCTTTGTAAGCACAAGTCCGACATATACCACAGGTCAAAGAAAGGTTAGAGTTCGCCACAGAAATCATGGTATGCATGATGTTGATAACAACGTCGAAATTATTAATGTTCAATCTGAAGTTAGTGAGACGTATTTGACTTCTTCAATTTCCAATTCGGATACTACAATCTCGGTTAATGATGCTTTGGCATTCCACCAAAGAATCAATGGTGGATCTGTTGGAACATCCAATCCTGGATTTATTAAAATTGAAAATGAAATTATTTCTTACTCAGCAATTAGTGGTGATGGTAAAACCATTACTGTATATGAAAGAGGAGTTGGATCTACCACTGCTGCAGCACATGCCGATGAATCTATCGTTGAGTGCTATAATCTTGACGGCATTCCTCTAACAGAGATTAATAAAACGCACATTGGAATCTCATCTCCAACTTTAGATTCTTACGATGTCACTACTACTTCTATTAGTAGTAGGGGTATAAATGCTGGTGGTATCAATGTAGTTGCTACGCAAAATATTCAATATGAAATTCTTGCTCCACAATTACAAACACTGGTTATGCCCAATACAAGTCTCAATGCTAGGGTTAATACTGTAAGTGGTTCATCTATTAATGATGGTGAAACTTCTACTCAAAATTCCTTTGTCAATGATGGATTGTTTAATGACATCTTATTAGAAGATGATAATTACTTTGATGCTCCTCAAATTATTTGTTCTAAGGCAAATGAAGATGCTGAACTTGGTGGTGCTAAGTCATTTAGAATGGATGTAGCAATGGCAAGTGAGAATCCTAATCTCTCTCCTGTTTTTGACACAGATCGGATGTCAGCAACTCTAATTAGTAGCAGAATTAATAGTCCTGCTAATGCTAACTCAGCATTGCTCCCAACAGGTGACGAACATGATGCAGTTTACATCAGTAAAATTGCAGCACTAACAAACCCATCAACGTCAATTAAGTTGATGTTCTCTGGGTATCGTCCTCCTAACACATTCATTAAACCACTATATAGAGTGTTACCGAAAGGTTCGACTGAATCTATTGAAAATCTAGGATTCCAGTACTTCCCAACAACGGAAGCTACAATTCCTTCAACTGAGGAGGAAGAAGTCTATAGAGATTATGAATACGAGGTAACAGGATTGGATTATACTCAATATCAGATTAAAATTCTTCTGATATCTTCTAACCAAGCGTATACACCAATCATTAAAGATCTTCGTGGAATCGCTCTTGCTGTATAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence