Genbank accession
AGN33927.1 [GenBank]
Protein name
tail fiber protein
RBP type
TF
Evidence Phold
Probability 1,00
Protein sequence
MLQESFLGADIELYRSQLSGKIIEGLTTGVKAKVLYSISSTESDKGYITLYVKYIESGGEQNTQQTFQNNEQLVTDSEITFGTTLIEIGSPFAQLLPTSALQIGSVAYVQSGVYFIRGFFVDVDYQYILLDQYGSNPSYRVGLDIQESIITPEDDLSLNDNAAGTSNYAAPGAHRFRITTRLIKKLLTDDADKNFIELLRINNSKVEKIVDRSAYDELEKSIALRTFEESGNYVVKDFGIKVRQGLNNNFNNGVYNSGATTQSGNIASEDKYAVEFGPGIAYVKGYRVKKLAPAYIDLDKPRDTDSAQNVIIPFEMGNFSNVENLYGFLNTSGSTVGSAYQTLELRDTFTSSPGTSAGDIIGYARGATLEHIDDGADNEYGNADDKYRLNVFDVQMFTILELASNVDISAGSLVVGSSSGARGYLVDAVSSDDHINLYQVEGTFSVNEMLTIDGEQLDTISALHTYQYSDTRQIVAKDETTTAVEFTADVILEDIQIVQGTTFTYSTTSADILTVDTVSAADGSRTEGTYLIGATDYTTDANGSGATFSIAVDNTGDATVTIIKGGFSYVVDETITVTDAQLGGGGGANLTFDVATVGATIKGLQSNFALDLRSGDQIYFSDTQFVTVDKVDQDNLTGTASTNIFEFANQIVKVDPGSASPSDGVYNAILRYRSKLFDVANADLISPMPKKYVKSISDESMIVRRTFDAQTVASNSISITLPENEQFQSISEENYVITVLAGTNSTHPVGDQITIDTTNTGVIGYTFFTSTDRTTLQIDNLTNVTSVKVTATISKNVTVRKTKSGNQMFVLKVNKTTKNIDKQNYNLTYSNIYGTRIEDRDLSLGLKDCYRMHAVYESFDENDPVLPSVTLVEPVFFETGSIVTGRTSKARAKVVDFNSGSLKLSLVYLDGGMTSGETIDGVDSNGDPITAIVNDSEGSVVNGSKVVTDNYFLELNQTGFIYDISKIVRKKGTSIPIRKLLVVADYYSHSSTGDYFGGQSYLNTNYDEIPFFGAKYLTDYLDFRPGVKNLFSGSGTVGSPAFVNCSTFDFKSRIFNTSGTPSATIFDIPKLNSNFRCDFDWYLPRTDKCFVTPSGEFQVVKGNSSERPESPDNLKDAMLLATISHKPYGFDPESDVVISRSDNKRYTMRDIGTIERRLNQVEYQTSLNMLESDTFNTQILDADGKNRLKNGFMVDDFTDHSKSDTGHEDFAAALDFQKGECHPAHYTTNVSLEINDNLSQNYQQTGPIITLPYTELAIINQPYASRVENINPFNVFTYIGRIVLTPGSDDWIETERLPANVTQIEGDFEAVAAEMNVDQNGFLPIQWNSWTTTWKSEEFIGSSTVHNPGWLQEDIGRSPRPDVWGGRGMRRINVVETFEVSGEQVRTGIRTQVVPRIEMESLGDALISATVIPWIRSRNIELDVARLKPRTQVYSFFDGQNVSAYMTPKLIEIIKDPAVDTRTNSTPFVIGETVTGQTSGCVFKVAAPNDLFEFNPYTDEELPSSYASTTAYLSIDTEALAKQAVGDFYGNMQVGEVLIGTSGATAVVKDRRMITDRFGKMKTSFFIPTPKIDTNPRWSTGTRTLRLTTSDSDSRIAGAVASSAQVEYEARGTLNVVQENILAVRNAEIVQDTVNQEQTIQSTRTEVRQVGWYDPLAQSFIVDQDGGVFLTSVDVYFFTKDSAIPISMQIRTMENGYPTTTILPFSDITLEPSEVQLSETAAVATKFTFRAPVYIPQSQEHCFVLLSDSNEYQIWISRMGDIDVTGDRTISEQPYAGVLFKSQNASTWTADQYEDIKFIINRAEFNNQVNSTLVLNNAELGLGNRGKLRLRNDAIESFLPELILTMNNTTLPYTAGSRVYQKTTLAEATIKTVQTTTAGVLLTINDINGTWASGSESGGIVSNGIVSSKTLSTIVVTGRSGLFEVGETITGGTSGSTAEIVTFDAGTETLTLRYVSKTFSSGEQITGGTSNVTANLSTVTPPTYSGDAVESSVIANAFPVSTPTYSSAQRKVRVNHSNHNMHDLSNNVVIEGIKSEVTDTFLTAAISASDTTVTVNDASAFHKIINGVAISSSNVGYIMINSEIMSYSAISSDNKTITVNERGLDGTTAVSHIDESAVKCYNFDGIPLIEINKTHEGILNPTLDSYELSTSSIARLGIRSGGNAIVATQNIQYDILVPQVERMLLSKTTLSSRINTISGTSINDGSALSQASFSNDGVFSDIILSKDNYLYQPALICSAINESSELSGAKSFRMDLTLGSETTNVSPIIDTDRMSITLVSNRINSPSDPNSAKLSVGDEHEAVYITRVASLTNPSGAIKLYFTGYRPSNTEIKVLYRTRPVGSTTPISQYGFEFFPTEDANIPLTTERRVYREYSYEVSGLNFDQYQIKVVFVSPNQSLTPIIRDIRAIALAV
Physico‐chemical
properties
protein length:2413 AA
molecular weight: 263938,54220 Da
isoelectric point:4,65900
aromaticity:0,08952
hydropathy:-0,22561

Domains

Domains [InterPro]
DC_0414
STR
3–1306
IPR032096
STR
106–310
DC_0082
RBD
1295–2413
AGN33927.1
1 2413
Architecture
STR
RBD
STR 3-1306 | RBD 1307-2413
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Synechococcus phage S-CAM8
[NCBI]
754038 Uroviricota > Caudoviricetes > Pantevenvirales > Neritesvirus > Neritesvirus scam8
Host Synechococcus sp.
[NCBI]
1131 cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae
Host Synechococcus sp. WH 7803
[NCBI]
32051 Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGN33927.1 [NCBI]
Genbank nucleotide accession
HQ634178.1 [NCBI]
CDS location
range 80564 -> 87805
strand +
CDS
ATGCTTCAAGAATCATTCTTGGGTGCAGATATTGAACTGTATAGAAGTCAATTGTCAGGTAAGATCATCGAAGGTCTTACCACAGGTGTTAAGGCAAAGGTTCTCTATAGTATTTCTTCTACAGAATCCGATAAGGGTTATATTACACTATATGTTAAGTACATTGAATCTGGTGGTGAACAAAATACTCAGCAAACATTTCAAAATAATGAGCAGTTAGTTACCGATAGTGAGATTACTTTCGGTACAACTCTGATTGAGATTGGTTCTCCTTTTGCTCAGTTACTTCCTACTTCTGCTCTACAAATTGGTTCTGTTGCATATGTTCAGAGCGGTGTGTACTTCATCAGAGGTTTCTTTGTTGATGTAGATTATCAATATATTCTTCTTGATCAGTATGGAAGCAACCCCTCCTATCGTGTTGGTCTCGACATTCAAGAATCGATCATCACTCCAGAAGATGACCTTAGTCTCAACGATAACGCTGCTGGAACATCTAACTATGCTGCACCTGGTGCTCATAGATTTAGAATCACTACCAGACTTATCAAGAAACTTCTGACGGATGATGCAGATAAAAACTTTATTGAATTGTTGCGTATTAACAATTCTAAGGTAGAAAAGATTGTTGACCGAAGTGCATACGATGAACTGGAAAAGAGTATTGCTCTCAGGACATTTGAAGAATCTGGTAATTATGTTGTAAAAGATTTTGGAATTAAAGTTCGTCAAGGATTGAATAACAACTTTAATAACGGTGTATATAACTCTGGTGCAACAACTCAAAGCGGTAACATTGCTTCTGAGGATAAGTATGCTGTAGAGTTTGGTCCTGGTATTGCTTATGTCAAGGGATATAGAGTTAAGAAATTAGCACCAGCGTATATCGATTTAGATAAACCCAGAGATACTGATTCTGCACAGAACGTTATTATTCCATTTGAGATGGGTAACTTCTCAAATGTTGAAAATCTCTATGGTTTCCTTAATACATCTGGTTCTACTGTTGGAAGTGCATACCAAACTTTAGAACTTCGTGATACATTTACTTCTTCTCCTGGAACTTCTGCTGGAGATATTATCGGATATGCTCGTGGTGCTACCCTAGAGCACATAGATGATGGTGCTGACAATGAGTATGGTAATGCTGACGATAAGTATAGATTGAACGTCTTTGATGTTCAAATGTTTACTATTTTAGAACTTGCATCTAATGTTGATATTTCTGCAGGATCTTTAGTAGTTGGATCTTCTAGTGGTGCTAGAGGATATCTGGTTGATGCTGTATCCTCCGATGATCACATCAACTTATATCAAGTAGAAGGAACTTTCTCCGTCAACGAAATGCTCACAATTGACGGTGAACAACTTGATACTATTAGTGCGTTACACACATATCAATACTCAGATACTCGTCAAATTGTTGCTAAAGATGAAACTACAACTGCTGTAGAATTCACCGCAGACGTTATCCTTGAAGATATTCAAATTGTTCAAGGAACTACATTTACATATAGCACTACCTCTGCTGATATTCTGACTGTAGACACTGTTAGTGCTGCAGATGGATCTAGAACTGAGGGTACTTATTTAATTGGTGCAACTGATTATACTACAGATGCAAATGGTTCTGGTGCAACATTTAGTATTGCAGTTGATAATACTGGTGACGCCACTGTTACAATAATCAAAGGTGGTTTTAGTTACGTAGTAGATGAAACAATTACTGTAACTGATGCTCAACTTGGTGGTGGCGGCGGTGCTAATTTAACTTTTGATGTTGCAACAGTTGGAGCAACAATTAAAGGTCTTCAATCTAACTTTGCTCTAGACCTCAGATCTGGAGATCAGATTTATTTCAGCGACACCCAATTTGTTACTGTAGATAAGGTCGATCAAGATAATTTGACTGGTACAGCGTCTACAAACATTTTTGAATTTGCAAATCAAATTGTCAAAGTAGATCCTGGTTCTGCATCTCCTTCTGATGGAGTTTATAATGCTATCTTACGTTATAGATCTAAACTTTTTGATGTTGCTAATGCTGATCTTATCAGCCCCATGCCTAAGAAGTATGTAAAGAGCATTTCTGACGAATCCATGATTGTCAGAAGAACATTTGATGCTCAAACAGTTGCTTCTAACTCAATCTCTATCACACTTCCTGAGAACGAGCAGTTCCAATCTATTTCTGAAGAAAACTACGTCATTACTGTTCTTGCTGGCACTAATTCTACTCATCCTGTTGGGGATCAAATTACAATTGATACCACAAATACTGGAGTAATAGGATATACTTTCTTCACTTCAACTGATAGAACAACATTACAAATCGATAATCTGACAAATGTTACTTCGGTTAAAGTTACTGCAACTATTTCTAAGAACGTAACTGTCAGAAAGACAAAATCTGGAAATCAGATGTTTGTTCTGAAAGTCAATAAAACTACTAAAAATATTGATAAGCAGAATTATAATCTCACATATTCAAATATCTATGGAACTAGAATTGAAGATAGAGATCTCAGTCTTGGTTTAAAAGATTGCTACCGTATGCACGCTGTCTATGAATCTTTTGATGAGAATGATCCTGTACTTCCTTCAGTAACATTAGTTGAACCTGTATTCTTTGAGACTGGTTCTATCGTTACTGGCAGAACTTCAAAGGCTCGTGCTAAGGTTGTAGATTTTAATTCTGGTAGTCTAAAACTCAGTTTGGTTTACCTTGATGGTGGAATGACTTCTGGAGAGACTATTGATGGTGTTGATAGTAATGGAGATCCAATTACCGCTATTGTAAATGATAGTGAAGGATCTGTTGTTAATGGATCTAAAGTTGTAACAGACAATTATTTCTTAGAATTAAATCAAACTGGATTTATCTATGATATTTCTAAAATTGTACGTAAAAAAGGTACATCTATTCCAATTAGAAAACTTTTAGTTGTTGCTGATTATTACTCACATTCTTCTACAGGAGATTATTTTGGTGGTCAGTCCTATCTGAACACAAATTATGATGAGATTCCATTCTTTGGAGCTAAGTATCTTACCGACTATCTAGATTTCCGTCCTGGTGTCAAAAATCTTTTCAGTGGAAGTGGCACTGTAGGTTCTCCTGCTTTCGTAAATTGTTCTACTTTTGACTTTAAGTCGAGAATATTCAATACTTCTGGTACTCCTTCTGCAACTATTTTTGATATTCCTAAGTTGAATAGCAATTTTAGATGTGATTTTGATTGGTATCTTCCCAGAACGGATAAGTGTTTTGTTACTCCATCTGGTGAATTCCAAGTTGTTAAAGGAAATTCTTCAGAAAGACCTGAATCTCCAGACAATCTTAAAGATGCAATGCTGTTGGCAACAATCAGTCACAAACCATATGGTTTTGATCCTGAATCTGATGTTGTTATTAGTCGTTCTGATAATAAAAGATACACTATGCGTGATATCGGAACGATTGAGAGACGTTTGAACCAGGTAGAATACCAAACCTCTCTCAATATGCTTGAGTCGGATACTTTCAATACTCAAATTTTAGATGCTGATGGTAAAAATCGTCTTAAGAATGGTTTTATGGTAGATGATTTTACTGATCATAGTAAGTCAGATACTGGTCATGAAGATTTTGCTGCAGCATTAGATTTCCAAAAAGGTGAGTGTCACCCCGCTCACTATACGACTAATGTTTCTCTTGAAATTAACGATAACCTGTCTCAGAATTATCAGCAGACTGGTCCTATTATTACGTTACCATATACAGAGCTTGCAATTATCAATCAACCTTATGCTTCTCGTGTTGAGAACATTAACCCATTCAACGTCTTTACTTACATTGGTCGTATTGTATTGACACCTGGATCTGATGATTGGATTGAGACTGAAAGACTTCCTGCAAATGTTACTCAAATCGAAGGCGATTTTGAAGCAGTCGCCGCAGAGATGAATGTTGACCAAAATGGTTTTTTACCTATTCAGTGGAATTCATGGACAACTACATGGAAATCTGAAGAATTTATTGGATCTTCAACTGTACACAATCCTGGTTGGTTGCAGGAAGACATTGGTAGATCTCCTAGACCCGATGTATGGGGTGGTCGTGGTATGCGTCGTATCAACGTCGTTGAAACATTTGAAGTTAGTGGAGAACAAGTTAGAACAGGTATTAGAACTCAGGTTGTACCTAGGATTGAGATGGAATCTCTTGGCGATGCTCTCATCTCCGCTACAGTTATTCCCTGGATTCGTTCTAGGAATATTGAACTTGATGTTGCTCGTCTCAAGCCAAGAACACAAGTCTACTCATTCTTTGATGGTCAGAATGTCAGTGCATACATGACTCCAAAATTGATTGAGATCATTAAAGATCCTGCTGTTGATACAAGAACAAATTCTACTCCTTTTGTAATTGGTGAGACTGTAACTGGTCAAACAAGTGGTTGTGTATTCAAGGTTGCAGCACCTAATGATTTATTTGAATTCAATCCATATACTGATGAAGAACTACCTTCTTCATATGCTTCAACAACTGCATATTTGAGTATTGATACTGAAGCACTTGCAAAGCAAGCAGTTGGTGATTTCTATGGAAATATGCAAGTTGGAGAAGTTCTTATCGGAACTTCTGGTGCTACAGCGGTAGTCAAAGACCGCAGAATGATCACAGACAGATTTGGTAAGATGAAGACATCTTTCTTCATTCCAACACCTAAAATCGATACAAATCCTCGTTGGTCAACGGGTACTAGAACACTTAGATTGACTACATCAGATAGTGATTCTCGTATTGCAGGTGCTGTTGCATCTTCTGCTCAGGTAGAATATGAAGCAAGAGGTACGTTGAATGTCGTTCAAGAAAATATTCTTGCAGTTAGAAATGCTGAGATTGTTCAAGATACAGTAAATCAAGAACAAACAATTCAATCTACAAGAACTGAAGTTCGTCAGGTTGGTTGGTATGACCCTCTTGCACAATCATTTATCGTCGATCAAGATGGTGGTGTATTCTTAACTTCGGTTGATGTTTACTTCTTTACCAAGGATTCTGCTATTCCTATCTCAATGCAGATTAGGACCATGGAGAATGGTTATCCTACGACCACTATTCTTCCTTTCTCGGATATTACTTTAGAACCCTCTGAAGTTCAACTATCAGAGACTGCAGCAGTTGCAACTAAATTTACATTTAGAGCACCTGTTTATATTCCACAGTCTCAAGAACATTGCTTTGTTCTCCTTTCAGATTCCAATGAATACCAAATTTGGATCTCTAGAATGGGTGACATTGATGTTACTGGAGATAGAACAATTTCAGAACAACCTTACGCGGGTGTTCTATTCAAATCACAGAACGCATCTACCTGGACTGCTGACCAGTACGAAGATATTAAGTTCATTATCAATAGAGCAGAATTTAACAATCAGGTAAATTCAACTCTTGTTCTTAATAATGCTGAACTTGGTCTCGGTAACAGAGGCAAGTTGAGGTTGAGGAATGATGCTATTGAGTCTTTCTTACCAGAGTTAATTCTTACTATGAATAACACGACCCTACCATACACTGCAGGTTCTCGTGTCTATCAAAAAACTACTTTGGCAGAAGCGACAATTAAAACTGTACAAACTACAACAGCAGGTGTTTTGTTAACTATCAATGATATTAATGGAACTTGGGCATCGGGTTCTGAATCTGGTGGTATTGTTTCAAATGGTATCGTTTCTTCCAAAACACTATCTACAATTGTTGTTACAGGAAGAAGTGGTCTTTTTGAAGTTGGAGAGACTATCACAGGTGGCACTTCTGGTTCTACAGCAGAAATTGTTACTTTTGATGCTGGAACTGAAACTTTGACCCTCCGCTATGTTTCAAAAACTTTCAGTTCTGGAGAGCAAATCACTGGTGGAACTAGCAATGTAACTGCCAATCTCAGTACAGTTACACCTCCAACATATTCTGGAGATGCAGTAGAAAGTTCTGTGATTGCTAATGCTTTCCCTGTTAGCACTCCCACATACAGTTCAGCACAAAGAAAGGTTCGGGTCAATCATAGCAATCACAATATGCATGACCTTTCAAACAATGTTGTTATTGAAGGGATTAAATCGGAAGTTACTGATACTTTCTTGACCGCAGCAATCTCAGCATCAGATACAACTGTGACTGTTAATGATGCATCTGCTTTCCATAAGATTATTAACGGCGTTGCAATTTCGTCAAGTAATGTTGGATATATTATGATTAATAGTGAAATTATGTCTTACTCTGCTATTAGTAGTGATAATAAGACGATCACTGTTAATGAGAGAGGACTTGATGGAACAACTGCTGTTTCTCATATAGATGAATCTGCCGTTAAGTGTTACAATTTTGATGGTATTCCTTTGATTGAGATCAACAAAACTCATGAAGGAATTCTTAATCCAACTCTCGATAGTTATGAATTGAGCACAAGTTCTATTGCAAGACTTGGAATTAGGTCTGGTGGAAATGCTATTGTTGCAACTCAAAATATTCAATATGATATTTTAGTTCCTCAAGTTGAAAGAATGCTTCTTTCTAAGACAACGCTTTCTTCTAGAATTAATACGATTAGTGGCACATCTATCAATGATGGATCTGCACTCTCACAAGCATCATTCTCTAATGATGGAGTGTTCTCAGACATTATCTTGAGTAAAGATAACTACCTGTATCAACCTGCACTAATTTGCTCTGCTATTAACGAATCATCTGAATTGTCTGGTGCTAAATCATTCCGTATGGATTTAACATTGGGTAGTGAGACAACTAATGTTTCTCCTATTATCGATACTGATAGAATGTCTATCACTTTAGTTTCAAATAGGATTAATAGTCCATCTGATCCTAATAGTGCAAAACTTTCTGTTGGTGATGAACATGAGGCAGTCTATATTACTAGAGTTGCTTCACTGACAAATCCATCGGGTGCAATTAAATTGTACTTCACAGGATACCGTCCATCCAACACCGAAATTAAAGTTCTATATAGAACAAGACCTGTTGGTTCTACAACTCCAATTAGTCAATATGGTTTTGAATTCTTCCCAACAGAAGATGCAAATATTCCTCTGACAACGGAAAGACGAGTATATAGAGAATATTCGTATGAAGTTTCTGGATTGAACTTTGATCAATATCAAATTAAAGTTGTATTTGTATCGCCTAATCAATCACTAACTCCGATTATTAGGGACATTCGTGCAATTGCTTTAGCTGTATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
4a6141c37fda438fe8a078854174fee09ba4906591f525a919b0894d349b9e0c
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,7818
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Synechococcus phage S-CAM8 0608BI06 Henn,M.R., Martiny,J., Weihe,C., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank