Protein
View in Explore- Genbank accession
- AGN33927.1 [GenBank]
- Protein name
- tail fiber protein
- RBP type
-
TF
- Protein sequence
-
MLQESFLGADIELYRSQLSGKIIEGLTTGVKAKVLYSISSTESDKGYITLYVKYIESGGEQNTQQTFQNNEQLVTDSEITFGTTLIEIGSPFAQLLPTSALQIGSVAYVQSGVYFIRGFFVDVDYQYILLDQYGSNPSYRVGLDIQESIITPEDDLSLNDNAAGTSNYAAPGAHRFRITTRLIKKLLTDDADKNFIELLRINNSKVEKIVDRSAYDELEKSIALRTFEESGNYVVKDFGIKVRQGLNNNFNNGVYNSGATTQSGNIASEDKYAVEFGPGIAYVKGYRVKKLAPAYIDLDKPRDTDSAQNVIIPFEMGNFSNVENLYGFLNTSGSTVGSAYQTLELRDTFTSSPGTSAGDIIGYARGATLEHIDDGADNEYGNADDKYRLNVFDVQMFTILELASNVDISAGSLVVGSSSGARGYLVDAVSSDDHINLYQVEGTFSVNEMLTIDGEQLDTISALHTYQYSDTRQIVAKDETTTAVEFTADVILEDIQIVQGTTFTYSTTSADILTVDTVSAADGSRTEGTYLIGATDYTTDANGSGATFSIAVDNTGDATVTIIKGGFSYVVDETITVTDAQLGGGGGANLTFDVATVGATIKGLQSNFALDLRSGDQIYFSDTQFVTVDKVDQDNLTGTASTNIFEFANQIVKVDPGSASPSDGVYNAILRYRSKLFDVANADLISPMPKKYVKSISDESMIVRRTFDAQTVASNSISITLPENEQFQSISEENYVITVLAGTNSTHPVGDQITIDTTNTGVIGYTFFTSTDRTTLQIDNLTNVTSVKVTATISKNVTVRKTKSGNQMFVLKVNKTTKNIDKQNYNLTYSNIYGTRIEDRDLSLGLKDCYRMHAVYESFDENDPVLPSVTLVEPVFFETGSIVTGRTSKARAKVVDFNSGSLKLSLVYLDGGMTSGETIDGVDSNGDPITAIVNDSEGSVVNGSKVVTDNYFLELNQTGFIYDISKIVRKKGTSIPIRKLLVVADYYSHSSTGDYFGGQSYLNTNYDEIPFFGAKYLTDYLDFRPGVKNLFSGSGTVGSPAFVNCSTFDFKSRIFNTSGTPSATIFDIPKLNSNFRCDFDWYLPRTDKCFVTPSGEFQVVKGNSSERPESPDNLKDAMLLATISHKPYGFDPESDVVISRSDNKRYTMRDIGTIERRLNQVEYQTSLNMLESDTFNTQILDADGKNRLKNGFMVDDFTDHSKSDTGHEDFAAALDFQKGECHPAHYTTNVSLEINDNLSQNYQQTGPIITLPYTELAIINQPYASRVENINPFNVFTYIGRIVLTPGSDDWIETERLPANVTQIEGDFEAVAAEMNVDQNGFLPIQWNSWTTTWKSEEFIGSSTVHNPGWLQEDIGRSPRPDVWGGRGMRRINVVETFEVSGEQVRTGIRTQVVPRIEMESLGDALISATVIPWIRSRNIELDVARLKPRTQVYSFFDGQNVSAYMTPKLIEIIKDPAVDTRTNSTPFVIGETVTGQTSGCVFKVAAPNDLFEFNPYTDEELPSSYASTTAYLSIDTEALAKQAVGDFYGNMQVGEVLIGTSGATAVVKDRRMITDRFGKMKTSFFIPTPKIDTNPRWSTGTRTLRLTTSDSDSRIAGAVASSAQVEYEARGTLNVVQENILAVRNAEIVQDTVNQEQTIQSTRTEVRQVGWYDPLAQSFIVDQDGGVFLTSVDVYFFTKDSAIPISMQIRTMENGYPTTTILPFSDITLEPSEVQLSETAAVATKFTFRAPVYIPQSQEHCFVLLSDSNEYQIWISRMGDIDVTGDRTISEQPYAGVLFKSQNASTWTADQYEDIKFIINRAEFNNQVNSTLVLNNAELGLGNRGKLRLRNDAIESFLPELILTMNNTTLPYTAGSRVYQKTTLAEATIKTVQTTTAGVLLTINDINGTWASGSESGGIVSNGIVSSKTLSTIVVTGRSGLFEVGETITGGTSGSTAEIVTFDAGTETLTLRYVSKTFSSGEQITGGTSNVTANLSTVTPPTYSGDAVESSVIANAFPVSTPTYSSAQRKVRVNHSNHNMHDLSNNVVIEGIKSEVTDTFLTAAISASDTTVTVNDASAFHKIINGVAISSSNVGYIMINSEIMSYSAISSDNKTITVNERGLDGTTAVSHIDESAVKCYNFDGIPLIEINKTHEGILNPTLDSYELSTSSIARLGIRSGGNAIVATQNIQYDILVPQVERMLLSKTTLSSRINTISGTSINDGSALSQASFSNDGVFSDIILSKDNYLYQPALICSAINESSELSGAKSFRMDLTLGSETTNVSPIIDTDRMSITLVSNRINSPSDPNSAKLSVGDEHEAVYITRVASLTNPSGAIKLYFTGYRPSNTEIKVLYRTRPVGSTTPISQYGFEFFPTEDANIPLTTERRVYREYSYEVSGLNFDQYQIKVVFVSPNQSLTPIIRDIRAIALAV
- Physico‐chemical
properties -
protein length: 2413 AA molecular weight: 263938,54220 Da isoelectric point: 4,65900 aromaticity: 0,08952 hydropathy: -0,22561
Domains
Domains [InterPro]
DC_0414
STR
3–1306
STR
3–1306
IPR032096
STR
106–310
STR
106–310
DC_0082
RBD
1295–2413
RBD
1295–2413
1
2413
Architecture
STR 3-1306 | RBD 1307-2413
Legend:
ATT
STR
RBD
CBM
LEC
ENZ
CHP
LNK
TAS
TTP
UNK
Unmapped
Taxonomy
| Name | Taxonomy ID | Lineage | |
|---|---|---|---|
| Phage |
Synechococcus phage S-CAM8 [NCBI] |
754038 | Uroviricota > Caudoviricetes > Pantevenvirales > Neritesvirus > Neritesvirus scam8 |
| Host |
Synechococcus sp. [NCBI] |
1131 | cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae |
| Host |
Synechococcus sp. WH 7803 [NCBI] |
32051 | Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus > |
Coding sequence (CDS)
Coding sequence (CDS)
Genbank protein accession
AGN33927.1
[NCBI]
Genbank nucleotide accession
HQ634178.1
[NCBI]
CDS location
range 80564 -> 87805
strand +
strand +
CDS
ATGCTTCAAGAATCATTCTTGGGTGCAGATATTGAACTGTATAGAAGTCAATTGTCAGGTAAGATCATCGAAGGTCTTACCACAGGTGTTAAGGCAAAGGTTCTCTATAGTATTTCTTCTACAGAATCCGATAAGGGTTATATTACACTATATGTTAAGTACATTGAATCTGGTGGTGAACAAAATACTCAGCAAACATTTCAAAATAATGAGCAGTTAGTTACCGATAGTGAGATTACTTTCGGTACAACTCTGATTGAGATTGGTTCTCCTTTTGCTCAGTTACTTCCTACTTCTGCTCTACAAATTGGTTCTGTTGCATATGTTCAGAGCGGTGTGTACTTCATCAGAGGTTTCTTTGTTGATGTAGATTATCAATATATTCTTCTTGATCAGTATGGAAGCAACCCCTCCTATCGTGTTGGTCTCGACATTCAAGAATCGATCATCACTCCAGAAGATGACCTTAGTCTCAACGATAACGCTGCTGGAACATCTAACTATGCTGCACCTGGTGCTCATAGATTTAGAATCACTACCAGACTTATCAAGAAACTTCTGACGGATGATGCAGATAAAAACTTTATTGAATTGTTGCGTATTAACAATTCTAAGGTAGAAAAGATTGTTGACCGAAGTGCATACGATGAACTGGAAAAGAGTATTGCTCTCAGGACATTTGAAGAATCTGGTAATTATGTTGTAAAAGATTTTGGAATTAAAGTTCGTCAAGGATTGAATAACAACTTTAATAACGGTGTATATAACTCTGGTGCAACAACTCAAAGCGGTAACATTGCTTCTGAGGATAAGTATGCTGTAGAGTTTGGTCCTGGTATTGCTTATGTCAAGGGATATAGAGTTAAGAAATTAGCACCAGCGTATATCGATTTAGATAAACCCAGAGATACTGATTCTGCACAGAACGTTATTATTCCATTTGAGATGGGTAACTTCTCAAATGTTGAAAATCTCTATGGTTTCCTTAATACATCTGGTTCTACTGTTGGAAGTGCATACCAAACTTTAGAACTTCGTGATACATTTACTTCTTCTCCTGGAACTTCTGCTGGAGATATTATCGGATATGCTCGTGGTGCTACCCTAGAGCACATAGATGATGGTGCTGACAATGAGTATGGTAATGCTGACGATAAGTATAGATTGAACGTCTTTGATGTTCAAATGTTTACTATTTTAGAACTTGCATCTAATGTTGATATTTCTGCAGGATCTTTAGTAGTTGGATCTTCTAGTGGTGCTAGAGGATATCTGGTTGATGCTGTATCCTCCGATGATCACATCAACTTATATCAAGTAGAAGGAACTTTCTCCGTCAACGAAATGCTCACAATTGACGGTGAACAACTTGATACTATTAGTGCGTTACACACATATCAATACTCAGATACTCGTCAAATTGTTGCTAAAGATGAAACTACAACTGCTGTAGAATTCACCGCAGACGTTATCCTTGAAGATATTCAAATTGTTCAAGGAACTACATTTACATATAGCACTACCTCTGCTGATATTCTGACTGTAGACACTGTTAGTGCTGCAGATGGATCTAGAACTGAGGGTACTTATTTAATTGGTGCAACTGATTATACTACAGATGCAAATGGTTCTGGTGCAACATTTAGTATTGCAGTTGATAATACTGGTGACGCCACTGTTACAATAATCAAAGGTGGTTTTAGTTACGTAGTAGATGAAACAATTACTGTAACTGATGCTCAACTTGGTGGTGGCGGCGGTGCTAATTTAACTTTTGATGTTGCAACAGTTGGAGCAACAATTAAAGGTCTTCAATCTAACTTTGCTCTAGACCTCAGATCTGGAGATCAGATTTATTTCAGCGACACCCAATTTGTTACTGTAGATAAGGTCGATCAAGATAATTTGACTGGTACAGCGTCTACAAACATTTTTGAATTTGCAAATCAAATTGTCAAAGTAGATCCTGGTTCTGCATCTCCTTCTGATGGAGTTTATAATGCTATCTTACGTTATAGATCTAAACTTTTTGATGTTGCTAATGCTGATCTTATCAGCCCCATGCCTAAGAAGTATGTAAAGAGCATTTCTGACGAATCCATGATTGTCAGAAGAACATTTGATGCTCAAACAGTTGCTTCTAACTCAATCTCTATCACACTTCCTGAGAACGAGCAGTTCCAATCTATTTCTGAAGAAAACTACGTCATTACTGTTCTTGCTGGCACTAATTCTACTCATCCTGTTGGGGATCAAATTACAATTGATACCACAAATACTGGAGTAATAGGATATACTTTCTTCACTTCAACTGATAGAACAACATTACAAATCGATAATCTGACAAATGTTACTTCGGTTAAAGTTACTGCAACTATTTCTAAGAACGTAACTGTCAGAAAGACAAAATCTGGAAATCAGATGTTTGTTCTGAAAGTCAATAAAACTACTAAAAATATTGATAAGCAGAATTATAATCTCACATATTCAAATATCTATGGAACTAGAATTGAAGATAGAGATCTCAGTCTTGGTTTAAAAGATTGCTACCGTATGCACGCTGTCTATGAATCTTTTGATGAGAATGATCCTGTACTTCCTTCAGTAACATTAGTTGAACCTGTATTCTTTGAGACTGGTTCTATCGTTACTGGCAGAACTTCAAAGGCTCGTGCTAAGGTTGTAGATTTTAATTCTGGTAGTCTAAAACTCAGTTTGGTTTACCTTGATGGTGGAATGACTTCTGGAGAGACTATTGATGGTGTTGATAGTAATGGAGATCCAATTACCGCTATTGTAAATGATAGTGAAGGATCTGTTGTTAATGGATCTAAAGTTGTAACAGACAATTATTTCTTAGAATTAAATCAAACTGGATTTATCTATGATATTTCTAAAATTGTACGTAAAAAAGGTACATCTATTCCAATTAGAAAACTTTTAGTTGTTGCTGATTATTACTCACATTCTTCTACAGGAGATTATTTTGGTGGTCAGTCCTATCTGAACACAAATTATGATGAGATTCCATTCTTTGGAGCTAAGTATCTTACCGACTATCTAGATTTCCGTCCTGGTGTCAAAAATCTTTTCAGTGGAAGTGGCACTGTAGGTTCTCCTGCTTTCGTAAATTGTTCTACTTTTGACTTTAAGTCGAGAATATTCAATACTTCTGGTACTCCTTCTGCAACTATTTTTGATATTCCTAAGTTGAATAGCAATTTTAGATGTGATTTTGATTGGTATCTTCCCAGAACGGATAAGTGTTTTGTTACTCCATCTGGTGAATTCCAAGTTGTTAAAGGAAATTCTTCAGAAAGACCTGAATCTCCAGACAATCTTAAAGATGCAATGCTGTTGGCAACAATCAGTCACAAACCATATGGTTTTGATCCTGAATCTGATGTTGTTATTAGTCGTTCTGATAATAAAAGATACACTATGCGTGATATCGGAACGATTGAGAGACGTTTGAACCAGGTAGAATACCAAACCTCTCTCAATATGCTTGAGTCGGATACTTTCAATACTCAAATTTTAGATGCTGATGGTAAAAATCGTCTTAAGAATGGTTTTATGGTAGATGATTTTACTGATCATAGTAAGTCAGATACTGGTCATGAAGATTTTGCTGCAGCATTAGATTTCCAAAAAGGTGAGTGTCACCCCGCTCACTATACGACTAATGTTTCTCTTGAAATTAACGATAACCTGTCTCAGAATTATCAGCAGACTGGTCCTATTATTACGTTACCATATACAGAGCTTGCAATTATCAATCAACCTTATGCTTCTCGTGTTGAGAACATTAACCCATTCAACGTCTTTACTTACATTGGTCGTATTGTATTGACACCTGGATCTGATGATTGGATTGAGACTGAAAGACTTCCTGCAAATGTTACTCAAATCGAAGGCGATTTTGAAGCAGTCGCCGCAGAGATGAATGTTGACCAAAATGGTTTTTTACCTATTCAGTGGAATTCATGGACAACTACATGGAAATCTGAAGAATTTATTGGATCTTCAACTGTACACAATCCTGGTTGGTTGCAGGAAGACATTGGTAGATCTCCTAGACCCGATGTATGGGGTGGTCGTGGTATGCGTCGTATCAACGTCGTTGAAACATTTGAAGTTAGTGGAGAACAAGTTAGAACAGGTATTAGAACTCAGGTTGTACCTAGGATTGAGATGGAATCTCTTGGCGATGCTCTCATCTCCGCTACAGTTATTCCCTGGATTCGTTCTAGGAATATTGAACTTGATGTTGCTCGTCTCAAGCCAAGAACACAAGTCTACTCATTCTTTGATGGTCAGAATGTCAGTGCATACATGACTCCAAAATTGATTGAGATCATTAAAGATCCTGCTGTTGATACAAGAACAAATTCTACTCCTTTTGTAATTGGTGAGACTGTAACTGGTCAAACAAGTGGTTGTGTATTCAAGGTTGCAGCACCTAATGATTTATTTGAATTCAATCCATATACTGATGAAGAACTACCTTCTTCATATGCTTCAACAACTGCATATTTGAGTATTGATACTGAAGCACTTGCAAAGCAAGCAGTTGGTGATTTCTATGGAAATATGCAAGTTGGAGAAGTTCTTATCGGAACTTCTGGTGCTACAGCGGTAGTCAAAGACCGCAGAATGATCACAGACAGATTTGGTAAGATGAAGACATCTTTCTTCATTCCAACACCTAAAATCGATACAAATCCTCGTTGGTCAACGGGTACTAGAACACTTAGATTGACTACATCAGATAGTGATTCTCGTATTGCAGGTGCTGTTGCATCTTCTGCTCAGGTAGAATATGAAGCAAGAGGTACGTTGAATGTCGTTCAAGAAAATATTCTTGCAGTTAGAAATGCTGAGATTGTTCAAGATACAGTAAATCAAGAACAAACAATTCAATCTACAAGAACTGAAGTTCGTCAGGTTGGTTGGTATGACCCTCTTGCACAATCATTTATCGTCGATCAAGATGGTGGTGTATTCTTAACTTCGGTTGATGTTTACTTCTTTACCAAGGATTCTGCTATTCCTATCTCAATGCAGATTAGGACCATGGAGAATGGTTATCCTACGACCACTATTCTTCCTTTCTCGGATATTACTTTAGAACCCTCTGAAGTTCAACTATCAGAGACTGCAGCAGTTGCAACTAAATTTACATTTAGAGCACCTGTTTATATTCCACAGTCTCAAGAACATTGCTTTGTTCTCCTTTCAGATTCCAATGAATACCAAATTTGGATCTCTAGAATGGGTGACATTGATGTTACTGGAGATAGAACAATTTCAGAACAACCTTACGCGGGTGTTCTATTCAAATCACAGAACGCATCTACCTGGACTGCTGACCAGTACGAAGATATTAAGTTCATTATCAATAGAGCAGAATTTAACAATCAGGTAAATTCAACTCTTGTTCTTAATAATGCTGAACTTGGTCTCGGTAACAGAGGCAAGTTGAGGTTGAGGAATGATGCTATTGAGTCTTTCTTACCAGAGTTAATTCTTACTATGAATAACACGACCCTACCATACACTGCAGGTTCTCGTGTCTATCAAAAAACTACTTTGGCAGAAGCGACAATTAAAACTGTACAAACTACAACAGCAGGTGTTTTGTTAACTATCAATGATATTAATGGAACTTGGGCATCGGGTTCTGAATCTGGTGGTATTGTTTCAAATGGTATCGTTTCTTCCAAAACACTATCTACAATTGTTGTTACAGGAAGAAGTGGTCTTTTTGAAGTTGGAGAGACTATCACAGGTGGCACTTCTGGTTCTACAGCAGAAATTGTTACTTTTGATGCTGGAACTGAAACTTTGACCCTCCGCTATGTTTCAAAAACTTTCAGTTCTGGAGAGCAAATCACTGGTGGAACTAGCAATGTAACTGCCAATCTCAGTACAGTTACACCTCCAACATATTCTGGAGATGCAGTAGAAAGTTCTGTGATTGCTAATGCTTTCCCTGTTAGCACTCCCACATACAGTTCAGCACAAAGAAAGGTTCGGGTCAATCATAGCAATCACAATATGCATGACCTTTCAAACAATGTTGTTATTGAAGGGATTAAATCGGAAGTTACTGATACTTTCTTGACCGCAGCAATCTCAGCATCAGATACAACTGTGACTGTTAATGATGCATCTGCTTTCCATAAGATTATTAACGGCGTTGCAATTTCGTCAAGTAATGTTGGATATATTATGATTAATAGTGAAATTATGTCTTACTCTGCTATTAGTAGTGATAATAAGACGATCACTGTTAATGAGAGAGGACTTGATGGAACAACTGCTGTTTCTCATATAGATGAATCTGCCGTTAAGTGTTACAATTTTGATGGTATTCCTTTGATTGAGATCAACAAAACTCATGAAGGAATTCTTAATCCAACTCTCGATAGTTATGAATTGAGCACAAGTTCTATTGCAAGACTTGGAATTAGGTCTGGTGGAAATGCTATTGTTGCAACTCAAAATATTCAATATGATATTTTAGTTCCTCAAGTTGAAAGAATGCTTCTTTCTAAGACAACGCTTTCTTCTAGAATTAATACGATTAGTGGCACATCTATCAATGATGGATCTGCACTCTCACAAGCATCATTCTCTAATGATGGAGTGTTCTCAGACATTATCTTGAGTAAAGATAACTACCTGTATCAACCTGCACTAATTTGCTCTGCTATTAACGAATCATCTGAATTGTCTGGTGCTAAATCATTCCGTATGGATTTAACATTGGGTAGTGAGACAACTAATGTTTCTCCTATTATCGATACTGATAGAATGTCTATCACTTTAGTTTCAAATAGGATTAATAGTCCATCTGATCCTAATAGTGCAAAACTTTCTGTTGGTGATGAACATGAGGCAGTCTATATTACTAGAGTTGCTTCACTGACAAATCCATCGGGTGCAATTAAATTGTACTTCACAGGATACCGTCCATCCAACACCGAAATTAAAGTTCTATATAGAACAAGACCTGTTGGTTCTACAACTCCAATTAGTCAATATGGTTTTGAATTCTTCCCAACAGAAGATGCAAATATTCCTCTGACAACGGAAAGACGAGTATATAGAGAATATTCGTATGAAGTTTCTGGATTGAACTTTGATCAATATCAAATTAAAGTTGTATTTGTATCGCCTAATCAATCACTAACTCCGATTATTAGGGACATTCGTGCAATTGCTTTAGCTGTATAA
Genome Context
Genome Context
Tertiary structure
PDB ID
4a6141c37fda438fe8a078854174fee09ba4906591f525a919b0894d349b9e0c
Model Confidence
Very high
pLDDT > 90
pLDDT > 90
High
90 > pLDDT > 70
90 > pLDDT > 70
Low
70 > pLDDT > 50
70 > pLDDT > 50
Very low
pLDDT < 50
pLDDT < 50
Literature
| Title | Authors | Date | PMID | Source |
|---|---|---|---|---|
| The Genome Sequence of Synechococcus phage S-CAM8 0608BI06 | Henn,M.R., Martiny,J., Weihe,C., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Haas,B., Nusbaum,C. and Birren,B. | 2011-09-23 | — | GenBank |