Phage RBP Database

Genbank accession

AGN33927.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MLQESFLGADIELYRSQLSGKIIEGLTTGVKAKVLYSISSTESDKGYITLYVKYIESGGEQNTQQTFQNNEQLVTDSEITFGTTLIEIGSPFAQLLPTSALQIGSVAYVQSGVYFIRGFFVDVDYQYILLDQYGSNPSYRVGLDIQESIITPEDDLSLNDNAAGTSNYAAPGAHRFRITTRLIKKLLTDDADKNFIELLRINNSKVEKIVDRSAYDELEKSIALRTFEESGNYVVKDFGIKVRQGLNNNFNNGVYNSGATTQSGNIASEDKYAVEFGPGIAYVKGYRVKKLAPAYIDLDKPRDTDSAQNVIIPFEMGNFSNVENLYGFLNTSGSTVGSAYQTLELRDTFTSSPGTSAGDIIGYARGATLEHIDDGADNEYGNADDKYRLNVFDVQMFTILELASNVDISAGSLVVGSSSGARGYLVDAVSSDDHINLYQVEGTFSVNEMLTIDGEQLDTISALHTYQYSDTRQIVAKDETTTAVEFTADVILEDIQIVQGTTFTYSTTSADILTVDTVSAADGSRTEGTYLIGATDYTTDANGSGATFSIAVDNTGDATVTIIKGGFSYVVDETITVTDAQLGGGGGANLTFDVATVGATIKGLQSNFALDLRSGDQIYFSDTQFVTVDKVDQDNLTGTASTNIFEFANQIVKVDPGSASPSDGVYNAILRYRSKLFDVANADLISPMPKKYVKSISDESMIVRRTFDAQTVASNSISITLPENEQFQSISEENYVITVLAGTNSTHPVGDQITIDTTNTGVIGYTFFTSTDRTTLQIDNLTNVTSVKVTATISKNVTVRKTKSGNQMFVLKVNKTTKNIDKQNYNLTYSNIYGTRIEDRDLSLGLKDCYRMHAVYESFDENDPVLPSVTLVEPVFFETGSIVTGRTSKARAKVVDFNSGSLKLSLVYLDGGMTSGETIDGVDSNGDPITAIVNDSEGSVVNGSKVVTDNYFLELNQTGFIYDISKIVRKKGTSIPIRKLLVVADYYSHSSTGDYFGGQSYLNTNYDEIPFFGAKYLTDYLDFRPGVKNLFSGSGTVGSPAFVNCSTFDFKSRIFNTSGTPSATIFDIPKLNSNFRCDFDWYLPRTDKCFVTPSGEFQVVKGNSSERPESPDNLKDAMLLATISHKPYGFDPESDVVISRSDNKRYTMRDIGTIERRLNQVEYQTSLNMLESDTFNTQILDADGKNRLKNGFMVDDFTDHSKSDTGHEDFAAALDFQKGECHPAHYTTNVSLEINDNLSQNYQQTGPIITLPYTELAIINQPYASRVENINPFNVFTYIGRIVLTPGSDDWIETERLPANVTQIEGDFEAVAAEMNVDQNGFLPIQWNSWTTTWKSEEFIGSSTVHNPGWLQEDIGRSPRPDVWGGRGMRRINVVETFEVSGEQVRTGIRTQVVPRIEMESLGDALISATVIPWIRSRNIELDVARLKPRTQVYSFFDGQNVSAYMTPKLIEIIKDPAVDTRTNSTPFVIGETVTGQTSGCVFKVAAPNDLFEFNPYTDEELPSSYASTTAYLSIDTEALAKQAVGDFYGNMQVGEVLIGTSGATAVVKDRRMITDRFGKMKTSFFIPTPKIDTNPRWSTGTRTLRLTTSDSDSRIAGAVASSAQVEYEARGTLNVVQENILAVRNAEIVQDTVNQEQTIQSTRTEVRQVGWYDPLAQSFIVDQDGGVFLTSVDVYFFTKDSAIPISMQIRTMENGYPTTTILPFSDITLEPSEVQLSETAAVATKFTFRAPVYIPQSQEHCFVLLSDSNEYQIWISRMGDIDVTGDRTISEQPYAGVLFKSQNASTWTADQYEDIKFIINRAEFNNQVNSTLVLNNAELGLGNRGKLRLRNDAIESFLPELILTMNNTTLPYTAGSRVYQKTTLAEATIKTVQTTTAGVLLTINDINGTWASGSESGGIVSNGIVSSKTLSTIVVTGRSGLFEVGETITGGTSGSTAEIVTFDAGTETLTLRYVSKTFSSGEQITGGTSNVTANLSTVTPPTYSGDAVESSVIANAFPVSTPTYSSAQRKVRVNHSNHNMHDLSNNVVIEGIKSEVTDTFLTAAISASDTTVTVNDASAFHKIINGVAISSSNVGYIMINSEIMSYSAISSDNKTITVNERGLDGTTAVSHIDESAVKCYNFDGIPLIEINKTHEGILNPTLDSYELSTSSIARLGIRSGGNAIVATQNIQYDILVPQVERMLLSKTTLSSRINTISGTSINDGSALSQASFSNDGVFSDIILSKDNYLYQPALICSAINESSELSGAKSFRMDLTLGSETTNVSPIIDTDRMSITLVSNRINSPSDPNSAKLSVGDEHEAVYITRVASLTNPSGAIKLYFTGYRPSNTEIKVLYRTRPVGSTTPISQYGFEFFPTEDANIPLTTERRVYREYSYEVSGLNFDQYQIKVVFVSPNQSLTPIIRDIRAIALAV

Physico‐chemical properties

protein length:	2413 AA
molecular weight:	263938,54220 Da
isoelectric point:	4,65900
aromaticity:	0,08952
hydropathy:	-0,22561

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0414	STR	DC_0414	3	1306	Novel HMM	DC_0414	Central	Low	Positional only	88 proteins / 88 hits
IPR032096	STR	DC_0487	106	310	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
IPR032096	STR	DC_0487	1054	1296	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
DC_0082	RBD	DC_0082	1295	2413	Novel HMM	DC_0082	C-terminal	Low	Positional only	104 proteins / 104 hits

	Name	Taxonomy ID	Lineage
Phage	Synechococcus phage S-CAM8 [NCBI]	754038	Uroviricota > Caudoviricetes > Pantevenvirales > Neritesvirus > Neritesvirus scam8
Host	Synechococcus sp. [NCBI]	1131	cellular organisms > Bacteria > Bacillati > Cyanobacteriota/Melainabacteria group > Cyanobacteriota > Cyanophyceae
Host	Synechococcus sp. WH 7803 [NCBI]	32051	Bacteria > Cyanobacteria > Oscillatoriophycideae > Chroococcales > Synechococcus >

Coding sequence (CDS)

Genbank protein accession

AGN33927.1 [NCBI]

Genbank nucleotide accession

HQ634178.1 [NCBI]

CDS location

range 80564 -> 87805
strand +

CDS

ATGCTTCAAGAATCATTCTTGGGTGCAGATATTGAACTGTATAGAAGTCAATTGTCAGGTAAGATCATCGAAGGTCTTACCACAGGTGTTAAGGCAAAGGTTCTCTATAGTATTTCTTCTACAGAATCCGATAAGGGTTATATTACACTATATGTTAAGTACATTGAATCTGGTGGTGAACAAAATACTCAGCAAACATTTCAAAATAATGAGCAGTTAGTTACCGATAGTGAGATTACTTTCGGTACAACTCTGATTGAGATTGGTTCTCCTTTTGCTCAGTTACTTCCTACTTCTGCTCTACAAATTGGTTCTGTTGCATATGTTCAGAGCGGTGTGTACTTCATCAGAGGTTTCTTTGTTGATGTAGATTATCAATATATTCTTCTTGATCAGTATGGAAGCAACCCCTCCTATCGTGTTGGTCTCGACATTCAAGAATCGATCATCACTCCAGAAGATGACCTTAGTCTCAACGATAACGCTGCTGGAACATCTAACTATGCTGCACCTGGTGCTCATAGATTTAGAATCACTACCAGACTTATCAAGAAACTTCTGACGGATGATGCAGATAAAAACTTTATTGAATTGTTGCGTATTAACAATTCTAAGGTAGAAAAGATTGTTGACCGAAGTGCATACGATGAACTGGAAAAGAGTATTGCTCTCAGGACATTTGAAGAATCTGGTAATTATGTTGTAAAAGATTTTGGAATTAAAGTTCGTCAAGGATTGAATAACAACTTTAATAACGGTGTATATAACTCTGGTGCAACAACTCAAAGCGGTAACATTGCTTCTGAGGATAAGTATGCTGTAGAGTTTGGTCCTGGTATTGCTTATGTCAAGGGATATAGAGTTAAGAAATTAGCACCAGCGTATATCGATTTAGATAAACCCAGAGATACTGATTCTGCACAGAACGTTATTATTCCATTTGAGATGGGTAACTTCTCAAATGTTGAAAATCTCTATGGTTTCCTTAATACATCTGGTTCTACTGTTGGAAGTGCATACCAAACTTTAGAACTTCGTGATACATTTACTTCTTCTCCTGGAACTTCTGCTGGAGATATTATCGGATATGCTCGTGGTGCTACCCTAGAGCACATAGATGATGGTGCTGACAATGAGTATGGTAATGCTGACGATAAGTATAGATTGAACGTCTTTGATGTTCAAATGTTTACTATTTTAGAACTTGCATCTAATGTTGATATTTCTGCAGGATCTTTAGTAGTTGGATCTTCTAGTGGTGCTAGAGGATATCTGGTTGATGCTGTATCCTCCGATGATCACATCAACTTATATCAAGTAGAAGGAACTTTCTCCGTCAACGAAATGCTCACAATTGACGGTGAACAACTTGATACTATTAGTGCGTTACACACATATCAATACTCAGATACTCGTCAAATTGTTGCTAAAGATGAAACTACAACTGCTGTAGAATTCACCGCAGACGTTATCCTTGAAGATATTCAAATTGTTCAAGGAACTACATTTACATATAGCACTACCTCTGCTGATATTCTGACTGTAGACACTGTTAGTGCTGCAGATGGATCTAGAACTGAGGGTACTTATTTAATTGGTGCAACTGATTATACTACAGATGCAAATGGTTCTGGTGCAACATTTAGTATTGCAGTTGATAATACTGGTGACGCCACTGTTACAATAATCAAAGGTGGTTTTAGTTACGTAGTAGATGAAACAATTACTGTAACTGATGCTCAACTTGGTGGTGGCGGCGGTGCTAATTTAACTTTTGATGTTGCAACAGTTGGAGCAACAATTAAAGGTCTTCAATCTAACTTTGCTCTAGACCTCAGATCTGGAGATCAGATTTATTTCAGCGACACCCAATTTGTTACTGTAGATAAGGTCGATCAAGATAATTTGACTGGTACAGCGTCTACAAACATTTTTGAATTTGCAAATCAAATTGTCAAAGTAGATCCTGGTTCTGCATCTCCTTCTGATGGAGTTTATAATGCTATCTTACGTTATAGATCTAAACTTTTTGATGTTGCTAATGCTGATCTTATCAGCCCCATGCCTAAGAAGTATGTAAAGAGCATTTCTGACGAATCCATGATTGTCAGAAGAACATTTGATGCTCAAACAGTTGCTTCTAACTCAATCTCTATCACACTTCCTGAGAACGAGCAGTTCCAATCTATTTCTGAAGAAAACTACGTCATTACTGTTCTTGCTGGCACTAATTCTACTCATCCTGTTGGGGATCAAATTACAATTGATACCACAAATACTGGAGTAATAGGATATACTTTCTTCACTTCAACTGATAGAACAACATTACAAATCGATAATCTGACAAATGTTACTTCGGTTAAAGTTACTGCAACTATTTCTAAGAACGTAACTGTCAGAAAGACAAAATCTGGAAATCAGATGTTTGTTCTGAAAGTCAATAAAACTACTAAAAATATTGATAAGCAGAATTATAATCTCACATATTCAAATATCTATGGAACTAGAATTGAAGATAGAGATCTCAGTCTTGGTTTAAAAGATTGCTACCGTATGCACGCTGTCTATGAATCTTTTGATGAGAATGATCCTGTACTTCCTTCAGTAACATTAGTTGAACCTGTATTCTTTGAGACTGGTTCTATCGTTACTGGCAGAACTTCAAAGGCTCGTGCTAAGGTTGTAGATTTTAATTCTGGTAGTCTAAAACTCAGTTTGGTTTACCTTGATGGTGGAATGACTTCTGGAGAGACTATTGATGGTGTTGATAGTAATGGAGATCCAATTACCGCTATTGTAAATGATAGTGAAGGATCTGTTGTTAATGGATCTAAAGTTGTAACAGACAATTATTTCTTAGAATTAAATCAAACTGGATTTATCTATGATATTTCTAAAATTGTACGTAAAAAAGGTACATCTATTCCAATTAGAAAACTTTTAGTTGTTGCTGATTATTACTCACATTCTTCTACAGGAGATTATTTTGGTGGTCAGTCCTATCTGAACACAAATTATGATGAGATTCCATTCTTTGGAGCTAAGTATCTTACCGACTATCTAGATTTCCGTCCTGGTGTCAAAAATCTTTTCAGTGGAAGTGGCACTGTAGGTTCTCCTGCTTTCGTAAATTGTTCTACTTTTGACTTTAAGTCGAGAATATTCAATACTTCTGGTACTCCTTCTGCAACTATTTTTGATATTCCTAAGTTGAATAGCAATTTTAGATGTGATTTTGATTGGTATCTTCCCAGAACGGATAAGTGTTTTGTTACTCCATCTGGTGAATTCCAAGTTGTTAAAGGAAATTCTTCAGAAAGACCTGAATCTCCAGACAATCTTAAAGATGCAATGCTGTTGGCAACAATCAGTCACAAACCATATGGTTTTGATCCTGAATCTGATGTTGTTATTAGTCGTTCTGATAATAAAAGATACACTATGCGTGATATCGGAACGATTGAGAGACGTTTGAACCAGGTAGAATACCAAACCTCTCTCAATATGCTTGAGTCGGATACTTTCAATACTCAAATTTTAGATGCTGATGGTAAAAATCGTCTTAAGAATGGTTTTATGGTAGATGATTTTACTGATCATAGTAAGTCAGATACTGGTCATGAAGATTTTGCTGCAGCATTAGATTTCCAAAAAGGTGAGTGTCACCCCGCTCACTATACGACTAATGTTTCTCTTGAAATTAACGATAACCTGTCTCAGAATTATCAGCAGACTGGTCCTATTATTACGTTACCATATACAGAGCTTGCAATTATCAATCAACCTTATGCTTCTCGTGTTGAGAACATTAACCCATTCAACGTCTTTACTTACATTGGTCGTATTGTATTGACACCTGGATCTGATGATTGGATTGAGACTGAAAGACTTCCTGCAAATGTTACTCAAATCGAAGGCGATTTTGAAGCAGTCGCCGCAGAGATGAATGTTGACCAAAATGGTTTTTTACCTATTCAGTGGAATTCATGGACAACTACATGGAAATCTGAAGAATTTATTGGATCTTCAACTGTACACAATCCTGGTTGGTTGCAGGAAGACATTGGTAGATCTCCTAGACCCGATGTATGGGGTGGTCGTGGTATGCGTCGTATCAACGTCGTTGAAACATTTGAAGTTAGTGGAGAACAAGTTAGAACAGGTATTAGAACTCAGGTTGTACCTAGGATTGAGATGGAATCTCTTGGCGATGCTCTCATCTCCGCTACAGTTATTCCCTGGATTCGTTCTAGGAATATTGAACTTGATGTTGCTCGTCTCAAGCCAAGAACACAAGTCTACTCATTCTTTGATGGTCAGAATGTCAGTGCATACATGACTCCAAAATTGATTGAGATCATTAAAGATCCTGCTGTTGATACAAGAACAAATTCTACTCCTTTTGTAATTGGTGAGACTGTAACTGGTCAAACAAGTGGTTGTGTATTCAAGGTTGCAGCACCTAATGATTTATTTGAATTCAATCCATATACTGATGAAGAACTACCTTCTTCATATGCTTCAACAACTGCATATTTGAGTATTGATACTGAAGCACTTGCAAAGCAAGCAGTTGGTGATTTCTATGGAAATATGCAAGTTGGAGAAGTTCTTATCGGAACTTCTGGTGCTACAGCGGTAGTCAAAGACCGCAGAATGATCACAGACAGATTTGGTAAGATGAAGACATCTTTCTTCATTCCAACACCTAAAATCGATACAAATCCTCGTTGGTCAACGGGTACTAGAACACTTAGATTGACTACATCAGATAGTGATTCTCGTATTGCAGGTGCTGTTGCATCTTCTGCTCAGGTAGAATATGAAGCAAGAGGTACGTTGAATGTCGTTCAAGAAAATATTCTTGCAGTTAGAAATGCTGAGATTGTTCAAGATACAGTAAATCAAGAACAAACAATTCAATCTACAAGAACTGAAGTTCGTCAGGTTGGTTGGTATGACCCTCTTGCACAATCATTTATCGTCGATCAAGATGGTGGTGTATTCTTAACTTCGGTTGATGTTTACTTCTTTACCAAGGATTCTGCTATTCCTATCTCAATGCAGATTAGGACCATGGAGAATGGTTATCCTACGACCACTATTCTTCCTTTCTCGGATATTACTTTAGAACCCTCTGAAGTTCAACTATCAGAGACTGCAGCAGTTGCAACTAAATTTACATTTAGAGCACCTGTTTATATTCCACAGTCTCAAGAACATTGCTTTGTTCTCCTTTCAGATTCCAATGAATACCAAATTTGGATCTCTAGAATGGGTGACATTGATGTTACTGGAGATAGAACAATTTCAGAACAACCTTACGCGGGTGTTCTATTCAAATCACAGAACGCATCTACCTGGACTGCTGACCAGTACGAAGATATTAAGTTCATTATCAATAGAGCAGAATTTAACAATCAGGTAAATTCAACTCTTGTTCTTAATAATGCTGAACTTGGTCTCGGTAACAGAGGCAAGTTGAGGTTGAGGAATGATGCTATTGAGTCTTTCTTACCAGAGTTAATTCTTACTATGAATAACACGACCCTACCATACACTGCAGGTTCTCGTGTCTATCAAAAAACTACTTTGGCAGAAGCGACAATTAAAACTGTACAAACTACAACAGCAGGTGTTTTGTTAACTATCAATGATATTAATGGAACTTGGGCATCGGGTTCTGAATCTGGTGGTATTGTTTCAAATGGTATCGTTTCTTCCAAAACACTATCTACAATTGTTGTTACAGGAAGAAGTGGTCTTTTTGAAGTTGGAGAGACTATCACAGGTGGCACTTCTGGTTCTACAGCAGAAATTGTTACTTTTGATGCTGGAACTGAAACTTTGACCCTCCGCTATGTTTCAAAAACTTTCAGTTCTGGAGAGCAAATCACTGGTGGAACTAGCAATGTAACTGCCAATCTCAGTACAGTTACACCTCCAACATATTCTGGAGATGCAGTAGAAAGTTCTGTGATTGCTAATGCTTTCCCTGTTAGCACTCCCACATACAGTTCAGCACAAAGAAAGGTTCGGGTCAATCATAGCAATCACAATATGCATGACCTTTCAAACAATGTTGTTATTGAAGGGATTAAATCGGAAGTTACTGATACTTTCTTGACCGCAGCAATCTCAGCATCAGATACAACTGTGACTGTTAATGATGCATCTGCTTTCCATAAGATTATTAACGGCGTTGCAATTTCGTCAAGTAATGTTGGATATATTATGATTAATAGTGAAATTATGTCTTACTCTGCTATTAGTAGTGATAATAAGACGATCACTGTTAATGAGAGAGGACTTGATGGAACAACTGCTGTTTCTCATATAGATGAATCTGCCGTTAAGTGTTACAATTTTGATGGTATTCCTTTGATTGAGATCAACAAAACTCATGAAGGAATTCTTAATCCAACTCTCGATAGTTATGAATTGAGCACAAGTTCTATTGCAAGACTTGGAATTAGGTCTGGTGGAAATGCTATTGTTGCAACTCAAAATATTCAATATGATATTTTAGTTCCTCAAGTTGAAAGAATGCTTCTTTCTAAGACAACGCTTTCTTCTAGAATTAATACGATTAGTGGCACATCTATCAATGATGGATCTGCACTCTCACAAGCATCATTCTCTAATGATGGAGTGTTCTCAGACATTATCTTGAGTAAAGATAACTACCTGTATCAACCTGCACTAATTTGCTCTGCTATTAACGAATCATCTGAATTGTCTGGTGCTAAATCATTCCGTATGGATTTAACATTGGGTAGTGAGACAACTAATGTTTCTCCTATTATCGATACTGATAGAATGTCTATCACTTTAGTTTCAAATAGGATTAATAGTCCATCTGATCCTAATAGTGCAAAACTTTCTGTTGGTGATGAACATGAGGCAGTCTATATTACTAGAGTTGCTTCACTGACAAATCCATCGGGTGCAATTAAATTGTACTTCACAGGATACCGTCCATCCAACACCGAAATTAAAGTTCTATATAGAACAAGACCTGTTGGTTCTACAACTCCAATTAGTCAATATGGTTTTGAATTCTTCCCAACAGAAGATGCAAATATTCCTCTGACAACGGAAAGACGAGTATATAGAGAATATTCGTATGAAGTTTCTGGATTGAACTTTGATCAATATCAAATTAAAGTTGTATTTGTATCGCCTAATCAATCACTAACTCCGATTATTAGGGACATTCGTGCAATTGCTTTAGCTGTATAA

Genome Context

Title	Authors	Date	PMID	Source
The Genome Sequence of Synechococcus phage S-CAM8 0608BI06	Henn,M.R., Martiny,J., Weihe,C., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Haas,B., Nusbaum,C. and Birren,B.	2011-09-23	—	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature