Genbank accession
AGH16168.1 [GenBank]
Protein name
host specificity protein
RBP type
TSP
Evidence RBPdetect
Probability 0,78
TF
Evidence RBPdetect2
Probability 0,96
TF
Evidence Phold
Probability 1,00
Protein sequence
MKDGDIGSRQFVTLVDVIGEGQIAGFPSAIDAGLTHGSISYRIASLKDLFLNGTQVLRDGASNTDPNINDFNFGTSEANAPSFFSRLGTSNQTKIQGLVETERDRTVGVTVTQSQSQTVTITDTSTEGVRVTIGFPRLQEIEDDGNIKGTTVEYDIEVRKQDNTLIKKINPETLLTGLDRSIHTSGGRVTGKSTSPYFKDHIIVFPEDLADSDFPVTVKVSRQTADSSDAKLANAFEFTTLTELVFDSPTYLNTAYAAIRFDAEIFRAVPQRMYRVRGRLVKIPHNSTVRSDGSLSFSGDFNGTLKATKEYCNDPAWVLYDILTESVAGFGDFVAETEVDKYSFYNASVYNSELINDGEGGTAPRFSCNIVIQRSTNAYTLLDRIASIMRGSLYIDDGVITLCQDRPTTSTYFFSYANITEDGFVYTGASQRTKDTVINVKYFSNETRSFEYETVEDTAANQSKYGVVVKNIEAVGCNNQAQARRAGLWHLFTQNNETETVAFTTTADAGSLVRPNQIITVQDPVRSGLRRSGRIKTATTTQITVDNTKDLPTSHTTGDQLSVILTDGTMETKTVSDITGNVITVSSAYTSAPQAFSVWLLLRATTETEDFRVLSVTEEDNTFTINAMFHNSSKYAFVEDGASITVPQITTLLLPKSAPSNLSAEELIIALGNRAVSKLVLSWQPVSGVTEYSVKYQFNNGNVITERVTAPTFEIFDSELGEYKFEVFSYNAVGEPSTIPTTLTFNAQGKTALPADVQNLTIEPYNDDFVKLRFSKSTDVDVIHGGNVVVRHSNLTDGTGTFTNSVDLINALSGNISETLIPAIAGEVILKFRDDGGRLSSGETSVIISPPNQQPKLTAFTDREDTDATPFGGTKTNTFFDSTLGGLTLASTTTIDDVTELIDTLSQIDFLGDVASTGSYEFANPLDLGSTMDTKLTRHFVTESFYAGSFIDQRTELIDTWNDIDQLTAFETNAALFVATTTQDPALSTSGTYTINNGSGGAGTIITITKASHGYSVGSFVVVDFTTGTGVDENYQIISKTTDTFTLTSATSLNTSGNCTYGAEFSDFNIFTNGVLRGRGFKFKVEMSSNDKAQTILLKELGYTATLNRRVETVNSLIASGTSTKAVVFQDKFFTGFSGTSVAAGAALPTIGIVIENAQSGDFFSLSSISSTGFSIDIKNGSSFVDRNFKYTAVGFGRGS
Physico‐chemical
properties
protein length:1200 AA
molecular weight: 130041,57780 Da
isoelectric point:4,69589
aromaticity:0,09333
hydropathy:-0,18617

Domains

Domains [InterPro]
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Cyanophage MED4-117
[NCBI]
889954 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host Prochlorococcus
[NCBI]
1218 Bacteria > Cyanobacteria > Prochlorales > Prochlorococcaceae >

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
AGH16168.1 [NCBI]
Genbank nucleotide accession
JF974321 [NCBI]
CDS location
range 29741 -> 33343
strand -
CDS
ATGAAAGATGGAGATATAGGGTCAAGGCAGTTTGTTACATTAGTGGATGTAATTGGGGAAGGTCAAATAGCTGGTTTTCCCTCTGCTATAGATGCTGGATTAACTCATGGGTCTATTTCTTATCGAATAGCAAGCCTTAAAGATTTATTTCTTAATGGAACTCAAGTTTTAAGAGATGGTGCTAGTAATACAGATCCAAATATTAATGATTTCAATTTTGGTACAAGTGAAGCTAATGCCCCATCTTTTTTTTCAAGGCTTGGCACTTCAAACCAGACAAAAATACAAGGACTTGTAGAAACTGAAAGAGACAGAACTGTAGGAGTTACAGTAACACAATCTCAATCTCAAACTGTAACTATTACTGACACTTCAACTGAGGGTGTAAGGGTAACTATTGGTTTTCCTAGATTACAAGAAATTGAAGATGATGGAAATATAAAAGGAACTACTGTTGAATACGATATAGAGGTAAGAAAACAAGATAATACTTTAATAAAAAAAATTAATCCCGAGACTTTGTTAACTGGTTTAGATCGTAGTATTCACACCTCTGGGGGTCGAGTTACTGGTAAAAGCACTTCTCCATATTTTAAAGATCATATAATTGTTTTTCCTGAAGATTTAGCTGATTCTGATTTCCCAGTTACTGTTAAAGTTTCTAGACAAACTGCTGACAGTTCAGATGCAAAACTTGCGAATGCTTTTGAATTTACGACTTTAACTGAATTAGTCTTTGATAGTCCAACTTATCTAAACACAGCTTATGCAGCAATAAGGTTTGATGCTGAAATTTTTAGAGCAGTCCCACAGCGAATGTATAGGGTAAGAGGTCGTCTTGTAAAAATTCCACATAACTCAACTGTTAGATCAGATGGTTCTTTGTCATTTAGTGGTGATTTTAATGGAACTTTAAAAGCAACTAAAGAATATTGCAATGATCCCGCATGGGTTTTGTATGACATTCTTACAGAATCCGTTGCTGGTTTTGGAGACTTTGTTGCTGAAACAGAGGTCGATAAATATTCTTTTTATAATGCCTCTGTCTATAATTCAGAATTGATCAATGATGGCGAGGGTGGTACAGCCCCAAGATTTAGTTGCAATATTGTAATTCAAAGAAGTACAAACGCATATACTTTGTTAGATAGGATTGCTTCTATTATGAGAGGTAGCTTATACATTGATGATGGTGTAATAACTCTTTGCCAAGATAGACCAACAACAAGCACTTATTTTTTTTCTTATGCCAATATTACTGAAGATGGTTTTGTATATACAGGTGCAAGTCAAAGAACAAAAGATACAGTAATTAATGTCAAATATTTTAGTAATGAAACAAGATCTTTTGAATATGAAACTGTTGAGGATACAGCAGCCAATCAATCAAAATATGGTGTAGTAGTTAAAAATATAGAGGCAGTAGGTTGTAATAATCAAGCACAAGCTAGAAGGGCTGGTTTATGGCATCTGTTCACACAAAATAATGAAACTGAGACTGTAGCTTTTACAACTACTGCTGATGCTGGTTCTTTAGTAAGACCAAATCAAATTATTACTGTCCAAGACCCTGTGCGTAGTGGTTTAAGAAGATCAGGAAGAATAAAAACTGCTACAACCACACAAATAACAGTGGATAACACAAAAGATTTACCAACCTCACATACAACAGGAGATCAATTATCTGTAATTTTGACAGATGGAACAATGGAGACAAAGACAGTTTCAGATATTACAGGGAATGTTATTACTGTATCTAGTGCTTATACTTCCGCCCCTCAAGCTTTTAGTGTTTGGTTACTACTTAGAGCAACCACAGAAACTGAGGACTTTAGGGTTTTGTCTGTTACTGAAGAAGATAATACGTTTACTATCAATGCAATGTTTCATAATTCCAGTAAATATGCTTTTGTTGAAGATGGTGCATCTATTACAGTTCCACAAATAACAACTTTATTACTACCTAAATCAGCGCCCAGTAACTTATCGGCAGAGGAATTAATTATTGCATTAGGAAACAGGGCTGTAAGTAAATTAGTTTTAAGCTGGCAGCCAGTTTCAGGTGTTACAGAATATTCAGTTAAATATCAATTCAACAATGGTAATGTCATTACAGAAAGAGTTACCGCACCTACTTTTGAAATATTTGATTCTGAATTAGGAGAATACAAATTTGAAGTTTTTAGTTATAACGCAGTTGGAGAACCAAGTACAATTCCAACAACCCTTACTTTCAATGCTCAAGGTAAAACTGCTTTACCAGCAGATGTACAAAACTTAACGATAGAACCCTATAACGATGATTTTGTAAAACTTAGATTTTCGAAATCTACAGATGTTGACGTTATTCATGGTGGAAACGTGGTAGTCAGGCACAGCAATCTTACAGATGGCACAGGAACCTTTACTAACTCTGTTGATCTAATAAACGCTTTATCTGGCAATATATCTGAAACTCTAATTCCAGCGATAGCGGGTGAGGTAATATTAAAATTCCGTGATGATGGAGGCCGCTTAAGTTCTGGAGAAACGTCTGTTATTATATCGCCACCAAATCAACAGCCAAAATTAACAGCTTTTACAGACAGAGAAGATACAGATGCTACACCTTTCGGAGGGACAAAAACTAATACATTTTTTGATTCAACACTTGGGGGTTTAACTTTAGCTTCAACAACGACTATTGATGACGTAACTGAATTGATAGATACTTTATCTCAGATAGATTTTTTGGGTGATGTTGCCTCTACTGGTTCTTATGAGTTTGCCAACCCTTTGGATTTAGGTTCGACAATGGACACTAAATTGACTAGGCATTTTGTTACAGAATCTTTTTATGCTGGTTCATTTATAGACCAGAGGACAGAATTAATAGATACATGGAATGATATTGACCAGTTAACAGCTTTTGAAACTAATGCTGCTCTATTTGTGGCAACTACAACGCAAGATCCAGCTTTATCTACTTCTGGAACTTACACAATAAATAATGGCTCGGGTGGTGCTGGGACAATAATTACAATTACAAAGGCTTCTCATGGTTATTCTGTTGGTAGTTTTGTTGTTGTTGATTTTACTACGGGTACTGGTGTTGATGAAAATTATCAAATAATCTCAAAAACTACTGATACTTTCACTCTTACTTCTGCAACATCTCTGAATACAAGTGGAAATTGTACTTATGGAGCAGAATTTAGTGATTTCAACATTTTTACAAATGGTGTATTAAGAGGCAGAGGGTTTAAATTTAAAGTTGAAATGTCTTCTAATGACAAAGCACAAACAATTCTTCTAAAAGAACTTGGTTATACTGCCACACTTAACAGAAGAGTTGAAACTGTAAATTCTCTAATTGCCTCTGGTACTTCAACTAAAGCAGTAGTTTTTCAAGATAAGTTTTTTACGGGCTTCAGCGGTACAAGTGTAGCTGCTGGTGCAGCTTTACCTACTATTGGAATAGTAATAGAAAACGCACAGTCAGGTGATTTCTTTTCTTTGTCTTCTATTAGTTCAACTGGATTTTCAATAGATATAAAAAATGGATCTAGTTTTGTTGATAGGAATTTTAAATATACTGCTGTTGGTTTTGGTCGTGGCTCTTAA

Tertiary structure

PDB ID
07be1474016db05ba8fc309104009b75ec1bd4e0bfd767a4fd73f8284585a325
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,7826
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50

Literature

Title Authors Date PMID Source
The Genome Sequence of Cyanophage MED4-117 Henn,M.R., Sullivan,M.S., Osburne,M.S., Levin,J., Malboeuf,C., Casali,M., Russ,C., Lennon,N., Chapman,S.B., Erlich,R., Young,S.K., Yandava,C., Zeng,Q., Alvarado,L., Anderson,S., Berlin,A., Chen,Z., Freedman,E., Gellesch,M., Goldberg,J., Green,L., Griggs,A., Gujja,S., Heilman,E.R., Heiman,D., Hollinger,A., Howarth,C., Larson,L., Mehta,T., Pearson,M., Roberts,A., Ryan,E., Saif,S., Shea,T., Shenoy,N., Sisk,P., Stolte,C., Sykes,S., White,J., Yu,Q., Coleman,M.L., Huang,K.H., Weigele,P.R., DeFrancesco,A.S., Kern,S.E., Thompson,L.R., Fu,R., Hombeck,B., Chisholm,S.W., Haas,B., Nusbaum,C. and Birren,B. 2011-09-23 GenBank