Phage RBP Database

Genbank accession

QGH72084.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MASDNFDMDWGDDPFAGDIDFDMDFDMDPFKGKGFVRSLATGFLQGAFDETLGSGEARMRTLRTILPSSYSNALDKLSFVSSRVDDLVREFKEENAESAKSLQSIASHLNQRMGSKLPGFAQNALGNFSEKDFSSWERLDPENPNFNAKLGNVDEDDVDQAIDASVMAQSAMFASLGESLNNMAATVGGQISATIGAGNRQLVNIEGGIRDLLSYQRNVQAKLDQAKLNLMARSYVQDAKFYKFMEAGIHAEVAELKRIVQYSKLSDFEKTNTFTASKEYMRNSVFNAVGKRVGGISGMLRDRFNAGNRKDAYNGISDLLGNLADGLEMGSDVGFSRGLLGNIIGKMIAGVAVDQLPYFFTRGPGKRAIDNLIKKYPEQGTFIREQIAKVTDMGNTVSHIAMSGGGIANYMADNWQPLDEMRFYDYEEYVDSLPPGRKPIPKAVWVAKNAAENKAKQSLNRLMSETTRSRGTQYTINRRNPKDLDKPGIWKEMNNITLNEVLPGLISQTNLILEKMRTGRDDVESVGYNYTRGQFQKDSDRRISVASDLMPHSEFRSFTSAALNMVDSLDPDKLLSPGARKALAKQIVVDVDKEYGFQPLYYLGDIPGVSPENLKEIHAVMKRHFGITDDEVRQFQSGDGLTRTKMLGRLNTAEGRERLNAASSKAQDLKENIPNITERINLLRATGNEQMLRDLGVIYTDNGIDKINIQAFHDRIGMYMDNPDNPVLKGATPSGNGPSPTLGGIRAGAGPTANPYEDLNNTLGTLNERLSNLDQLKNSTTVNWDSETGVFSDIKTSNQGILDKTTEMSMLLTTMLDLAKAGKLFSGAPSPRVEQQEEVAKRSVLDRIKKLVPNDVLGRSAEFLFKNNPLILGGLLGGVASSFMQNPIMAASVAGLGLLGGAWLQHRQRSGAAPEGDAPSDEEDILDERGEPILKAAKLRAGEYVDMATKKVIKTWEDIRGPVMDAINKSVVGARELAGKIFGSDGRAVALKGLRSVRDAAVGAYNMLNPMERIRSTIQLGKEFLYQQDVFLKSDLKNPVLRASKFKTGDYFVRDANGSFKPITGWNEIDGAVYDNQGNQLVSEEEYQSGLVTASGAAVRNVGGMAANMVGGAAGLARAGINNLLGRFGYSQGPNREGNGAAGRKSGPNGVERRLDKIYRLLCKQFDIPAEVDPDEPLGVTGESSDNSLRLNSLAWKEKQKEKQEKHRVNEAIINISETLGGSKEEGAGKKEGGGLFDKLKGLVMGAGGFAVKLFKNPLGAIGDILGGVGKFALGTTAASIKRLGKIGSAMFSGVLGVASPIYKLLKLGFTKLAQAFVMGKAAGGMRRGLFGGSPADDLDVEQRGQSTRRRRGGARAGRGGRLGRMGRFAFGSPTAAVGSYLLADMFGDDTQDATPTSAADVSMGERDSVTGHYRTQGDAVVDVLTQWLPSGMLAKAATDSLPMDKETREGLDNYGLFWSSDKKFFFKRDEMEAYEDKIKGVSKTPDGYGELKTQYATQPRAVRFAMYGCADQQSSFGRRLGWLEQVLYPYVTIRDNRASLKKDAPIEKILTDFMNTDSGTNHDAGAIQTWFVARFKPVFLVTNAAVSVARMGDIESFDNAKGYEVVQVLERVQQTLNTFSPNPFTIDVRVDSKYGTMGPESTRHKIDAVLKDMEKSYPKPSTTVEKIAPTVEANAKAQAPGVPKETGPSAEITAQDAMSKIAARASMDDIEKRFSQPEQVKTIDISDLMPGGDKEMDPFVMTRLAVYGNIDNMPWRVEAVLRLERYVESYIMVIGDQARFTGKSSQLLELFKPAFRISTKLAEMNWMTWFRDRFLPTLMTYTIEVKKLTGVVPERGWKQLSATNRAKVARKLTEQMVTVDEQLKTVWEVQASPFPNSTSGKWSDRADRYLKILDMKAQEARLKDPELEEEKSRGTSGDDPVQMAQAARSRQAAQSAIQEVFGNNKGIGGSSFTPSMNGVRTGGPTSVYPNPTMSVDGGGAGSAGQFMGKADANFNPEFLKKAGEDKGIKMSPEQGEKLMLNHLLKAGITDIKTIALALAMVKKETGNYQNTVENTNWSAPTLLKYFKNIPDAATAQKVAAMSPAERAMWVYGRAPKGPQLGNTTPEDGWKYRGRGFFQLTGKANYERFKKETGIDVVSNPQLVSEDPNVMAESAVRFLKNNKAMLSIAKTGDFDTAVRGINGGNAVPATDERRRYYQEYLNKLRNGDLALDGAEAEQAAATPPAPTNEPPAAADKGVPQGAVATDTPIATPPGQNTVSDLLKSDARNTAPSNAGTPPPMKTASTLDPGVAAGDTNDGPVNTVNSSAPSIDQPRAPTSSSSPSSNSAQPAPVKEAAKPVDKQAMPQVVQAPAMPDHINTTDATAAGQLAIANQTLNKIAQLLERSSSNSPMVRMN

Physico‐chemical properties

protein length:	2395 AA
molecular weight:	260362,23590 Da
isoelectric point:	8,14012
aromaticity:	0,07056
hydropathy:	-0,46209

Domains [InterPro]

InterPro ID	Start	End	Source	Name
Coil	659	686	Coils	None
Coil	756	776	Coils	None
G3DSA:1.10.530.10	2010	2204	Gene3D	None
IPR023346	2027	2204	InterPro	Lysozyme-like domain superfamily
IPR000726	2107	2160	InterPro	Glycoside hydrolase, family 19, catalytic

	Name	Taxonomy ID	Lineage
Phage	Klebsiella phage N1M2 [NCBI]	2664939	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

QGH72084.1 [NCBI]

Genbank nucleotide accession

MN642089.1 [NCBI]

CDS location

range 206060 -> 213247
strand -

CDS

ATGGCAAGCGATAATTTCGATATGGATTGGGGAGATGATCCATTTGCCGGGGATATAGATTTCGATATGGATTTCGATATGGATCCCTTTAAAGGTAAGGGGTTTGTCAGAAGTCTTGCAACAGGTTTTCTGCAAGGTGCTTTTGATGAAACCTTAGGTTCCGGTGAAGCTCGCATGAGAACACTGAGAACTATCTTACCAAGTTCTTACAGCAATGCCCTTGATAAACTTTCTTTTGTCAGTAGTCGTGTTGACGATCTGGTTAGAGAGTTTAAAGAGGAAAATGCCGAATCCGCCAAATCCTTACAAAGCATTGCTTCCCACCTCAATCAGAGAATGGGTTCAAAGCTTCCTGGTTTTGCTCAGAATGCATTAGGTAATTTCAGTGAAAAAGACTTCTCCAGTTGGGAACGTCTCGATCCTGAAAATCCTAATTTCAATGCCAAACTAGGTAATGTTGACGAAGATGATGTAGACCAAGCTATTGATGCTTCAGTAATGGCTCAATCAGCTATGTTTGCTTCACTCGGTGAATCTTTAAACAATATGGCTGCCACCGTAGGCGGTCAGATATCTGCAACTATTGGTGCAGGTAATAGACAGCTTGTAAATATAGAAGGTGGGATACGTGACCTTCTTAGCTACCAAAGAAATGTACAAGCTAAATTGGATCAAGCCAAACTGAACTTGATGGCACGCTCTTATGTTCAAGATGCGAAATTCTACAAGTTCATGGAAGCTGGTATTCATGCCGAAGTTGCTGAACTGAAACGTATTGTTCAGTACAGTAAACTTTCAGATTTTGAAAAGACCAATACATTTACTGCATCCAAAGAGTACATGCGAAACAGTGTGTTCAATGCGGTTGGTAAACGTGTTGGCGGTATCTCTGGAATGCTCCGTGATCGGTTTAATGCCGGTAACCGTAAAGATGCCTATAATGGGATTAGTGATCTCTTAGGGAACCTTGCAGACGGTTTGGAGATGGGTAGTGATGTAGGGTTTAGTCGCGGCTTGCTCGGCAATATCATTGGTAAGATGATAGCTGGTGTGGCAGTAGACCAATTACCATACTTCTTTACACGTGGTCCAGGTAAAAGAGCCATCGATAACCTAATAAAGAAATACCCTGAACAAGGCACCTTTATTAGGGAACAGATTGCCAAAGTAACAGATATGGGTAACACAGTTTCTCATATCGCTATGTCTGGTGGTGGTATTGCCAACTACATGGCGGATAACTGGCAACCTCTTGATGAGATGCGGTTCTACGATTACGAGGAATATGTAGATAGTTTACCTCCTGGTCGCAAGCCAATACCTAAAGCAGTTTGGGTGGCTAAGAACGCTGCAGAGAACAAAGCAAAACAATCTCTTAACCGATTGATGTCAGAGACCACTCGCTCTCGCGGGACTCAGTATACCATCAATAGAAGAAATCCTAAAGATCTGGATAAACCAGGTATTTGGAAAGAGATGAACAACATCACCCTGAATGAAGTATTGCCAGGGTTGATTTCTCAGACTAACCTTATCTTGGAAAAGATGAGAACCGGTCGTGACGATGTAGAGTCAGTTGGATACAACTATACTCGAGGCCAATTCCAAAAAGACTCCGACAGAAGAATTTCAGTCGCTTCTGACTTAATGCCTCACTCTGAGTTCCGTAGCTTTACTTCAGCTGCATTGAATATGGTTGACTCTTTGGATCCAGACAAACTGTTATCACCAGGTGCTCGTAAAGCGCTGGCTAAACAGATCGTTGTCGACGTTGACAAAGAGTATGGTTTCCAACCTCTTTATTACTTAGGTGATATCCCAGGGGTTTCTCCAGAGAACCTGAAAGAAATCCATGCGGTAATGAAACGTCACTTCGGGATTACCGATGATGAAGTTAGACAGTTCCAAAGTGGGGATGGTTTAACCAGAACCAAAATGCTGGGGCGTCTTAATACCGCAGAAGGTCGTGAACGTTTAAACGCAGCTAGTTCTAAAGCACAGGACTTAAAAGAAAACATTCCTAATATCACTGAACGTATTAATTTGTTACGTGCCACTGGTAACGAACAAATGCTCCGTGACTTAGGAGTTATCTATACCGATAATGGTATCGATAAGATTAACATCCAAGCATTCCATGATCGTATCGGAATGTATATGGATAATCCAGACAACCCGGTATTGAAAGGTGCTACCCCTAGTGGTAATGGTCCTTCTCCAACACTGGGAGGAATACGAGCTGGCGCTGGCCCTACAGCTAATCCATATGAAGATCTTAATAATACATTAGGAACTTTGAATGAACGCTTAAGTAACCTCGACCAACTCAAAAACTCCACTACGGTTAATTGGGATTCTGAGACTGGTGTCTTTAGTGACATCAAAACCAGTAACCAAGGGATTCTCGATAAAACGACAGAAATGTCGATGCTTCTCACAACCATGCTTGATTTAGCTAAAGCAGGTAAGTTGTTCTCTGGTGCCCCTAGCCCTCGTGTAGAGCAACAAGAAGAAGTAGCCAAACGTTCAGTTCTTGATCGTATTAAGAAACTGGTACCAAATGACGTATTGGGTAGATCTGCAGAATTCCTCTTCAAGAACAACCCTCTTATCCTTGGTGGGTTATTGGGTGGTGTTGCGTCTTCATTCATGCAGAACCCAATTATGGCGGCGTCAGTTGCTGGATTGGGATTGTTGGGTGGTGCGTGGTTACAACATCGTCAAAGATCAGGTGCCGCTCCAGAAGGGGATGCTCCTTCGGATGAAGAAGATATCCTTGACGAACGCGGTGAGCCTATTCTGAAGGCAGCCAAACTGCGCGCTGGTGAATACGTGGACATGGCTACCAAGAAAGTTATTAAAACTTGGGAAGATATCCGCGGTCCAGTAATGGATGCTATTAATAAGTCCGTTGTGGGAGCCAGAGAGTTAGCAGGGAAGATCTTTGGGTCTGATGGTAGAGCAGTGGCACTAAAAGGCTTGCGTAGCGTTAGAGACGCGGCTGTGGGTGCTTACAACATGCTTAACCCAATGGAGCGTATTAGATCGACCATTCAGTTGGGTAAAGAGTTTCTCTATCAACAGGATGTGTTCCTTAAATCTGATTTAAAGAACCCTGTATTAAGAGCTAGTAAATTTAAAACCGGTGATTACTTCGTTCGCGATGCCAATGGTAGTTTCAAACCAATTACTGGTTGGAATGAGATTGATGGAGCTGTTTATGATAACCAAGGTAATCAACTGGTTAGTGAAGAGGAATATCAGTCCGGTCTGGTCACTGCCTCAGGTGCTGCTGTACGTAACGTGGGCGGTATGGCTGCTAATATGGTTGGCGGTGCGGCAGGGTTGGCTAGAGCTGGGATCAATAACCTCCTCGGAAGGTTCGGTTATTCTCAAGGTCCTAATCGAGAAGGCAATGGTGCTGCTGGAAGAAAATCTGGGCCGAATGGTGTAGAGCGTCGTCTGGACAAAATTTATCGTTTACTCTGTAAACAGTTTGATATCCCTGCAGAAGTAGACCCCGATGAACCTTTAGGTGTAACGGGTGAAAGTTCAGATAACAGTTTGCGTCTAAACTCTTTGGCTTGGAAAGAAAAGCAGAAAGAGAAACAAGAGAAGCACCGTGTTAATGAAGCAATCATTAATATCTCTGAGACACTCGGTGGTAGTAAAGAAGAAGGTGCTGGCAAGAAAGAAGGTGGTGGTCTATTTGATAAACTGAAAGGTTTGGTAATGGGTGCCGGTGGCTTTGCCGTCAAACTCTTCAAGAACCCGCTTGGTGCTATTGGTGATATTCTTGGTGGTGTAGGTAAGTTTGCATTGGGAACTACCGCAGCTTCAATCAAGCGTTTAGGTAAAATTGGTAGCGCCATGTTTAGTGGTGTGTTAGGAGTAGCCTCGCCAATCTACAAACTTCTCAAATTAGGTTTCACTAAACTTGCACAAGCATTTGTTATGGGCAAGGCCGCAGGTGGAATGAGAAGAGGGTTGTTCGGGGGATCTCCTGCTGATGACTTAGACGTTGAACAACGTGGTCAATCTACTAGACGTAGAAGAGGTGGTGCGAGAGCTGGTCGTGGCGGTCGACTTGGTCGCATGGGAAGATTCGCATTTGGTTCCCCTACTGCGGCAGTTGGTAGTTATCTCTTAGCGGATATGTTTGGAGATGATACTCAAGATGCGACACCAACCTCAGCGGCTGATGTCAGTATGGGCGAGCGTGATTCAGTAACAGGTCACTATCGTACTCAAGGCGATGCCGTAGTTGATGTACTGACCCAATGGTTACCATCTGGTATGTTGGCCAAAGCTGCTACCGATTCCTTACCTATGGATAAGGAAACCAGAGAAGGTCTGGACAACTATGGATTATTCTGGTCAAGTGATAAGAAGTTCTTCTTTAAACGAGACGAGATGGAAGCTTATGAAGATAAGATCAAGGGTGTTTCTAAAACTCCTGATGGATACGGGGAACTGAAAACCCAGTATGCTACACAACCACGTGCCGTTCGTTTTGCTATGTATGGTTGTGCTGATCAACAATCTTCATTTGGACGTCGTCTGGGTTGGTTAGAACAAGTTCTTTATCCTTACGTCACCATCCGAGATAATCGTGCTTCTCTGAAGAAAGATGCACCTATTGAGAAGATCTTAACTGACTTCATGAACACCGACTCAGGAACTAACCACGACGCAGGCGCTATTCAGACTTGGTTCGTAGCTCGTTTCAAACCAGTGTTCCTTGTCACTAACGCGGCAGTCTCTGTGGCAAGAATGGGTGATATCGAGTCATTCGATAATGCCAAGGGATATGAAGTTGTACAGGTATTGGAAAGAGTTCAGCAAACACTGAATACGTTCTCGCCGAATCCATTTACCATCGATGTCCGTGTCGATTCTAAATACGGCACAATGGGTCCGGAATCAACGAGACACAAAATCGATGCAGTGCTTAAGGATATGGAAAAATCTTATCCTAAGCCTTCAACTACGGTTGAGAAAATTGCACCGACGGTAGAGGCTAATGCTAAAGCTCAAGCACCAGGCGTTCCTAAAGAAACTGGTCCAAGTGCTGAAATAACTGCTCAAGACGCGATGTCTAAAATAGCAGCTCGTGCTTCTATGGATGACATTGAGAAACGTTTCTCTCAACCAGAGCAAGTTAAGACGATTGATATCTCTGACTTGATGCCTGGTGGCGATAAGGAAATGGATCCATTCGTCATGACTCGTCTTGCGGTTTATGGTAACATTGATAACATGCCTTGGCGTGTGGAAGCGGTATTGCGTCTGGAACGTTATGTCGAATCCTACATCATGGTAATTGGGGATCAAGCCAGATTCACTGGTAAGTCTTCTCAACTGTTAGAACTGTTTAAACCAGCATTCAGAATCTCTACTAAACTGGCTGAGATGAATTGGATGACTTGGTTCCGTGATCGATTCCTCCCTACGTTAATGACATACACTATTGAGGTTAAGAAATTAACTGGTGTGGTTCCGGAAAGAGGTTGGAAACAATTATCGGCTACTAATCGTGCCAAAGTCGCTAGAAAACTAACCGAACAAATGGTGACAGTTGATGAACAACTTAAAACTGTTTGGGAAGTTCAGGCTTCTCCATTCCCTAACTCTACTTCAGGTAAATGGTCTGACCGTGCTGATAGATATCTGAAAATCTTGGATATGAAAGCACAGGAAGCTAGACTGAAAGATCCTGAGTTGGAAGAAGAGAAATCTCGCGGTACTAGCGGTGATGATCCAGTTCAGATGGCACAAGCTGCTAGAAGTAGACAAGCTGCTCAATCTGCTATCCAAGAAGTTTTCGGTAATAACAAAGGTATTGGTGGGTCTTCATTCACCCCATCTATGAACGGTGTAAGAACTGGCGGACCCACTAGTGTCTATCCTAACCCTACCATGAGTGTTGATGGTGGCGGTGCTGGGTCAGCAGGTCAGTTCATGGGTAAAGCTGATGCTAACTTTAACCCAGAGTTCTTGAAGAAGGCCGGTGAAGATAAAGGTATTAAGATGTCCCCAGAGCAAGGTGAGAAGCTCATGCTTAACCACCTACTTAAAGCTGGGATAACTGATATTAAAACTATCGCACTTGCTTTGGCAATGGTTAAGAAAGAAACAGGTAACTACCAGAACACGGTGGAAAACACCAACTGGTCCGCACCTACCTTGCTGAAATACTTTAAGAACATTCCTGATGCCGCTACAGCTCAGAAGGTTGCAGCAATGTCTCCTGCTGAACGAGCGATGTGGGTATATGGTCGTGCACCTAAAGGTCCACAATTAGGAAACACTACACCTGAGGATGGTTGGAAATATCGTGGGCGTGGTTTCTTCCAGTTAACTGGTAAAGCAAACTACGAACGGTTCAAGAAAGAAACGGGTATCGATGTTGTTAGTAATCCGCAGTTGGTTTCTGAGGATCCTAATGTAATGGCTGAATCAGCTGTTAGATTCCTTAAGAACAACAAGGCAATGTTGTCTATTGCTAAGACGGGTGATTTCGATACAGCGGTTCGTGGTATCAATGGCGGTAATGCTGTACCAGCTACAGATGAACGTCGTAGATACTATCAGGAATATCTGAATAAACTCCGCAATGGTGATTTAGCGCTAGATGGGGCAGAAGCCGAACAAGCAGCTGCAACTCCTCCAGCACCAACTAATGAACCACCTGCGGCAGCAGATAAAGGTGTTCCTCAAGGAGCCGTAGCTACAGATACTCCAATCGCAACACCTCCTGGTCAGAATACCGTTAGCGACTTGTTGAAATCAGATGCACGCAATACCGCACCATCTAATGCAGGTACTCCACCGCCAATGAAGACAGCTTCAACGCTCGATCCTGGTGTGGCTGCAGGTGATACTAATGATGGTCCGGTGAATACAGTTAACTCTAGTGCTCCATCTATCGATCAACCTAGGGCTCCTACTTCATCTTCTAGTCCTTCTTCTAATAGTGCTCAACCAGCACCAGTTAAAGAAGCGGCTAAACCAGTTGATAAGCAGGCCATGCCTCAAGTTGTTCAAGCTCCTGCAATGCCTGATCATATCAATACTACAGATGCTACCGCAGCAGGTCAACTTGCTATAGCTAACCAAACGCTTAACAAGATTGCTCAGTTGTTGGAACGCAGCTCTAGTAATTCCCCAATGGTGAGAATGAATTAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence