Phage RBP Database

Genbank accession

CAB4175723.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MSNRDINYVKLLTEESSFQLVRTNPKLTGNVKLTINESGGMWLDSIKVSPELSTSLYSKVAIDTTKSHPANLFMFFNNGSTPNEIVFDLAEQVDTTKTSKNFKDQYDFSHYFSGAKYLASNKYVERMSYFAPLYLKEEVPDYFIVFKITDPANFPLNQVKQKYINGETKTDYLIDLFNNASIIKTFDLRAETVPGKYLRNYINNVNFPKSPLTVLYEENDFTTWNGILLDEGIFGSRGELIHDLYTAAQPLKFFEENITNGFSRNGVIFPNILNLEFVFNDDTSNTYDFNRYLGMYVNAIELTKLDIDLNRAYLNRGTWENEPHFRKNFLETDEVSLTQSNLDGVIVPFKNSKVNISEFRQTFTDSDNLFINYINDKDGRLYMPKLSNPFEIEYSSSQSAALSLIEFKVADSISISTPGTGYSTLNNVTTTATLGSGSGLIVNITDDGLGGIASVVIVNGGTNYALGDTVTVNSGAGNAILQVNSVLSGTTVNANLTSHGYETGNLIVISSTDSEYAGEFLITTVDSDNFEYTVASVPTNATATCTSKKELSTGQFRFANNKIDLGLFFGQSRTNFLQDLGASTKVAGKSHAVIKINYAGRVSNFNLSSPGTGYTSAIGVDTTSSVGTGLTLDVIDDGAGGILSATINQPGSGYQVGDVITIDGGNSNATITVSAVINASLDNYDEIKLYHPNGTRLDSIGKYDLIISTQLYSLIPNPGEYYVYNDYDNVLGYDEFYMNGGGTAEQIATALAGCINGIRSRTFTAYQYNDRVFIKVNSPGDFDNLHKISFFSPVNEYSVITINSTNTGSSLIGSVFSFMGGSKETGNRLIIDAGHLSKIEENFDSILVKSSDSWSKIRKVSPWVDEITETNSTTPALRSATLSNYDNKLAIVLDENETPTVSNKEFLMRPKFRPSFGLLSFYLIKDLDFDFYSSTYANFPNIDLYQHYYIPENLNLLEPGIDYIVYGGNIKVDDGTPIGIIHLAGSSFTAPFLTSYSAISGSPLVTYDPSSTSAVIAINDNNNELDSFNGFSILKDPSKIVPQDTSNEYLLKTKYLNGLTVTEYDYYKENESLDFALRSKIIPYITKWGIKNGKDSRDNPYRLNTELIFGRNNFSPDHEDKSQNPINFTHEWFYIESKFNYVYDESTAAQNTNYFETPLDETSLLSDPDYFINYFTYTPTSLVGKEVADTQFRYSSLYKNSANQYEAFFKGFKLTFKDVTDPDVIGADGKPVAKTITTRFDGYKFSCILKPILEDINDHTKPPIKYRVIEHKDYKFIVVIIEVYIGSIDDIDDYWKDFGLFGTSQVNPSNFTSTTPSTSVDYFDSINGDYRIAFDQVSNLTHTLLYSLKNKKYNTLLNSFSTTKMGSKLNFASTGFNGSDYTIRALANANTPNYIGSLTDDIINPTDSTLIFMKDLSTNFDVFMSSLVGFVPVFPPINPIDYSLEKFIHYDGANYGVGLILPPASIYGILPTSTVSFINQNFAFKVMTGGEGYFERLFGKISFAKFKSYVNSLDDIIEYSSYSLDSNGVSSLNTDPNFYLEILDTSYVEKQNQLITNYTTSIPIQFSGQEEIGTDYEVANLPLKYELNRYKGEYEPVIKNYSIYQSNYKFKKNTINDLSLSNTKINSEISNFLTIQHFNHIKVADSQILVLESDESYLPIYPKISEVAIGQGEYFLLRGNWDWGFHYRYSNKEQYSPVSGALRIEEDDSFLAKLINLPELIELNDFKIEFIDPALEFNSVDISKIEIVAKETPNSVDGIINVNNVLTRYLIEDGISAKFNEYLINSSEYIGNFTSISDPDINVSSYVREYIKLNILKLYDIDINEFYAKLDTSVVPSLPQEGTNPNSIEFVFLDDKQRFTKGYDILTSLQINKIDKLILRFSFLKRPGSGLLVSPKIKIKFI

Physico‐chemical properties

protein length:	1902 AA
molecular weight:	213118,56210 Da
isoelectric point:	4,74062
aromaticity:	0,12723
hydropathy:	-0,25494

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR023366	482	549	InterPro	ATP synthase subunit alpha, N-terminal domain-like superfamily

	Name	Taxonomy ID	Lineage
Phage	uncultured Caudovirales phage [NCBI]	2100421	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAB4175723.1 [NCBI]

Genbank nucleotide accession

LR796923.1 [NCBI]

CDS location

range 228947 -> 234655
strand +

CDS

ATGAGTAATCGTGACATAAATTATGTTAAATTATTAACAGAGGAAAGTAGTTTCCAGCTAGTTAGGACAAATCCTAAATTGACAGGTAACGTTAAACTCACGATAAATGAATCAGGCGGCATGTGGCTAGACTCAATAAAAGTTAGCCCTGAACTTTCAACTAGCCTGTACTCTAAAGTGGCAATTGATACTACTAAGTCTCATCCGGCAAACCTCTTTATGTTTTTCAATAACGGTTCTACTCCAAATGAAATTGTTTTTGATCTAGCTGAACAGGTTGATACTACTAAGACATCTAAGAATTTTAAAGATCAGTATGATTTTTCTCACTATTTTAGTGGTGCAAAATATCTAGCTTCAAATAAGTATGTTGAGCGTATGTCATATTTTGCTCCTCTCTATCTTAAAGAGGAAGTGCCAGATTATTTTATTGTATTTAAAATAACTGACCCTGCAAACTTTCCATTAAATCAAGTTAAGCAAAAATATATCAATGGTGAAACTAAAACTGACTACTTAATTGACCTGTTTAATAATGCATCAATAATTAAAACATTTGATCTTAGAGCAGAAACCGTTCCAGGTAAGTATTTAAGGAATTATATAAATAACGTAAACTTTCCAAAGAGTCCATTGACTGTTCTATACGAAGAGAACGATTTTACTACATGGAATGGTATTCTACTAGACGAAGGAATATTTGGAAGCAGGGGAGAACTTATACACGATTTATATACTGCAGCTCAACCTTTAAAATTCTTTGAGGAGAATATCACAAATGGCTTTTCTAGAAATGGTGTCATATTTCCAAATATTTTAAACCTAGAATTTGTCTTTAATGATGATACCTCAAATACTTACGATTTCAATAGGTATTTAGGAATGTATGTAAATGCAATCGAACTAACTAAGCTTGACATTGACCTTAATCGAGCATACTTAAATAGGGGTACATGGGAAAATGAACCCCACTTTAGAAAAAACTTTTTAGAGACTGATGAAGTATCGCTTACTCAATCAAATCTAGATGGAGTAATCGTCCCATTTAAAAACTCAAAAGTAAATATCTCAGAGTTTAGACAAACTTTTACTGATTCCGATAACCTTTTCATAAATTACATTAATGATAAAGACGGTCGATTATATATGCCTAAACTATCTAACCCTTTTGAGATAGAGTACTCTAGCAGTCAATCGGCTGCATTATCATTAATTGAGTTTAAGGTAGCTGATTCTATTTCGATAAGTACTCCAGGTACAGGTTACTCTACTCTAAATAATGTTACTACCACTGCCACACTAGGCTCTGGTTCAGGACTAATCGTAAACATAACTGATGATGGCCTTGGAGGAATTGCATCAGTTGTTATAGTTAATGGTGGGACTAACTATGCTCTTGGAGATACAGTCACAGTTAATAGTGGAGCGGGCAATGCTATTTTACAAGTAAATTCAGTATTAAGTGGAACTACTGTTAATGCAAATCTTACCTCTCACGGGTACGAAACAGGAAACCTAATAGTAATCAGTTCAACTGATTCTGAGTATGCTGGAGAGTTCCTGATAACTACCGTTGACTCCGACAATTTTGAGTATACTGTTGCTTCTGTTCCAACTAACGCGACTGCTACTTGTACATCTAAGAAAGAGTTATCTACTGGACAGTTTAGATTTGCTAATAATAAGATCGACCTAGGATTGTTTTTTGGACAGAGTCGAACTAACTTTTTACAAGACTTAGGTGCTTCAACTAAGGTTGCTGGCAAGTCACATGCTGTGATAAAAATAAACTATGCTGGTCGAGTTAGTAACTTTAATCTTTCATCACCTGGAACAGGGTATACAAGTGCAATCGGTGTTGATACTACAAGTAGTGTCGGTACTGGCTTAACATTAGATGTAATAGATGATGGAGCTGGTGGAATTTTATCAGCCACGATAAATCAACCTGGTTCAGGCTATCAGGTAGGTGATGTTATCACAATCGATGGAGGAAATTCTAATGCTACGATAACCGTTTCAGCAGTAATAAATGCTTCTCTAGATAATTATGATGAGATTAAACTATATCATCCAAATGGGACACGACTAGACTCAATCGGTAAATATGACTTGATAATTTCAACTCAATTGTACTCATTGATTCCAAATCCTGGAGAATATTACGTCTATAATGATTATGATAACGTACTTGGCTATGACGAGTTTTACATGAATGGCGGAGGGACAGCTGAACAAATAGCTACAGCGTTGGCCGGTTGTATTAATGGTATTAGAAGTAGAACCTTTACCGCTTATCAATATAATGATCGAGTATTCATTAAAGTAAATTCACCTGGAGATTTTGACAATCTACATAAGATCTCTTTCTTTTCTCCAGTAAACGAGTATTCAGTAATCACAATAAATAGCACAAATACTGGGTCCTCTTTAATAGGATCAGTTTTTTCTTTTATGGGAGGTTCTAAAGAAACGGGCAATCGTCTAATCATTGATGCAGGTCACCTTAGTAAAATTGAAGAAAATTTTGATTCAATCTTAGTAAAGTCATCCGATAGTTGGTCAAAGATTAGAAAGGTTTCCCCATGGGTTGATGAGATCACTGAAACTAATTCAACGACTCCAGCATTAAGATCAGCTACCCTATCTAATTATGATAATAAATTAGCGATTGTCCTGGATGAAAATGAGACGCCTACCGTATCAAATAAAGAGTTTCTAATGAGACCTAAGTTTAGACCATCCTTTGGTCTACTCTCATTCTATCTAATCAAGGATCTTGATTTTGACTTTTATTCAAGTACCTATGCTAATTTTCCAAACATTGATCTATATCAACACTACTATATTCCGGAAAACCTTAACTTGCTTGAGCCTGGAATAGACTATATTGTATATGGTGGAAATATAAAAGTCGATGATGGTACCCCCATCGGTATAATACATTTAGCTGGATCATCATTTACCGCGCCTTTCCTGACTTCATATTCAGCAATAAGCGGATCGCCCTTAGTTACATACGATCCATCTTCAACAAGTGCCGTTATTGCAATCAATGATAACAATAATGAGCTTGATAGTTTTAATGGATTTTCAATCCTAAAAGACCCAAGCAAAATAGTTCCTCAAGACACAAGTAACGAATACCTGCTTAAGACAAAATACTTAAACGGTCTTACCGTTACTGAATACGACTACTATAAAGAAAATGAAAGTCTAGATTTTGCTTTAAGATCTAAGATAATTCCATATATCACTAAGTGGGGAATCAAAAACGGTAAAGACTCTCGAGATAATCCATATCGATTGAATACTGAGCTAATCTTTGGTAGAAATAATTTTTCTCCTGATCATGAAGATAAATCTCAAAATCCAATCAATTTTACACACGAATGGTTCTATATAGAGAGCAAGTTTAATTATGTATATGATGAGAGCACAGCTGCACAAAACACTAATTACTTTGAAACTCCATTAGATGAGACCTCTCTACTTTCTGATCCAGATTATTTTATCAACTATTTTACCTATACTCCAACTTCACTGGTTGGCAAAGAAGTTGCAGATACCCAGTTTAGATACTCATCTCTATATAAGAATTCAGCAAATCAATATGAAGCTTTCTTTAAGGGCTTTAAGTTAACATTTAAAGATGTTACTGATCCTGATGTGATCGGAGCAGACGGGAAACCAGTAGCAAAAACCATTACTACTCGATTTGATGGTTATAAATTTAGTTGCATACTAAAACCTATCTTGGAAGATATTAATGACCATACTAAGCCTCCAATCAAGTATCGAGTGATCGAACATAAAGATTATAAATTCATAGTTGTAATAATTGAGGTTTACATAGGAAGCATCGATGATATTGATGATTATTGGAAAGATTTTGGACTATTTGGAACTAGTCAAGTTAACCCATCTAATTTTACTTCAACTACACCAAGCACATCAGTAGATTATTTTGATAGTATTAATGGAGACTATCGAATCGCATTTGACCAAGTCTCTAATTTAACTCACACACTGCTATACTCTCTAAAAAATAAAAAGTATAACACTCTGTTAAACTCCTTCTCAACTACTAAGATGGGCTCAAAGCTTAATTTTGCATCTACTGGATTTAATGGCTCAGATTATACGATTCGTGCATTAGCTAATGCAAATACACCAAACTATATTGGATCGCTGACTGACGATATCATAAATCCTACAGATTCCACTCTTATTTTCATGAAGGATCTTAGCACTAATTTTGACGTCTTTATGAGTAGTCTTGTTGGATTTGTTCCAGTATTTCCACCGATAAATCCAATAGACTATTCTCTAGAAAAATTTATTCACTATGATGGAGCCAACTATGGAGTAGGGCTTATTTTACCACCAGCTTCGATTTATGGTATCCTTCCTACGAGTACAGTATCATTCATAAATCAAAATTTTGCTTTTAAAGTAATGACTGGCGGAGAGGGATATTTTGAAAGACTATTTGGAAAGATCTCCTTTGCTAAGTTTAAAAGCTATGTCAATTCACTAGATGATATTATTGAATATTCATCGTATTCTCTTGATTCTAATGGAGTTTCTAGCCTAAATACTGATCCTAATTTCTACCTAGAAATTCTAGATACTAGTTATGTTGAAAAACAAAATCAATTAATAACTAACTATACTACGAGTATACCTATCCAGTTTTCTGGCCAAGAAGAAATAGGCACAGACTATGAAGTAGCCAATCTTCCATTAAAATATGAATTAAACAGGTATAAGGGAGAGTATGAGCCAGTCATTAAAAATTATTCAATTTACCAATCTAATTACAAGTTTAAAAAGAATACAATAAACGATCTTTCCTTGAGTAATACTAAAATAAATTCAGAAATTTCTAACTTTTTAACGATTCAACACTTTAATCACATTAAAGTAGCCGACTCTCAAATCCTAGTTCTTGAATCTGATGAGTCTTACTTGCCAATCTATCCTAAGATAAGTGAAGTTGCAATCGGTCAAGGAGAATATTTCTTGCTTCGAGGCAATTGGGATTGGGGATTCCATTACCGATACTCAAATAAAGAACAGTATTCACCTGTTTCTGGAGCATTACGAATAGAGGAAGACGATTCTTTCCTAGCTAAGCTGATTAATTTACCGGAACTAATTGAACTTAATGATTTTAAAATAGAATTTATTGATCCTGCACTAGAATTTAACTCAGTTGACATATCTAAAATAGAAATAGTAGCAAAGGAGACTCCTAATTCAGTGGACGGAATCATAAACGTAAACAATGTACTTACTCGATACTTAATTGAGGATGGAATATCTGCAAAGTTTAACGAATACTTAATAAATTCAAGTGAGTATATTGGAAATTTCACCAGTATCTCTGATCCAGATATAAACGTTTCATCCTATGTTAGAGAATACATAAAACTTAATATTTTAAAGTTGTATGATATTGACATAAACGAATTCTATGCAAAACTAGACACAAGTGTTGTACCGTCCCTTCCTCAAGAGGGAACAAATCCTAATTCAATCGAGTTTGTATTTTTGGATGATAAACAACGCTTTACTAAAGGATATGATATACTAACGTCATTACAAATAAATAAAATAGATAAGTTGATACTCCGATTTAGTTTCTTAAAGAGACCAGGTTCAGGACTATTAGTAAGTCCAAAGATAAAAATTAAATTCATCTAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence