Phage RBP Database

Genbank accession

WVQ00674.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

Protein sequence

MPIQKNLNVAPYYDDFDPNKNFYKVLYKPGHPVQARELTTQQTITADQIEQLASRFLKEGDNIIPGEVTYLAPQSYVRLSSFTQGVSAQDFVGYNLTGVTSGVVAEVVFAVEATEDDDATLYVSYSGSGGDGATSTFLEGEVLESTNPNNLTATVGVNTISKPITSNPLGQGALYKVSEGSFYVDGMMVRNTEQTIVVGKFTHRPTAEVGFLVTEEVVTSSEDASLLDNSQGSSNFAAPGADRLKITLTLVAREQNAVDPNFIRLSTITQGNILSTPSETVKWDWLYEILARRTYDESGDYIVTEFPVTTMEYWNSDGEEKGLYDADAQTGLYPAVPGDADQTGLTYNQANDVYVLNVSPGKAYVKGFEVEYKQPNFMYGDKARSTAFRADALTQFTEGYNLNITNLYGTPDFTNITGEGTSVAFDDIIIYRNFIDGFVGEAEDGNGRPLNIGNAPWKTFHIIADGDIGSNPTGYVEVYKEGNTCVVNASVDLVRGDAIGDATILAATAIEAIPAGVMRPRYLTPDGTVDLGDGFYGYNSTYNMGVMTSVYFTELDVVGINNPTVPWTVGELVRGEDSGALGTVESGSTTTNLLVSNVVGSFLPGEEVIQTQSATVTKVSRILRPGEVSEFVFTNKGAGGSTIDLSSQTAVTLSALGSTKTLTAAAGDIVVSSSGISITETGRSKLTNFPLPTLEQNLGITYELSTVPSAVTGYAVSRGSNLTNTLQLAKSFYSPLADTNDFSADISIQNASDSEITDVANGSGFSAAAGSNTLLCDVFSGDPSQQLIPGDLITFVDDSGNTINRIVQYATKPVGYGTKRSRARIFLTTTVPNTVSSNTVQRIRVRTKGTPTETLLYTLPQQVVATLETNPDATEISYQVKKEFIVNVPSGSSTITLTTGKNNETFIASDSQTTIAIAENISNATDPTNLEGRVLVPSNIDVTQDDGRKVIYTIPNPLAYSVKMKVIAPIFVANAISKRKILRSNQTITVSAADAAKALISLGKADATAVHSITQSGKDISDNYTFDNGQRDNIYDIARVVLKTGRPPATGEVQIVFDYFEHSGEGDFFSVDSYTADDTFNYANIPTYTPTFVVGKKGVFEKNKNQQKIQLRDAIDFRPVVSASTSVIASVTDGTDSQSSTNYRDSSNGGDGFVPRIPIAESLFRCDMEYYLARYDSLFLSSNGSMALVAGEDSIDPEPVPDLANSIRLYDVFLPAYTFTLDDIYIRKFNYKRYQMKDIAVIDRRVERLEEVVTLSLLEQAALNTSVRDAVTGLDRFKNGIVVDSFRDHARGEVGTDQYRCSIDSENDQLRAPYFIDQAELEEKAQTEDARFNANYVIKDGIATLTHENEFYLNQPHATRWINLQPYMVFTYDGELELNPPIDTFADQNRLPTLVIEDNAVFDATSGLANAMNRGGMGTVWGRWNTNGNTRTRTQTTTTINTRTARRERTSYGDRVTDVQLAETMRSIAVEFRGTNLKPETRYYAFFDEIEVSNWISPDTIQTNFDDGLGRYQGAPNRNRGGFGLPIMSDSVGTIQGIFIVPNGRAPVEGSRYNGRMRDLQYRSSGTSRSFNTGTKVLRFTDNPDNPEDLDLVGGICEADFTSSGVISDVQQTVVSTRLPAFATRTRVTDRETLQIPRPVINNITNVTNNVTNVTNVTNRTTVVNNNITRVERPQRTGGGDPVAQSFYISFPDDIPPAEGIFITELDLYFRTKDPVHGVTAYLVPTEAGQRPTDQIIPHGSVTKKPNTTLRVVCTSLDGNTTQLATGTEVRGSTSGAVGTLRSSTTFRSPSNNATENVNNFVYTLIIDQYDGDFVAGEELIPLVTPRLADKFFVASDEVEVTRVDLQTFGENYTEATVTFSEPELPGGTAASASVTIADGKIYQIQLEDPGSGYTKTPTISITGDGTGATAGVRSKDSIPAVEMGITTSDDATLKTTFKFPAPVFLKADTYYAFVAYAPASLNYTIWTAKLGENLVGTETRMTTQPLLGSMFKSQNQGLWTEDQTQDVKFDLRRAKFDTSRPGVVTLQNAPLGLRGLEIDPIETNTLGSNDDSDVFGDNPKIVRIYHHMHGLAVGDLVAIDGVVNNPGGIPNEEFNTLHTVLAADFETFTIKTTTAATESVKDGGHLVACSYNRPYEVINTYTGAMVMTGTSLDAYTRSVQAAGITNYNVANAYRKNSYGATKLSESFYYGDAQQVAGYLNEVNNTLKLGGERSLEEAIVLSSSTDYLSPVIDVTRTNANLIRNLIDNPSVDGDIYGVTSRTVTFSGDVSPTTLTVGDLAEFTQGALTSNLTVREIDTSANKITFTGQYVGSLTTSSTFSDATLSGLTIVKVSTGTSGSFYPETTNAGSTWAKWVSKLFVFENPCDGLELKLSAIFYDTSSIKVYYRPRNIGFDGELANVNWIPFNGTGLPNQVEKIEPRSSEDVNPTLIPDEDYQSLTFNIQDVPKFDGVAIKIVMTANNPAQAPLIDDLQLITTE

Physico‐chemical properties

protein length:	2477 AA
molecular weight:	269052,44670 Da
isoelectric point:	4,60159
aromaticity:	0,08801
hydropathy:	-0,26605

Domain architecture

WVQ00674.1

1 2477 aa

STR 175–312 · STR 1140–1389 · STR 2057–2133 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR032096
STR

IPR032096 IPR032096 IPR023366

WVQ00674.1

12477 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0414
STR

DC_0414 DC_0082

DC_0082
RBD

DC_0082

WVQ00674.1

12477 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR032096	STR	DC_0487	175	312	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
IPR032096	STR	DC_0487	1140	1389	InterPro cluster	Domain of unknown function DUF4815	Central	Low	Positional only	116 proteins / 218 hits
IPR023366	STR	IPR023366	2057	2133	Merged direct domain	ATP synthase subunit alpha, N-terminal domain-like superfamily	Central	Low	Positional only	44 proteins / 44 hits

Proteins with similar domain architecture

Phage

Synechococcus phage MC09 [NCBI] · taxon 3117466

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host

Synechococcus sp. MW02 [NCBI] · taxon 1620844

Cyanobacteriota Cyanophyceae Synechococcales Synechococcaceae Synechococcus

Genbank protein accession

WVQ00674.1 [NCBI]

Genbank nucleotide accession

PP110486.1 [NCBI]

CDS location

range 26473 -> 33906
strand +

CDS

ATGCCAATCCAGAAGAACTTGAACGTCGCTCCTTACTATGACGACTTCGACCCAAACAAGAACTTTTACAAAGTTCTTTATAAGCCAGGTCACCCAGTCCAAGCAAGGGAACTGACGACGCAGCAGACTATCACTGCTGACCAAATTGAGCAGCTTGCTTCTCGCTTCCTGAAAGAAGGTGATAATATCATTCCTGGTGAGGTTACCTACCTCGCACCGCAGTCTTACGTCCGTCTGTCCTCCTTTACCCAAGGCGTAAGTGCTCAAGACTTTGTCGGTTACAACCTGACCGGCGTTACTTCTGGTGTCGTTGCTGAAGTCGTCTTTGCTGTTGAAGCAACCGAAGACGACGACGCTACTTTGTATGTGTCCTACAGTGGTTCCGGTGGCGACGGTGCTACTTCCACCTTCCTGGAAGGTGAAGTTCTGGAGTCCACCAACCCCAACAACCTGACCGCTACTGTTGGTGTCAACACCATCAGTAAGCCCATCACCTCCAACCCTTTGGGTCAAGGTGCCCTCTACAAGGTTTCTGAGGGTTCCTTCTATGTTGACGGCATGATGGTCCGCAACACAGAGCAGACTATCGTTGTTGGTAAGTTCACCCACCGCCCTACCGCCGAGGTTGGTTTCCTTGTAACCGAGGAAGTCGTTACTTCTTCCGAAGACGCTTCACTTCTGGACAACTCCCAGGGTTCCAGCAACTTCGCTGCTCCCGGTGCTGACCGTCTGAAGATCACACTGACCCTGGTCGCCCGTGAGCAAAACGCTGTTGACCCTAACTTCATTCGTCTGAGCACGATTACTCAGGGCAACATCCTCTCCACCCCCTCCGAGACTGTCAAGTGGGACTGGCTCTATGAAATTCTTGCTCGTCGTACCTATGACGAGTCCGGTGACTACATCGTCACCGAGTTCCCTGTAACTACTATGGAGTACTGGAACTCCGACGGAGAAGAGAAAGGTCTCTATGACGCCGACGCACAAACTGGCCTCTACCCTGCTGTTCCTGGTGACGCAGACCAGACGGGTCTAACCTACAACCAAGCGAACGACGTTTATGTACTGAACGTATCCCCCGGTAAGGCATATGTAAAAGGTTTCGAAGTTGAGTATAAGCAACCCAACTTTATGTACGGCGACAAGGCAAGGAGTACCGCCTTCCGTGCTGACGCTCTTACCCAGTTCACCGAGGGTTACAACCTCAACATCACCAACCTGTACGGCACCCCCGACTTCACCAACATCACCGGTGAAGGTACTTCGGTTGCGTTCGATGACATCATTATCTACCGTAACTTTATTGACGGTTTCGTAGGTGAAGCGGAAGACGGCAACGGTCGTCCCCTGAACATCGGTAACGCTCCCTGGAAAACTTTCCACATTATTGCTGACGGAGATATCGGTTCCAACCCAACCGGTTATGTTGAGGTCTATAAGGAAGGTAACACCTGTGTTGTTAATGCTTCTGTTGACCTGGTCCGTGGTGATGCCATCGGTGACGCAACTATTCTCGCAGCCACCGCTATTGAAGCGATCCCTGCTGGTGTTATGCGCCCTCGCTACCTGACCCCCGACGGTACTGTTGATCTGGGTGACGGTTTCTACGGTTATAACTCCACCTATAACATGGGTGTTATGACCTCGGTCTATTTCACTGAACTGGACGTTGTTGGCATCAACAACCCAACCGTTCCTTGGACTGTCGGTGAGTTGGTTCGTGGTGAAGACTCCGGTGCTCTTGGTACTGTTGAGTCTGGCTCTACCACCACCAACCTGCTCGTATCCAACGTTGTCGGTTCTTTCCTCCCCGGTGAGGAAGTTATCCAAACCCAGTCTGCAACAGTAACCAAGGTTTCGCGCATCCTCCGTCCCGGTGAGGTTTCTGAATTCGTATTCACCAACAAGGGTGCTGGTGGATCCACCATTGACCTTTCTTCCCAGACTGCTGTAACCCTATCTGCCCTGGGTTCCACTAAGACCCTGACTGCCGCCGCCGGTGACATCGTCGTTTCTTCTAGCGGAATTAGCATTACCGAGACCGGTCGCTCTAAACTGACCAACTTCCCTCTGCCTACTCTTGAGCAGAACCTGGGTATTACCTACGAACTCAGCACCGTTCCTTCTGCTGTTACCGGTTATGCCGTATCCCGTGGATCTAACCTGACCAACACTCTGCAGCTCGCTAAGTCTTTCTACTCACCTCTGGCCGATACGAACGACTTCTCTGCTGACATCTCTATCCAGAATGCCTCTGACTCTGAGATTACCGACGTCGCTAACGGTTCCGGTTTCAGTGCCGCCGCTGGCAGCAACACCCTTCTGTGCGACGTGTTCTCTGGCGACCCCAGCCAGCAGCTAATCCCAGGTGACCTGATCACCTTCGTCGATGACAGCGGCAACACTATCAACCGTATTGTTCAGTACGCCACCAAGCCCGTTGGTTATGGTACTAAGCGTAGCCGTGCTCGTATCTTCCTGACCACCACTGTTCCTAACACGGTCAGCAGCAACACCGTTCAACGTATCCGCGTTCGCACCAAGGGCACCCCTACCGAGACCCTCCTGTATACTCTCCCCCAACAGGTTGTTGCTACTCTGGAAACCAACCCTGACGCCACTGAGATCAGCTACCAGGTTAAGAAGGAGTTCATCGTTAACGTCCCTTCAGGTTCTTCCACCATCACCCTGACGACAGGTAAGAACAACGAGACCTTTATTGCTAGCGACAGCCAGACCACTATTGCTATTGCCGAGAACATCTCTAACGCAACTGACCCCACCAACTTGGAAGGTCGTGTTCTGGTTCCTAGTAACATCGACGTAACTCAGGACGACGGTCGTAAGGTTATCTACACAATTCCTAACCCCCTGGCCTATTCGGTCAAGATGAAGGTTATTGCACCTATCTTCGTCGCTAACGCTATCTCCAAGCGTAAGATCCTCCGTTCCAACCAGACTATCACTGTTTCTGCTGCTGACGCAGCTAAGGCTCTGATCTCCCTGGGTAAGGCTGACGCCACTGCCGTTCACTCTATCACCCAGAGCGGTAAGGACATTAGCGACAACTATACCTTTGATAATGGTCAGCGCGATAACATCTATGATATTGCTCGTGTTGTTCTGAAGACCGGTCGTCCTCCTGCTACCGGCGAAGTCCAAATCGTCTTTGACTACTTTGAGCACTCCGGTGAAGGTGACTTCTTCTCTGTTGACTCCTACACCGCTGACGACACCTTCAACTACGCCAACATCCCCACCTACACTCCTACTTTCGTTGTAGGTAAGAAGGGCGTCTTTGAGAAGAACAAGAATCAGCAGAAGATCCAACTGCGCGACGCTATTGACTTCCGTCCTGTTGTAAGTGCCAGCACTTCTGTTATTGCCTCCGTAACTGACGGAACTGACTCCCAGAGCTCCACCAACTATCGCGACAGCTCCAACGGTGGTGACGGCTTCGTTCCCCGTATTCCTATCGCCGAGAGTCTGTTCCGCTGCGACATGGAGTATTACCTCGCCCGTTACGACTCACTGTTCCTGAGCTCCAACGGCTCCATGGCTCTTGTTGCAGGTGAAGACTCTATCGATCCAGAACCCGTACCCGACCTGGCGAACTCTATCCGTCTGTATGACGTCTTCCTGCCCGCTTACACCTTCACGCTGGACGACATCTACATCCGTAAGTTCAACTACAAGCGCTACCAGATGAAGGACATCGCGGTTATTGACCGCCGTGTTGAGCGTCTGGAAGAAGTTGTAACCCTGTCTCTGCTGGAGCAGGCAGCACTCAATACTTCTGTTCGTGACGCTGTAACTGGACTCGATCGCTTCAAGAACGGTATCGTTGTTGATTCCTTCCGCGACCATGCGCGTGGTGAGGTCGGAACCGACCAGTATCGTTGTTCCATTGACTCTGAGAACGACCAACTCCGTGCTCCTTACTTCATCGACCAGGCTGAACTGGAAGAGAAGGCACAGACCGAAGACGCCCGCTTCAACGCCAACTATGTCATTAAGGACGGTATCGCTACTCTGACTCACGAGAATGAGTTCTACCTGAACCAGCCTCACGCTACCCGTTGGATCAACCTCCAGCCTTACATGGTCTTCACCTATGACGGTGAGTTGGAACTGAATCCTCCTATTGATACTTTTGCCGACCAGAACCGTCTACCCACTCTGGTTATTGAAGACAACGCTGTATTTGACGCAACTAGTGGTCTAGCCAATGCTATGAACCGTGGCGGTATGGGAACAGTATGGGGCCGCTGGAACACCAACGGTAATACCCGTACCCGTACCCAGACCACTACCACAATCAACACCAGGACTGCTCGTCGCGAGCGCACCTCTTACGGTGACCGCGTAACCGACGTCCAGTTGGCTGAAACTATGCGTTCTATCGCGGTCGAGTTCCGCGGCACGAACCTGAAGCCCGAGACCCGTTACTACGCTTTCTTTGACGAGATTGAGGTTTCTAACTGGATCTCCCCCGACACCATCCAGACCAACTTCGACGACGGTCTCGGACGCTACCAGGGTGCCCCTAACCGTAACCGTGGCGGATTCGGTCTGCCTATTATGAGTGATAGTGTTGGTACTATTCAGGGTATCTTCATTGTCCCTAACGGCCGAGCTCCTGTTGAGGGTTCTAGGTACAACGGAAGGATGCGTGACCTCCAGTATCGTTCCTCCGGCACTTCCCGCTCGTTCAACACCGGAACCAAGGTTCTGCGTTTCACCGACAACCCCGACAACCCAGAAGATCTGGATCTGGTTGGTGGCATCTGTGAGGCGGACTTCACTTCCTCTGGTGTTATCTCCGACGTTCAGCAGACTGTCGTTTCTACTCGTCTCCCCGCTTTCGCTACTCGCACCCGAGTAACTGACCGCGAGACTCTGCAGATCCCACGTCCCGTTATCAACAACATCACGAACGTTACCAATAACGTAACGAACGTAACGAACGTAACGAACCGCACCACGGTTGTTAATAACAACATCACCCGTGTAGAGAGACCCCAACGAACTGGTGGTGGCGACCCTGTTGCACAGTCGTTCTACATCTCCTTCCCAGACGACATTCCACCCGCAGAAGGTATCTTCATCACAGAACTGGATCTTTACTTCCGAACGAAGGATCCCGTCCATGGCGTCACTGCCTATCTGGTTCCCACCGAAGCAGGTCAGCGACCTACCGACCAGATCATCCCCCACGGTTCTGTAACCAAGAAACCAAACACCACTCTACGTGTTGTTTGTACCAGCCTTGACGGAAACACCACCCAGCTCGCTACCGGCACTGAGGTTCGTGGTTCTACTTCCGGTGCTGTCGGTACGCTAAGGTCTTCTACGACTTTCCGCTCACCTTCAAACAACGCCACCGAGAACGTCAACAACTTTGTCTACACTCTGATTATCGATCAGTATGACGGTGACTTCGTTGCTGGTGAGGAACTGATTCCTCTCGTAACTCCTCGCCTGGCGGACAAGTTCTTCGTTGCCTCCGACGAAGTTGAAGTAACCCGAGTAGATCTTCAGACCTTCGGTGAGAACTACACGGAAGCAACCGTTACTTTCTCCGAACCCGAACTGCCCGGTGGTACTGCTGCTTCCGCTAGCGTAACTATCGCTGACGGTAAGATCTACCAGATCCAACTTGAGGACCCAGGTTCAGGTTACACCAAGACCCCAACCATCTCTATCACTGGTGACGGCACGGGCGCAACCGCAGGCGTAAGGTCCAAGGATTCTATCCCCGCCGTTGAGATGGGTATTACCACCTCCGACGACGCAACTCTGAAGACCACCTTCAAGTTCCCCGCTCCTGTATTCCTAAAAGCAGACACTTACTACGCTTTCGTTGCTTACGCTCCCGCTTCGCTGAACTACACGATCTGGACCGCTAAACTGGGTGAGAACCTGGTTGGCACTGAGACCAGGATGACTACCCAGCCACTCCTCGGTTCTATGTTCAAGTCGCAGAACCAGGGTCTCTGGACCGAAGACCAGACGCAAGACGTTAAGTTTGACCTCCGCAGGGCCAAGTTTGACACCTCCCGTCCTGGTGTTGTTACTCTCCAAAACGCACCTCTTGGTCTCAGGGGTCTGGAGATCGATCCTATTGAAACCAATACCCTCGGCTCTAACGACGACAGCGACGTCTTCGGCGACAACCCCAAGATCGTCCGTATCTACCACCACATGCACGGTCTGGCGGTCGGTGACCTGGTTGCTATCGACGGTGTTGTCAACAACCCAGGTGGAATTCCCAACGAAGAGTTCAACACACTTCACACCGTTCTGGCTGCTGACTTCGAGACCTTCACTATCAAGACGACGACGGCTGCGACCGAAAGCGTCAAAGACGGTGGTCACCTGGTCGCTTGTTCCTACAACCGCCCCTACGAAGTTATCAACACTTACACGGGAGCGATGGTTATGACCGGAACTTCACTGGACGCCTACACCCGAAGCGTCCAGGCTGCTGGTATTACCAACTACAACGTCGCTAACGCCTACCGCAAGAACAGCTACGGTGCCACTAAACTCAGTGAGTCCTTCTACTACGGTGACGCACAGCAAGTCGCTGGTTACCTGAACGAGGTCAATAACACCCTCAAGCTCGGCGGAGAAAGGTCACTGGAAGAGGCTATTGTTCTCAGTTCCTCTACCGACTACCTCTCACCTGTCATCGACGTAACGCGAACCAACGCTAACCTGATCCGTAACCTGATCGACAACCCCTCTGTTGACGGTGACATCTACGGCGTAACCAGCAGGACCGTTACTTTCTCCGGTGACGTTTCTCCAACTACCTTGACTGTCGGCGACCTGGCTGAGTTCACACAAGGCGCTCTGACCTCCAACCTGACGGTTCGTGAGATCGACACCAGTGCGAACAAGATCACCTTCACCGGCCAATACGTCGGAAGTCTCACCACAAGCTCCACCTTCTCGGACGCAACGCTGAGCGGTCTGACTATCGTCAAGGTCAGCACCGGAACCTCTGGAAGCTTCTACCCAGAGACCACCAACGCAGGCTCAACCTGGGCGAAGTGGGTATCCAAACTGTTTGTCTTCGAGAACCCTTGTGACGGTCTGGAACTGAAACTGTCGGCTATCTTCTACGACACCTCAAGTATCAAGGTTTACTACCGACCCAGGAACATCGGCTTCGACGGCGAACTGGCAAACGTCAACTGGATCCCCTTCAACGGAACCGGACTTCCCAACCAAGTCGAGAAGATCGAACCTCGTTCCTCGGAAGACGTCAACCCAACGCTTATCCCCGACGAAGACTATCAGTCACTGACCTTCAATATTCAGGACGTGCCCAAGTTCGACGGAGTAGCTATCAAGATCGTCATGACGGCGAACAACCCAGCACAAGCTCCACTAATCGACGACCTACAACTTATCACCACCGAGTGA

Protein

Domains

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)