Phage RBP Database

Genbank accession

CAB5220126.1 [GenBank]

Protein name

Domain of unknown function DUF1983

RBP type

TF

Evidence RBPdetect

Probability 0,84

TF

Evidence RBPdetect2

Probability 0,96

TF

Evidence Phold

Probability 1,00

Protein sequence

MRNDIPNDNASNFGARVRETLMTYLGKQGDPLDRGVTLRDLVDSGFASLSNLRFGGGSAPLVAGTAITESYVSDLTPPPIPTGFTANAAISNIVIECDDPNYTQGHGHLRSHVYGATRTGNAAQPVFADAVEITQFAGAVTSYSTNPATEWHLWIKWESVDGVLSVSPAGGTNGVVVTTGQDVSKLLSALTGKLKSEQLYADLGARINLIDASATTVNSVAWQVAQEAAARATAITNETNARTAAISAEATSRANALTNEASARAQAILDEAAARATADSSLQTQINTLSAASSGDLGTLIAAVQEEQTARANADTAEATARSTLATQLRGAYEGSDPSVLSTGIIYNERQTRITAEGAISSTVSALTSTVNNNYTTLNSAIVSEQTTRANADTALTTSFNSLSATVGTKTRTFSQATAPTATATGDIWFDTSDGNKAHRWNGTAWAATDDTRIANSAAAITAEQTARATADTALATSITQLTSTVTTNKDSMDASVTTLNSAITSEASTRASADTTLTNSINTLTSTVTNNYTTLNAAITNEASTRASADTAAASTVTALTSTVNTKNRTFNQSTTPTATATGDLWFDTGNGNKAYRWDGTTWVATDDTRIAANTAAITSEANTRATADTALSNTISTLSATVTGNYNTLNAAITSEATTRANADSAVSSTLSTVSATASSKNRTFYEAAAPTASAVGDLWFKTSDNNKAFRWDGTNWVATDDARIAANAAAIVTEQTARADAVSALANTVSTLGTTVTNNNNTLTAAIASEATARSGADSSLATSISTLTSTVNNNNANLTSAIQTEATTRADAVTTLSNSITTLQSTVNGNTAAISTESATRASVDGGLLAQYTVKTDLNGYVSGFGLASTLNNGTPSSTFAIRADAFYIASPTGPGVTPTMPFIVRTSPTVINGETIPAGVYITDGYIQNGTITNAKIANATIDDAKVASLSVAKLTAGSVKVGEYIQSSNFVSGTSGWYISGSGAAEFGSASIRGQLVASQIDSRGLTIKAADGTVILSAGASLAASAYSGNVTGTINGTAAATVVDTANSASTTASAAATAASTAQTTANTAVTNASAAAAAAAAAQTAADAKLAKAGAQVLTGPVSLNAASAITVGTPALDSVVGHNGFYIGSTGIVGTKDGAATFSLDNSGNAIFKGNLTGASGTFSGSLQVGSAPAISGDTMTGAGAKINTDGTFALGNSTTNISYNGTQMSLNGNVVATANINNNAVTNTVSAFTAGFISDTSGTELTAQSAGITSTGKSIFISFTSQANGAVVSTGEGTQDVFSPAFRVYRGSTLVYGPVFSGAFSFTDTPAAGTYVYSVKFTRAFSDAIFAGSNTAVACSNRSLILLETKK

Physico‐chemical properties

protein length:	1363 AA
molecular weight:	137975,08950 Da
isoelectric point:	4,83151
aromaticity:	0,05723
hydropathy:	-0,04145

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR053171	613	1006	InterPro	Viral Tip Attachment Protein
IPR015406	837	1005	InterPro	Tip attachment protein J, central straight fiber domain

	Name	Taxonomy ID	Lineage
Phage	uncultured Caudovirales phage [NCBI]	2100421	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAB5220126.1 [NCBI]

Genbank nucleotide accession

LR798281 [NCBI]

CDS location

range 35492 -> 39583
strand +

CDS

ATGAGAAACGACATTCCAAACGACAACGCCAGTAACTTTGGCGCTCGTGTCCGCGAAACCCTGATGACCTATTTGGGCAAGCAGGGCGACCCGCTTGACCGTGGTGTAACGCTGCGCGACTTGGTTGACTCCGGCTTTGCCTCGCTGAGCAATCTGCGGTTTGGCGGCGGCTCGGCTCCGCTCGTTGCAGGTACTGCGATCACAGAGTCCTATGTTTCCGACTTGACCCCGCCTCCAATACCGACCGGCTTCACGGCGAATGCTGCGATCTCCAACATCGTCATCGAGTGCGATGACCCCAACTACACGCAAGGGCACGGGCATCTCAGGTCTCATGTCTATGGCGCAACCCGCACGGGCAACGCTGCTCAGCCTGTCTTTGCAGACGCAGTTGAGATCACACAGTTTGCTGGCGCAGTTACTTCATACTCGACCAATCCGGCGACTGAATGGCATCTGTGGATTAAGTGGGAGTCAGTTGACGGCGTGCTGAGTGTGTCCCCAGCTGGCGGAACCAACGGAGTAGTCGTAACTACGGGGCAAGATGTCTCTAAGCTGCTGAGTGCTTTGACCGGCAAACTCAAGTCCGAGCAACTGTACGCCGATCTTGGCGCACGAATCAACTTGATTGACGCCTCAGCCACCACAGTAAACAGCGTGGCATGGCAAGTCGCGCAGGAAGCCGCTGCTCGGGCCACGGCCATCACGAACGAAACGAACGCCCGCACAGCTGCCATCTCCGCTGAAGCTACCTCTCGGGCCAACGCGCTTACAAACGAAGCCAGCGCACGCGCACAAGCAATCCTAGATGAAGCCGCCGCTCGGGCCACAGCAGACAGCAGTCTGCAAACTCAGATCAACACGCTGAGCGCCGCATCCTCCGGTGACTTGGGAACCCTGATCGCAGCAGTGCAGGAAGAGCAGACCGCTCGGGCCAACGCAGACACCGCAGAAGCCACGGCACGCTCCACGCTGGCCACGCAGTTACGCGGGGCTTACGAAGGTTCAGACCCATCGGTGTTGTCTACCGGCATCATCTACAACGAACGCCAGACTCGCATCACGGCTGAGGGCGCTATCTCGTCAACTGTGAGCGCCTTGACCTCGACGGTCAACAACAACTACACCACGCTGAACTCGGCCATTGTCTCTGAGCAAACCACTCGGGCCAACGCTGACACTGCGCTGACCACCAGCTTTAACAGTTTGAGCGCCACAGTCGGCACAAAGACTCGTACATTCAGCCAAGCCACAGCCCCCACGGCAACAGCCACTGGCGACATCTGGTTTGACACCAGCGATGGGAACAAAGCCCACCGTTGGAACGGAACTGCATGGGCAGCTACCGATGACACCCGGATTGCCAACTCCGCCGCTGCGATCACTGCTGAACAGACTGCGCGAGCTACTGCAGATACAGCACTGGCCACGTCCATAACCCAGCTTACTTCGACGGTCACAACCAACAAGGATTCGATGGACGCCAGCGTAACCACGCTGAACTCTGCCATTACAAGCGAGGCCTCCACCCGGGCCAGCGCAGACACGACCCTGACCAACTCAATCAACACGCTGACGTCGACAGTTACAAACAACTACACCACACTCAACGCAGCGATCACAAACGAGGCTTCTACTCGGGCCAGCGCAGACACTGCGGCTGCTTCTACGGTGACGGCCCTGACTTCTACAGTCAACACCAAGAACCGTACGTTTAATCAAAGCACAACCCCCACAGCTACGGCTACTGGTGATCTTTGGTTCGATACCGGCAACGGCAATAAAGCCTACCGCTGGGATGGCACTACGTGGGTCGCTACGGATGACACCCGCATCGCTGCCAATACTGCGGCGATTACTTCTGAAGCCAACACACGGGCTACTGCGGACACTGCGTTGTCCAACACCATCAGCACACTGTCCGCGACAGTCACTGGCAACTACAACACACTGAACGCTGCCATCACAAGCGAGGCCACAACACGCGCCAACGCAGACAGCGCCGTAAGCAGCACACTGAGCACAGTGTCGGCGACAGCCAGCTCAAAGAATCGTACGTTTTACGAAGCCGCAGCACCTACTGCCAGCGCCGTCGGTGACCTCTGGTTCAAGACCAGCGACAACAACAAAGCCTTTCGTTGGGACGGTACTAACTGGGTTGCTACTGATGACGCACGCATTGCTGCCAACGCAGCTGCAATTGTTACTGAGCAAACAGCCCGTGCCGACGCGGTTTCTGCTTTGGCCAACACGGTCAGTACTCTGGGCACAACGGTAACGAATAACAACAACACACTGACTGCGGCGATTGCCAGTGAGGCTACTGCTCGCTCCGGCGCTGACTCCAGTCTGGCTACCTCTATTAGCACGTTGACGTCGACCGTCAACAACAATAACGCCAACCTGACATCAGCCATTCAGACTGAGGCAACTACCCGAGCTGACGCAGTCACCACGCTGTCTAACTCCATAACCACACTGCAAAGCACGGTCAATGGCAACACGGCTGCAATCAGCACCGAGTCAGCCACACGGGCTTCTGTCGATGGCGGGCTTTTGGCACAGTACACAGTCAAGACTGACCTGAACGGTTATGTGTCTGGTTTCGGGCTGGCCTCCACGCTGAATAATGGAACGCCAAGTTCCACGTTTGCTATCCGTGCAGACGCGTTCTACATTGCAAGTCCAACTGGCCCGGGGGTTACCCCCACCATGCCGTTCATAGTGCGTACATCGCCGACAGTAATTAACGGCGAAACGATCCCTGCGGGCGTGTACATCACCGATGGCTACATCCAAAACGGCACAATCACAAACGCCAAAATTGCCAACGCCACCATTGATGATGCAAAAGTTGCTTCCCTATCTGTTGCCAAATTAACAGCCGGGTCCGTAAAGGTTGGGGAGTACATCCAGTCTTCAAACTTTGTCTCTGGCACGTCTGGGTGGTATATCAGCGGGAGCGGTGCGGCTGAGTTTGGGTCTGCGTCTATTCGTGGGCAGTTGGTCGCATCGCAAATTGACTCTCGTGGTCTTACCATCAAGGCTGCTGACGGCACAGTTATCCTGTCTGCAGGGGCAAGCCTTGCAGCAAGCGCTTACTCAGGTAATGTCACTGGCACAATCAACGGCACGGCGGCTGCCACGGTTGTAGATACTGCAAATAGCGCCAGCACAACGGCCTCTGCAGCAGCTACTGCGGCGTCTACTGCCCAAACTACGGCGAACACTGCGGTAACAAACGCCTCTGCTGCTGCTGCTGCCGCTGCCGCAGCTCAAACTGCTGCTGATGCAAAACTTGCAAAAGCGGGTGCCCAAGTTCTGACCGGCCCGGTGTCCCTTAACGCAGCATCAGCAATTACTGTGGGAACTCCTGCGTTAGACAGCGTGGTGGGACACAACGGCTTCTATATCGGTAGCACGGGTATTGTTGGAACTAAAGATGGCGCGGCTACATTTTCGTTGGATAACTCGGGCAACGCCATATTCAAAGGTAATTTAACTGGCGCGTCTGGCACGTTTAGTGGCTCTTTACAGGTAGGTTCTGCCCCTGCAATATCTGGTGATACTATGACAGGCGCAGGCGCCAAAATTAATACTGATGGTACTTTTGCTTTAGGCAATTCTACTACAAATATTTCGTATAACGGCACTCAGATGTCGCTTAATGGTAATGTAGTTGCTACTGCTAATATTAATAATAATGCAGTTACTAATACTGTTTCTGCATTTACTGCAGGATTTATTTCTGATACAAGTGGAACAGAGTTAACAGCACAATCTGCAGGTATTACCTCAACAGGTAAAAGCATATTTATTAGTTTTACTTCGCAAGCAAATGGAGCAGTTGTTAGTACGGGAGAAGGTACCCAAGACGTATTTTCACCTGCCTTTAGAGTTTATAGAGGCTCAACACTAGTGTATGGACCGGTTTTTTCTGGTGCCTTTTCATTTACTGATACACCTGCTGCTGGAACTTACGTTTACTCAGTAAAGTTTACAAGAGCTTTTTCTGATGCAATATTTGCAGGATCAAATACAGCAGTTGCTTGTTCTAACCGTTCTTTAATTTTACTGGAAACAAAAAAATGA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence