Phage RBP Database

UniProt accession

A0A6J5S8X0_9CAUD [UniProt]

Protein name

Collagen triple helix repeat

RBP type

TF

evidence: RBPdetect

probability: 0,9362

TF

evidence: RBPdetect2

probability: 0,9575

Protein sequence

MADQSISQLPVTTTPLSGDELAVVVQNGITKQTSLQNIANLGGPTGPQGPVGPQGPQGVAATIQVQSTTTTAPGTDADVINIGSTTDAFLEFFIPRGDTGATGATGATGATGATGAGVPTGGTIGEFLQKTGSGDYQTGWSSVPPTGITTVSGTSAQITVVNGSTSPVISIADNPVIPGTAAMRLPRGTTPQRAGVAGSNGLIRYNTDTLVFEGYSNGAWTAFSLGGGVTSITAGTGLNGGTITSTGTIDIANTGVVAATYGSATQVPVFAVNAQGQLTSVTNTTITAGGLGALTAVNGTANEITSSQVGTVVTLNLPTALTFTGKTVTGGTFNMDAATVSSDTVTTNTASQTLTNKTISGANNTLSNIANSSLTNSSVTYNGQTVALGGSGTITANTTNALTIGTGLSGTSFNGSAAVTIAIDSTVATLTGIQTLTNKTINGPDNTLTNIANSSLTNSSITLGTTNIALGGTSLTPAGLTSVTVTQDPVSDLQLATKQYVDNIAQGLNVKASCVYGTTADITLSGLSTQAGGDWASSLTAGNRILVKNQTLSQFNGIYVAAAGAWARSADMNVWAEVPSSFVFIQTGTTLADTGWVTTANDGGTIDVTPMPWVQFSGAGTYTAGTGLTLAGTQFSITNTAVTAGAYGSASQVGTFTVNAQGQLTLAGNSTISIPASAINTTIPNSGLTNSSVTIGSSSLSLGGTLSTLAGVSISGSANTLSNIGNSSLTNSSITINGSSVSLGGSVTVTATATNALTIGTGLNGTSYNGSAAVTIDLANTAVTPGAYTNANITVDAQGRITLAANGSPGGVTSFQTSLSGLTPSTATTGAVTLAGTLGATSGGTSQSTYTTGDMLYASASNTLSKLTVGTTGQILTVAGGVPTWAAAPATGVTSFSAGTTGFTPNTATTGAVTLAGTLATTNGGTGLTSFTSGGAVYATSTSALTTGTLPIASGGTNGTSAPTAGAVPYGTGTAYAFTAAGTAGQVLTSNAAGAPTWTTPAGGVTLSNDTTTATNLYPTFAAATSGSVSTIYTGNTKLLYKPSTGELQAPATIASNGLVINSTTVGTSYTVAAGQNAMSVGPMTVSGGVVVTITSGQRWVVL

Physico‐chemical properties

protein length:	1103 AA
molecular weight:	107380,99070 Da
isoelectric point:	4,29813
aromaticity:	0,04805
hydropathy:	0,18976

Domains [InterPro]

No domain annotations available.

	Name	Taxonomy ID	Lineage
Phage	uncultured Caudovirales phage [NCBI]	2100421	Uroviricota > Caudoviricetes > environmental samples >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAB4195488.1 [NCBI]

Genbank nucleotide accession

LR797247 [NCBI]

CDS location

range 16603 -> 19914
strand -

CDS

ATGGCCGATCAAAGTATATCGCAGTTACCAGTCACAACAACTCCCCTATCTGGTGATGAGTTAGCTGTAGTTGTACAAAACGGCATAACTAAACAAACTAGTTTGCAAAATATTGCAAACTTAGGCGGTCCTACTGGCCCACAAGGTCCAGTTGGTCCTCAGGGTCCGCAAGGTGTTGCTGCAACAATTCAGGTACAGTCTACTACCACGACAGCACCCGGGACTGACGCTGATGTTATTAACATTGGCTCAACCACCGACGCATTTTTAGAATTCTTTATCCCTCGCGGTGACACCGGTGCAACCGGTGCTACAGGCGCAACTGGCGCTACAGGTGCTACAGGCGCAGGCGTCCCAACTGGCGGAACCATTGGCGAGTTCTTGCAAAAGACCGGCAGCGGTGACTATCAAACAGGTTGGTCAAGCGTACCACCAACAGGCATTACCACGGTTAGTGGAACAAGCGCGCAAATTACAGTAGTAAATGGCTCAACATCGCCAGTTATCAGCATTGCAGACAATCCCGTTATCCCCGGCACTGCAGCAATGCGTTTGCCCCGCGGCACAACACCGCAACGCGCTGGCGTTGCTGGCTCTAATGGCTTAATCCGGTACAACACAGATACTTTAGTATTTGAAGGTTATTCTAACGGCGCTTGGACAGCGTTTAGCTTAGGCGGCGGTGTAACATCTATCACCGCTGGTACTGGCCTTAACGGCGGAACAATTACCTCAACAGGCACTATTGATATTGCCAACACAGGCGTAGTTGCAGCAACTTATGGTTCGGCAACGCAGGTTCCAGTGTTTGCAGTTAATGCTCAGGGCCAACTTACTTCTGTAACAAACACAACAATTACCGCTGGTGGCTTGGGCGCGCTTACCGCTGTTAATGGTACTGCAAACGAAATTACTTCTAGCCAAGTTGGTACTGTAGTTACGTTAAATCTACCAACAGCTTTAACATTTACAGGTAAAACTGTAACTGGCGGCACGTTTAACATGGACGCTGCTACTGTTAGCAGCGATACTGTTACTACCAACACAGCATCTCAGACACTCACTAACAAAACAATTAGTGGTGCAAATAACACTCTAAGCAATATTGCTAACAGTTCGCTGACTAACAGTTCTGTTACTTATAACGGTCAAACTGTTGCGTTGGGCGGTAGCGGAACAATCACTGCAAATACAACTAACGCGCTAACAATTGGAACTGGTTTATCTGGAACTAGCTTTAACGGCTCTGCTGCTGTTACCATTGCTATTGATTCTACAGTTGCTACGCTTACTGGAATTCAAACATTAACTAATAAAACAATTAATGGTCCTGACAATACTTTAACTAATATTGCTAACAGCTCGTTAACAAACAGCTCAATTACATTAGGTACAACAAATATTGCGCTTGGTGGTACATCGCTAACACCAGCTGGATTAACAAGCGTTACAGTAACGCAAGACCCAGTATCTGATCTACAACTTGCTACTAAGCAATACGTTGATAACATTGCTCAAGGCTTAAATGTAAAAGCATCTTGCGTATACGGAACAACTGCTGACATTACTCTATCTGGTTTAAGTACTCAAGCTGGCGGAGATTGGGCTTCAAGCCTAACTGCTGGCAATCGTATTTTAGTTAAAAATCAAACACTAAGTCAATTTAATGGTATCTATGTAGCTGCAGCTGGTGCATGGGCCCGTTCTGCTGACATGAACGTGTGGGCAGAAGTTCCAAGCTCATTTGTATTTATTCAAACTGGTACTACCTTAGCCGATACTGGTTGGGTAACTACAGCAAACGACGGCGGTACAATTGACGTAACACCAATGCCTTGGGTGCAGTTCTCAGGCGCGGGCACGTACACAGCAGGCACAGGCTTAACATTAGCTGGCACACAGTTTAGTATCACCAACACAGCCGTTACTGCAGGCGCTTATGGCTCTGCAAGCCAAGTTGGTACCTTTACTGTTAACGCTCAGGGTCAACTAACCCTTGCTGGCAACAGCACAATTAGTATCCCAGCAAGCGCAATTAACACAACAATCCCTAACAGTGGATTAACTAACAGCTCAGTAACCATTGGCTCTAGCTCACTGTCATTAGGTGGCACACTGAGTACATTGGCTGGCGTGTCTATCAGCGGATCAGCAAACACGCTGTCTAACATCGGTAACAGTTCGTTAACAAACAGCTCAATTACTATTAACGGCAGCTCAGTTAGTTTAGGCGGTTCTGTAACAGTAACGGCTACAGCAACAAATGCACTGACTATTGGCACAGGATTAAACGGCACAAGCTACAACGGCTCTGCTGCAGTAACCATTGACTTAGCCAACACAGCCGTAACTCCGGGTGCATACACTAACGCCAACATTACCGTTGACGCTCAGGGTCGTATTACCTTAGCTGCTAACGGATCACCCGGCGGTGTAACATCATTCCAGACTTCATTGTCTGGCTTGACACCAAGTACAGCAACAACTGGTGCTGTAACATTAGCTGGCACATTAGGCGCAACTAGCGGCGGTACAAGCCAGTCTACTTACACCACTGGCGACATGTTGTACGCCTCAGCAAGCAATACATTATCTAAGTTAACAGTCGGCACAACGGGTCAGATTTTAACCGTAGCCGGCGGTGTACCAACATGGGCAGCAGCACCAGCAACTGGCGTAACATCATTTAGTGCTGGCACTACAGGCTTTACACCAAACACAGCCACAACCGGTGCAGTTACTTTAGCTGGCACATTGGCAACAACCAACGGCGGTACAGGACTCACATCCTTTACCTCTGGTGGTGCTGTGTATGCAACATCTACAAGCGCACTGACAACAGGCACATTGCCGATTGCATCAGGCGGTACAAACGGCACGTCAGCACCAACAGCCGGTGCGGTTCCTTACGGTACTGGCACAGCGTACGCGTTTACAGCCGCGGGCACAGCCGGTCAGGTACTAACATCTAACGCAGCTGGCGCGCCTACGTGGACAACCCCAGCTGGTGGCGTAACGTTATCTAACGACACAACCACAGCAACGAATCTGTACCCAACGTTTGCTGCAGCAACATCTGGCTCAGTGTCAACAATCTACACTGGCAACACTAAGCTACTTTACAAGCCGTCAACTGGTGAATTACAAGCACCAGCAACGATTGCATCAAACGGCTTAGTAATTAACAGCACAACGGTTGGCACAAGCTACACCGTGGCAGCTGGCCAAAACGCAATGTCTGTTGGACCTATGACGGTATCTGGCGGCGTTGTGGTAACAATTACCAGTGGACAGCGCTGGGTGGTGCTGTAA

Genbank protein accession

CAB4205562.1 [NCBI]

Genbank nucleotide accession

LR797360 [NCBI]

CDS location

range 36849 -> 40160
strand -

CDS

ATGGCCGATCAAAGTATATCGCAGTTACCAGTCACAACAACTCCCCTATCTGGTGATGAGTTAGCTGTAGTTGTACAAAACGGCATAACTAAACAAACTAGTTTGCAAAATATTGCAAACTTAGGCGGTCCTACTGGCCCACAAGGTCCAGTTGGTCCTCAGGGTCCGCAAGGTGTTGCTGCAACAATTCAGGTACAGTCTACTACCACGACAGCACCCGGGACTGACGCTGATGTTATTAACATTGGCTCAACCACCGACGCATTTTTAGAATTCTTTATCCCTCGCGGTGACACCGGTGCAACCGGTGCTACAGGCGCAACTGGCGCTACAGGTGCTACAGGCGCAGGCGTCCCAACTGGCGGAACCATTGGCGAGTTCTTGCAAAAGACCGGCAGCGGTGACTATCAAACAGGTTGGTCAAGCGTACCACCAACAGGCATTACCACGGTTAGTGGAACAAGCGCGCAAATTACAGTAGTAAATGGCTCAACATCGCCAGTTATCAGCATTGCAGACAATCCCGTTATCCCCGGCACTGCAGCAATGCGTTTGCCCCGCGGCACAACACCGCAACGCGCTGGCGTTGCTGGCTCTAATGGCTTAATCCGGTACAACACAGATACTTTAGTATTTGAAGGTTATTCTAACGGCGCTTGGACAGCGTTTAGCTTAGGCGGCGGTGTAACATCTATCACCGCTGGTACTGGCCTTAACGGCGGAACAATTACCTCAACAGGCACTATTGATATTGCCAACACAGGCGTAGTTGCAGCAACTTATGGTTCGGCAACGCAGGTTCCAGTGTTTGCAGTTAATGCTCAGGGCCAACTTACTTCTGTAACAAACACAACAATTACCGCTGGTGGCTTGGGCGCGCTTACCGCTGTTAATGGTACTGCAAACGAAATTACTTCTAGCCAAGTTGGTACTGTAGTTACGTTAAATCTACCAACAGCTTTAACATTTACAGGTAAAACTGTAACTGGCGGCACGTTTAACATGGACGCTGCTACTGTTAGCAGCGATACTGTTACTACCAACACAGCATCTCAGACACTCACTAACAAAACAATTAGTGGTGCAAATAACACTCTAAGCAATATTGCTAACAGTTCGCTGACTAACAGTTCTGTTACTTATAACGGTCAAACTGTTGCGTTGGGCGGTAGCGGAACAATCACTGCAAATACAACTAACGCGCTAACAATTGGAACTGGTTTATCTGGAACTAGCTTTAACGGCTCTGCTGCTGTTACCATTGCTATTGATTCTACAGTTGCTACGCTTACTGGAATTCAAACATTAACTAATAAAACAATTAATGGTCCTGACAATACTTTAACTAATATTGCTAACAGCTCGTTAACAAACAGCTCAATTACATTAGGTACAACAAATATTGCGCTTGGTGGTACATCGCTAACACCAGCTGGATTAACAAGCGTTACAGTAACGCAAGACCCAGTATCTGATCTACAACTTGCTACTAAGCAATACGTTGATAACATTGCTCAAGGCTTAAATGTAAAAGCATCTTGCGTATACGGAACAACTGCTGACATTACTCTATCTGGTTTAAGTACTCAAGCTGGCGGAGATTGGGCTTCAAGCCTAACTGCTGGCAATCGTATTTTAGTTAAAAATCAAACACTAAGTCAATTTAATGGTATCTATGTAGCTGCAGCTGGTGCATGGGCCCGTTCTGCTGACATGAACGTGTGGGCAGAAGTTCCAAGCTCATTTGTATTTATTCAAACTGGTACTACCTTAGCCGATACTGGTTGGGTAACTACAGCAAACGACGGCGGTACAATTGACGTAACACCAATGCCTTGGGTGCAGTTCTCAGGCGCGGGCACGTACACAGCAGGCACAGGCTTAACATTAGCTGGCACACAGTTTAGTATCACCAACACAGCCGTTACTGCAGGCGCTTATGGCTCTGCAAGCCAAGTTGGTACCTTTACTGTTAACGCTCAGGGTCAACTAACCCTTGCTGGCAACAGCACAATTAGTATCCCAGCAAGCGCAATTAACACAACAATCCCTAACAGTGGATTAACTAACAGCTCAGTAACCATTGGCTCTAGCTCACTGTCATTAGGTGGCACACTGAGTACATTGGCTGGCGTGTCTATCAGCGGATCAGCAAACACGCTGTCTAACATCGGTAACAGTTCGTTAACAAACAGCTCAATTACTATTAACGGCAGCTCAGTTAGTTTAGGCGGTTCTGTAACAGTAACGGCTACAGCAACAAATGCACTGACTATTGGCACAGGATTAAACGGCACAAGCTACAACGGCTCTGCTGCAGTAACCATTGACTTAGCCAACACAGCCGTAACTCCGGGTGCATACACTAACGCCAACATTACCGTTGACGCTCAGGGTCGTATTACCTTAGCTGCTAACGGATCACCCGGCGGTGTAACATCATTCCAGACTTCATTGTCTGGCTTGACACCAAGTACAGCAACAACTGGTGCTGTAACATTAGCTGGCACATTAGGCGCAACTAGCGGCGGTACAAGCCAGTCTACTTACACCACTGGCGACATGTTGTACGCCTCAGCAAGCAATACATTATCTAAGTTAACAGTCGGCACAACGGGTCAGATTTTAACCGTAGCCGGCGGTGTACCAACATGGGCAGCAGCACCAGCAACTGGCGTAACATCATTTAGTGCTGGCACTACAGGCTTTACACCAAACACAGCCACAACCGGTGCAGTTACTTTAGCTGGCACATTGGCAACAACCAACGGCGGTACAGGACTCACATCCTTTACCTCTGGTGGTGCTGTGTATGCAACATCTACAAGCGCACTGACAACAGGCACATTGCCGATTGCATCAGGCGGTACAAACGGCACGTCAGCACCAACAGCCGGTGCGGTTCCTTACGGTACTGGCACAGCGTACGCGTTTACAGCCGCGGGCACAGCCGGTCAGGTACTAACATCTAACGCAGCTGGCGCGCCTACGTGGACAACCCCAGCTGGTGGCGTAACGTTATCTAACGACACAACCACAGCAACGAATCTGTACCCAACGTTTGCTGCAGCAACATCTGGCTCAGTGTCAACAATCTACACTGGCAACACTAAGCTACTTTACAAGCCGTCAACTGGTGAATTACAAGCACCAGCAACGATTGCATCAAACGGCTTAGTAATTAACAGCACAACGGTTGGCACAAGCTACACCGTGGCAGCTGGCCAAAACGCAATGTCTGTTGGACCTATGACGGTATCTGGCGGCGTTGTGGTAACAATTACCAGTGGACAGCGCTGGGTGGTGCTGTAA

Genbank protein accession

CAB4221619.1 [NCBI]

Genbank nucleotide accession

LR797504 [NCBI]

CDS location

range 11548 -> 14859
strand -

CDS

ATGGCCGATCAAAGTATATCGCAGTTACCAGTCACAACAACTCCCCTATCTGGTGATGAGTTAGCTGTAGTTGTACAAAACGGCATAACTAAACAAACTAGTTTGCAAAATATTGCAAACTTAGGCGGTCCTACTGGCCCACAAGGTCCAGTTGGTCCTCAGGGTCCGCAAGGTGTTGCTGCAACAATTCAGGTACAGTCTACTACCACGACAGCACCCGGGACTGACGCTGATGTTATTAACATTGGCTCAACCACCGACGCATTTTTAGAATTCTTTATCCCTCGCGGTGACACCGGTGCAACCGGTGCTACAGGCGCAACTGGCGCTACAGGTGCTACAGGCGCAGGCGTCCCAACTGGCGGAACCATTGGCGAGTTCTTGCAAAAGACCGGCAGCGGTGACTATCAAACAGGTTGGTCAAGCGTACCACCAACAGGCATTACCACGGTTAGTGGAACAAGCGCGCAAATTACAGTAGTAAATGGCTCAACATCGCCAGTTATCAGCATTGCAGACAATCCCGTTATCCCCGGCACTGCAGCAATGCGTTTGCCCCGCGGCACAACACCGCAACGCGCTGGCGTTGCTGGCTCTAATGGCTTAATCCGGTACAACACAGATACTTTAGTATTTGAAGGTTATTCTAACGGCGCTTGGACAGCGTTTAGCTTAGGCGGCGGTGTAACATCTATCACCGCTGGTACTGGCCTTAACGGCGGAACAATTACCTCAACAGGCACTATTGATATTGCCAACACAGGCGTAGTTGCAGCAACTTATGGTTCGGCAACGCAGGTTCCAGTGTTTGCAGTTAATGCTCAGGGCCAACTTACTTCTGTAACAAACACAACAATTACCGCTGGTGGCTTGGGCGCGCTTACCGCTGTTAATGGTACTGCAAACGAAATTACTTCTAGCCAAGTTGGTACTGTAGTTACGTTAAATCTACCAACAGCTTTAACATTTACAGGTAAAACTGTAACTGGCGGCACGTTTAACATGGACGCTGCTACTGTTAGCAGCGATACTGTTACTACCAACACAGCATCTCAGACACTCACTAACAAAACAATTAGTGGTGCAAATAACACTCTAAGCAATATTGCTAACAGTTCGCTGACTAACAGTTCTGTTACTTATAACGGTCAAACTGTTGCGTTGGGCGGTAGCGGAACAATCACTGCAAATACAACTAACGCGCTAACAATTGGAACTGGTTTATCTGGAACTAGCTTTAACGGCTCTGCTGCTGTTACCATTGCTATTGATTCTACAGTTGCTACGCTTACTGGAATTCAAACATTAACTAATAAAACAATTAATGGTCCTGACAATACTTTAACTAATATTGCTAACAGCTCGTTAACAAACAGCTCAATTACATTAGGTACAACAAATATTGCGCTTGGTGGTACATCGCTAACACCAGCTGGATTAACAAGCGTTACAGTAACGCAAGACCCAGTATCTGATCTACAACTTGCTACTAAGCAATACGTTGATAACATTGCTCAAGGCTTAAATGTAAAAGCATCTTGCGTATACGGAACAACTGCTGACATTACTCTATCTGGTTTAAGTACTCAAGCTGGCGGAGATTGGGCTTCAAGCCTAACTGCTGGCAATCGTATTTTAGTTAAAAATCAAACACTAAGTCAATTTAATGGTATCTATGTAGCTGCAGCTGGTGCATGGGCCCGTTCTGCTGACATGAACGTGTGGGCAGAAGTTCCAAGCTCATTTGTATTTATTCAAACTGGTACTACCTTAGCCGATACTGGTTGGGTAACTACAGCAAACGACGGCGGTACAATTGACGTAACACCAATGCCTTGGGTGCAGTTCTCAGGCGCGGGCACGTACACAGCAGGCACAGGCTTAACATTAGCTGGCACACAGTTTAGTATCACCAACACAGCCGTTACTGCAGGCGCTTATGGCTCTGCAAGCCAAGTTGGTACCTTTACTGTTAACGCTCAGGGTCAACTAACCCTTGCTGGCAACAGCACAATTAGTATCCCAGCAAGCGCAATTAACACAACAATCCCTAACAGTGGATTAACTAACAGCTCAGTAACCATTGGCTCTAGCTCACTGTCATTAGGTGGCACACTGAGTACATTGGCTGGCGTGTCTATCAGCGGATCAGCAAACACGCTGTCTAACATCGGTAACAGTTCGTTAACAAACAGCTCAATTACTATTAACGGCAGCTCAGTTAGTTTAGGCGGTTCTGTAACAGTAACGGCTACAGCAACAAATGCACTGACTATTGGCACAGGATTAAACGGCACAAGCTACAACGGCTCTGCTGCAGTAACCATTGACTTAGCCAACACAGCCGTAACTCCGGGTGCATACACTAACGCCAACATTACCGTTGACGCTCAGGGTCGTATTACCTTAGCTGCTAACGGATCACCCGGCGGTGTAACATCATTCCAGACTTCATTGTCTGGCTTGACACCAAGTACAGCAACAACTGGTGCTGTAACATTAGCTGGCACATTAGGCGCAACTAGCGGCGGTACAAGCCAGTCTACTTACACCACTGGCGACATGTTGTACGCCTCAGCAAGCAATACATTATCTAAGTTAACAGTCGGCACAACGGGTCAGATTTTAACCGTAGCCGGCGGTGTACCAACATGGGCAGCAGCACCAGCAACTGGCGTAACATCATTTAGTGCTGGCACTACAGGCTTTACACCAAACACAGCCACAACCGGTGCAGTTACTTTAGCTGGCACATTGGCAACAACCAACGGCGGTACAGGACTCACATCCTTTACCTCTGGTGGTGCTGTGTATGCAACATCTACAAGCGCACTGACAACAGGCACATTGCCGATTGCATCAGGCGGTACAAACGGCACGTCAGCACCAACAGCCGGTGCGGTTCCTTACGGTACTGGCACAGCGTACGCGTTTACAGCCGCGGGCACAGCCGGTCAGGTACTAACATCTAACGCAGCTGGCGCGCCTACGTGGACAACCCCAGCTGGTGGCGTAACGTTATCTAACGACACAACCACAGCAACGAATCTGTACCCAACGTTTGCTGCAGCAACATCTGGCTCAGTGTCAACAATCTACACTGGCAACACTAAGCTACTTTACAAGCCGTCAACTGGTGAATTACAAGCACCAGCAACGATTGCATCAAACGGCTTAGTAATTAACAGCACAACGGTTGGCACAAGCTACACCGTGGCAGCTGGCCAAAACGCAATGTCTGTTGGACCTATGACGGTATCTGGCGGCGTTGTGGTAACAATTACCAGTGGACAGCGCTGGGTGGTGCTGTAA

No Gene Ontology terms available.

No enzymatic activity data available.

No tertiary structures available.

No literature entries available.

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Gene Ontology

Enzymatic activity

Tertiary structure

Literature