Genbank accession
YP_010110611.1 [GenBank]
Protein name
hypothetical protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,72
TF
Evidence RBPdetect2
Probability 0,81
Protein sequence
MNKKISQFEVTTSFEDNDILTLVQDKTNKIIHKDDFETSLSGTFVTNERVDGIEEDVANLDTKVDNNYTDLSNKIVEGDTNVTNNLSSNINSYYDVLNNKIITLEDKHDKDLTEVNDTVQGWIDTIDDKSTKEQLQNLLNRLIEDENIITALADLIANGGGSGEAPGFHTQPTSTIFPLSGYYYNGDTSDLTTTDTLNQALSKLEGKIRSVEGSIGGDTKYMITSTDNTQPTDGNLYSARRSDLNYISKKVDDTANGYIKFLKGIQGGQTFREGFLGEGASLWPINGRWKLEVDDLFVRGRMTVNELLVNEIKATGGDILVSVADLEILDVTTTPDNDYKCTFDTQDGTVRNPFVEGDQAICQIFDGKNVKRYWRMVSEVGTDYVVLSDSVCEPGSSIPEPKDKIIQLGNRYPGNEDRRSAIMISARGTEGPSVTLYDNIDDFNLVGKDRTVIGKNSRFVGTLSQVSSNGDIIRVPIDRGQFIAGTTYYYYDRVSYNGSLWLCMATQTTSIPSKENDEWLLQVEKGEQGAAGADKAKWVEITGERLFMYDNPNFEGTPKPSVITLYCNTYNIENPVFTWVNRNTNETIGTSQALDVRPDMFGDLRNFVVRCTVVNGKESFYDETQVAKLGDGATGEDAFYIDLSNGNMTVPYDSSGNNPQITITDVYTYVYAYQGTSQLYIDSITAETIEGVATVTVDGDKVTLNTLGSPSARIRLTVNIGSMSFTKDLWINKVQNGENGFDGVDACYVLISGEQVFKYDKEGLVSPSQITLYASSYGIESPTYSWYWKIVGTDDWNLLENEITETLVVSPNGSYFNNSVNEVTFKVECTSALGGAVYQDMLTINKLYDGKDGESPYRGVLTNEAHTVAANWLGEVESSELAKASTNYYLYQGTRKLENSEYTITYTNLDNNAQNQLSIDTNNNKLTVARLGNSFDSTVFKVEFHVPASSSSPVVDVCDFTITKAKGGVPGDFEVSIYCRSNESQPNRPSMTSRPTSGGTYSNGNYWYTDAPSASGYAIWKSTALFDGETGLLKSGEQWTLPTKISGKDGQDGQNGAQGPAGPQGSPGDRGPAGDPGPALNFRGEYNKDATYYKTAELVDVVKRDGVYYMANKATITPGWSSSEWKSLNSFENIATGLLFAEEATIGGWRFSPASSSYFRSTNDVVCFYPSTDGITPFLAAGTGSNKGAISSGGTKITNSKAPLKLWADGIITVGDGSSSSRAGLTGVGTSSDSVRIWAGTNHGNRTSAPFRVLDNGSMVATNGTFTGNVTCTSLIAQNIDSGNFSIPGLKCAGRCNWTGSSTSFGYLFTTKELRMSPSRVATGRFRFTLSGAHSTDYVVLCSIDNPNTNVASGFRGSYQIGPRYSDHFDVHWFDTNGDAHDLTYFNVAFFSY
Physico‐chemical
properties
protein length:1393 AA
molecular weight: 152336,19760 Da
isoelectric point:4,62950
aromaticity:0,10122
hydropathy:-0,42886

Domains

View on InterPro
YP_010110611.1
1 1393 aa
STR 1050–1110 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Tail Spike Domain Segmentation

Segmented into three structural domains: N-terminal, central, and C-terminal.

YP_010110611.1
1 1393 aa
Domain Start End Length (AA) Confidence
N-terminal 1 1145 1145 0,8316
Central domain 1146 1344 200 0,5439
C-terminal 1345 1393 48 0,9718
N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Taxonomy

Phage
uncultured phage cr1_1 [NCBI] · taxon 2772064
Host No host information

Coding sequence (CDS)

Genbank protein accession
YP_010110611.1 [NCBI]
Genbank nucleotide accession
NC_055873 [NCBI]
CDS location
range 1739 -> 5920
strand -
CDS
ATGAATAAAAAGATATCACAATTTGAGGTTACCACATCTTTTGAAGATAATGATATTCTAACTCTTGTACAAGATAAAACTAATAAGATAATCCATAAAGATGATTTTGAAACTAGTTTATCTGGTACATTTGTAACTAATGAAAGAGTAGATGGTATTGAAGAAGATGTAGCTAATCTTGATACTAAAGTAGACAACAATTACACAGATCTATCCAACAAAATAGTAGAAGGGGATACTAATGTTACTAATAACCTGAGTAGTAATATTAATAGTTATTATGATGTATTAAACAATAAGATCATTACTCTTGAAGATAAACATGATAAGGATTTAACTGAAGTTAATGATACAGTACAGGGTTGGATAGATACTATTGATGATAAGTCTACAAAGGAACAATTACAAAACCTATTAAATAGGTTAATTGAAGATGAAAACATCATTACAGCATTAGCAGATTTAATTGCAAATGGTGGTGGTAGTGGTGAAGCACCCGGTTTTCATACACAACCTACTAGTACCATATTTCCATTATCAGGGTACTATTATAATGGTGATACTAGTGATTTAACTACTACAGATACTTTAAATCAAGCTTTATCAAAACTAGAAGGTAAAATTAGATCTGTAGAAGGTAGCATAGGTGGTGATACAAAATATATGATCACTAGTACCGACAATACTCAACCTACAGATGGTAATTTATATTCAGCTAGAAGATCTGATTTAAACTATATATCTAAAAAGGTTGACGATACAGCAAATGGTTATATCAAGTTTTTAAAAGGAATACAGGGAGGTCAAACATTTAGAGAAGGTTTTCTAGGTGAGGGCGCTAGTTTATGGCCGATTAACGGTAGATGGAAGTTAGAAGTAGACGATTTATTTGTTAGAGGTAGAATGACTGTTAATGAACTTCTAGTAAATGAAATAAAAGCTACTGGTGGAGATATATTAGTTTCAGTTGCTGATCTTGAAATACTAGATGTTACTACTACTCCAGATAATGATTATAAATGTACATTTGATACTCAGGACGGTACTGTAAGAAATCCTTTTGTTGAAGGAGATCAGGCTATATGTCAAATCTTTGATGGTAAAAATGTTAAAAGATATTGGCGCATGGTATCCGAAGTAGGTACTGATTATGTGGTTTTATCTGATTCTGTATGCGAACCTGGTAGTTCTATTCCTGAACCCAAAGATAAAATTATTCAGTTAGGTAATAGATATCCTGGTAATGAAGATCGTAGATCAGCTATTATGATATCTGCTAGAGGTACAGAAGGACCCAGTGTTACTTTATATGATAATATTGATGATTTTAATTTAGTAGGTAAAGATCGTACAGTTATAGGTAAAAATAGTAGATTCGTTGGTACTTTATCTCAAGTATCTAGTAATGGAGATATTATAAGAGTACCTATCGATAGAGGACAATTTATAGCTGGTACTACGTATTATTATTATGATAGAGTATCATATAATGGTTCACTGTGGTTATGTATGGCTACTCAAACCACTAGTATCCCTAGTAAAGAAAATGATGAATGGCTGTTGCAAGTAGAAAAGGGTGAGCAAGGTGCTGCTGGTGCAGATAAAGCTAAATGGGTGGAAATTACAGGTGAAAGATTGTTCATGTATGATAATCCTAATTTTGAAGGTACTCCTAAACCATCTGTCATTACACTATATTGTAATACTTATAATATAGAAAATCCTGTATTTACTTGGGTAAATAGAAATACAAATGAAACCATAGGTACTTCTCAAGCATTGGATGTACGTCCTGATATGTTTGGTGATCTTAGAAATTTTGTAGTACGTTGTACTGTAGTTAATGGTAAAGAAAGTTTTTATGATGAAACTCAGGTAGCCAAACTCGGAGATGGTGCAACTGGAGAAGATGCTTTCTATATTGACCTAAGTAATGGTAATATGACGGTACCTTACGATTCATCTGGCAATAATCCACAAATTACTATTACTGATGTATATACTTATGTGTATGCATATCAGGGTACGAGTCAATTATATATTGATAGTATAACAGCAGAAACTATTGAAGGTGTAGCTACTGTTACTGTAGATGGTGATAAAGTGACATTAAATACTTTAGGATCACCTTCTGCTAGAATACGATTAACAGTTAATATCGGTTCCATGTCCTTTACTAAGGATTTATGGATTAATAAAGTACAAAATGGTGAGAATGGGTTTGATGGAGTCGACGCTTGTTATGTATTAATATCAGGAGAGCAGGTATTTAAGTACGATAAAGAAGGTTTAGTTAGCCCATCACAAATAACTTTATATGCTAGTTCGTATGGGATTGAATCTCCTACTTATTCTTGGTATTGGAAAATCGTAGGTACAGATGATTGGAATCTTCTTGAAAATGAGATTACAGAAACTTTAGTAGTATCACCAAACGGTTCATACTTTAATAATTCTGTTAACGAAGTAACTTTTAAAGTAGAATGTACTTCTGCTTTAGGAGGAGCTGTATATCAGGATATGTTAACAATTAATAAATTGTATGATGGAAAAGATGGAGAAAGCCCATATAGAGGTGTATTAACTAATGAAGCTCATACAGTAGCTGCTAATTGGTTAGGAGAAGTAGAATCATCAGAATTAGCAAAAGCTTCTACTAATTATTATTTATATCAAGGTACTAGAAAATTAGAAAATAGTGAATATACTATAACTTATACTAATTTAGATAACAATGCTCAAAATCAATTATCTATTGATACAAATAATAATAAACTTACCGTAGCTAGATTAGGTAATAGTTTTGATAGTACAGTATTTAAAGTAGAATTTCATGTACCAGCTTCTTCATCTTCTCCAGTAGTAGATGTATGTGATTTTACTATTACAAAAGCCAAAGGTGGAGTTCCTGGTGATTTTGAAGTATCTATTTATTGTAGATCTAATGAGTCTCAACCGAATCGACCTTCCATGACATCTAGACCTACTTCTGGTGGTACCTATAGTAATGGTAACTATTGGTATACAGATGCTCCTTCAGCAAGTGGTTATGCTATATGGAAAAGTACTGCTTTATTTGATGGAGAAACTGGTTTACTTAAGTCTGGAGAACAGTGGACATTACCTACAAAAATATCAGGTAAAGATGGACAAGATGGGCAGAATGGTGCTCAAGGACCTGCTGGACCACAAGGATCTCCCGGAGATAGAGGTCCTGCTGGAGATCCAGGTCCTGCGTTAAATTTTAGAGGAGAATATAATAAGGATGCTACTTATTATAAAACAGCAGAATTGGTAGATGTCGTAAAAAGAGATGGAGTATATTATATGGCAAATAAAGCTACAATTACACCGGGTTGGTCTAGTTCTGAATGGAAATCATTAAATTCATTTGAGAATATTGCAACCGGTTTGTTATTTGCTGAAGAAGCTACAATTGGTGGATGGCGCTTTAGTCCAGCTTCTAGTAGTTATTTTAGATCAACAAATGATGTAGTGTGTTTCTATCCATCTACAGATGGTATAACTCCATTTTTAGCAGCAGGTACTGGTTCAAATAAAGGTGCTATTTCTTCTGGTGGTACTAAAATCACAAACTCAAAAGCTCCTTTAAAATTATGGGCAGATGGTATCATTACAGTAGGAGATGGTTCTAGCAGTTCTAGAGCAGGATTAACTGGGGTAGGAACTTCTTCAGACTCTGTAAGAATCTGGGCAGGTACAAATCATGGTAATAGAACATCTGCTCCTTTTAGAGTACTTGATAATGGTAGTATGGTAGCAACAAATGGTACATTTACTGGAAATGTTACTTGTACTTCTTTAATTGCTCAAAATATTGATTCTGGTAATTTCTCAATACCCGGATTGAAGTGTGCAGGTAGATGTAACTGGACTGGGTCTAGCACATCGTTTGGATATTTATTTACTACTAAGGAACTTAGAATGTCTCCTTCTAGGGTTGCTACAGGTAGATTTAGATTTACATTATCAGGTGCACATAGTACTGATTATGTTGTATTGTGTTCTATTGATAATCCAAATACAAATGTAGCTAGTGGCTTTAGAGGTTCATATCAAATTGGTCCTAGATATTCTGATCATTTTGATGTTCATTGGTTTGATACTAATGGTGATGCCCATGATTTAACTTATTTTAATGTTGCATTTTTTTCGTATTAG

Genome Context

Tertiary structure

YP_010110611.1
ESMFold structure
Source ESMFold
pLDDT 64.9
Oligomeric state monomer

Literature

Title Authors Date PMID Source
Taxonomic proposal: Crassvirales, a new order of highly abundant and diverse bacterial viruses Shkoporov,A.N., Stockdale,S.R., Guerin,E., Ross,R.P. and Hill,C. 2023-03-24 GenBank