Genbank accession
UGO52669.1 [GenBank]
Protein name
tail spike protein
RBP type
TSP
Evidence DepoScope
Probability 1,00
TSP
Evidence RBPdetect
Probability 0,90
TSP
Evidence RBPdetect2
Probability 0,95
TF
Evidence Phold
Probability 1,00
Protein sequence
MAIYDAGTASLAADGTVTGVGTTWRQPLTLIRVGATMIFNTTPASIVTIAEIISDTEIRVFNDKGFTAPTGTQYSILAHDGITVQGLAQDVAETLRYYQSNETEVAAAVDAFNQFDADAFQQNVTNVNNQSQQVASDALQVSADKADVQSSLSQAEAARDAAGLSASNAASSAQSAESAAQSVSGALIGSFQSGVTIQSATQQVIDISSGIAVPYIWAGALPKTVPANSTPESTGGVSSSGWVPLSFADRNVDNLSILRGLVPLRDGERVYVSSHSGTSMLGGGWFYYDANDSTSTDDDGVVIVTTGNHRWKRDLSLIEGLSPMMFGALMNAPYIDGNTIQGTPYPKAPSMGAADLTGVSNDGVAMQKCYTASIKLNKKILIDRPIYIGTTRVNVSGERFSGQTIRIEGTATPRRCLIYTSGNGGFIVSPWGHNMFVKNIGFRNADADYNGSPLISGNDSGQGGGGKQYTIDNVEFYHYKYALSTLTFVSKISNVYMYDCTYGIGLSGNTSTALDSVWAHHCDVGFLWGYGINTTTLEPVAGGFPVMYVTATNIAADGCLTPHKIGGQLRSVNIVGAGVEGVNGDTVFDFSDYGGDDDQFGFDVKGFSCWIQSSMNTGVLRMIKLPANESRMPVGSIRFSDGYFKSDYALMIMENTISNPTAEGNSVHFGDDFRIINSQYTGSFSKSTLRSTKVGNVTYGESPVEARNSYNGTTLSAVHVTSGMDFNQVRTEDATLLLPYNRALDILLTTVGEESRYGSTFIAGELSLIPINKNGLGGQESGGIIQFSLSGSTKANVSSGIPWYNKIAKSTGSKSTSLDGVSITKYVTGGQTFLRILTPTASVSTFLCHLKLTYSGFAHFYDKRWQVRAI
Physico‐chemical
properties
protein length:870 AA
molecular weight: 92570,11490 Da
isoelectric point:5,16970
aromaticity:0,09310
hydropathy:-0,10253

Domains

Domains [InterPro]
UGO52669.1
1 870
Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Taxonomy

  Name Taxonomy ID Lineage
Phage Escherichia phage vB_EcoD_Opt-719
[NCBI]
2902671 Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
UGO52669.1 [NCBI]
Genbank nucleotide accession
OL539451.1 [NCBI]
CDS location
range 27490 -> 30102
strand -
CDS
ATGGCAATTTATGACGCGGGAACAGCATCGCTTGCAGCTGACGGAACTGTAACTGGTGTTGGTACTACCTGGAGGCAGCCGTTAACTCTAATTCGAGTTGGCGCAACAATGATTTTCAATACCACGCCAGCAAGTATTGTTACCATTGCTGAAATAATCAGTGATACCGAAATTCGAGTTTTTAACGACAAGGGATTTACCGCTCCGACTGGTACTCAGTACTCAATTCTTGCTCACGACGGGATTACTGTTCAGGGACTTGCTCAGGATGTTGCTGAAACCTTGCGTTACTATCAGTCAAATGAGACTGAAGTCGCAGCAGCTGTTGATGCTTTTAATCAGTTTGATGCTGATGCATTCCAGCAAAATGTCACAAACGTAAACAACCAGTCTCAGCAGGTTGCCAGTGATGCCTTGCAAGTATCGGCAGATAAGGCAGATGTTCAGTCCTCATTATCTCAAGCTGAGGCGGCGAGGGATGCAGCGGGTTTAAGTGCATCTAACGCAGCATCCTCTGCTCAAAGTGCTGAGTCAGCAGCTCAGTCAGTTTCTGGTGCTCTCATTGGCTCATTTCAGTCTGGCGTAACTATTCAATCAGCAACTCAACAGGTAATTGACATTTCATCTGGTATTGCTGTCCCTTACATTTGGGCGGGCGCGCTTCCTAAAACCGTCCCGGCTAACTCAACCCCTGAGTCAACTGGAGGGGTTTCATCTTCTGGATGGGTGCCTTTGTCATTTGCTGATCGTAATGTTGATAACTTATCTATTTTGAGGGGCTTGGTGCCACTTCGTGACGGTGAGCGGGTTTATGTATCTAGTCACTCAGGGACTAGCATGCTTGGCGGTGGCTGGTTCTATTACGATGCCAATGATTCAACCAGCACAGATGATGATGGTGTTGTTATTGTCACTACCGGAAACCACAGATGGAAGCGAGATCTTTCATTGATTGAAGGCTTGTCACCAATGATGTTTGGTGCTCTGATGAACGCGCCATATATTGATGGAAATACAATCCAAGGTACGCCATATCCAAAAGCACCAAGCATGGGCGCCGCTGATTTGACTGGCGTGTCTAACGATGGCGTTGCTATGCAGAAGTGCTACACAGCATCAATCAAATTAAACAAGAAGATTCTCATTGATAGGCCTATCTACATTGGCACAACAAGGGTCAACGTATCTGGTGAGAGGTTCTCAGGACAGACAATTAGGATTGAAGGTACAGCAACTCCTAGGAGGTGTTTGATTTACACATCTGGCAATGGTGGCTTCATTGTTTCGCCTTGGGGTCACAATATGTTTGTTAAAAACATTGGCTTCAGGAACGCAGATGCTGATTATAACGGCTCACCTCTAATTAGCGGAAATGACTCAGGTCAAGGTGGTGGCGGCAAGCAGTACACAATAGATAACGTTGAGTTTTATCATTACAAGTATGCATTATCAACACTGACATTTGTTTCTAAAATTTCAAATGTATACATGTACGATTGCACATACGGCATTGGACTTTCAGGTAATACAAGTACCGCCCTTGATTCTGTATGGGCACACCACTGTGATGTTGGCTTTCTTTGGGGTTACGGCATTAACACAACAACCCTGGAGCCTGTAGCTGGTGGTTTTCCTGTTATGTATGTCACTGCGACAAACATAGCTGCTGATGGTTGCTTAACTCCACACAAGATTGGTGGCCAGTTAAGGTCTGTTAATATCGTAGGTGCTGGGGTTGAGGGTGTTAATGGAGATACTGTATTTGATTTCTCCGACTATGGTGGTGATGACGATCAGTTTGGATTTGATGTAAAGGGGTTTTCTTGCTGGATTCAATCAAGCATGAACACTGGAGTCCTTAGGATGATAAAATTGCCAGCTAATGAAAGTAGAATGCCAGTTGGATCGATACGTTTTAGCGATGGTTATTTCAAGTCTGATTACGCCTTGATGATTATGGAAAACACCATTTCAAACCCAACTGCAGAAGGTAACTCTGTTCATTTTGGTGATGACTTCAGGATTATTAACAGTCAATACACTGGTTCATTCTCAAAGAGCACGTTGAGGAGCACTAAAGTTGGCAACGTGACATATGGCGAGTCACCAGTTGAAGCAAGGAACTCATATAACGGAACTACGTTATCTGCTGTTCATGTTACTAGTGGAATGGACTTCAATCAGGTCAGAACTGAGGATGCTACTTTATTGCTGCCTTATAACAGGGCGCTTGATATCCTTCTTACTACAGTTGGTGAGGAGTCCAGGTATGGGTCAACATTTATTGCTGGAGAGTTGAGCCTTATACCAATTAATAAGAATGGATTAGGCGGTCAGGAATCAGGAGGTATTATTCAATTTAGCTTATCTGGAAGCACTAAGGCCAATGTCTCATCAGGAATACCTTGGTATAACAAGATAGCTAAGTCGACTGGCTCAAAAAGCACTTCTCTTGATGGGGTTTCTATTACTAAGTACGTGACTGGTGGTCAGACATTCCTGAGGATTTTAACACCAACTGCATCGGTAAGCACATTCCTTTGCCACCTTAAATTAACATATAGTGGATTTGCTCACTTTTATGATAAAAGGTGGCAGGTTAGAGCAATATAA

Tertiary structure

PDB ID
d70d9091e844a5ea97a92a23f3627ca56e316d31c577c4d507b8be153b6c98cf
ESMFold
Source ESMFold
Method ESMFold
Resolution 0,7118
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50