Protein

View in Explore

Genbank accession

AXC41936.1 [GenBank]

Protein name

baseplate hub protein

RBP type

TSP

Evidence RBPdetect

Probability 0,85

Evidence Phold

Probability 1,00

Protein sequence

MKKILDSAREYLRTNNKIKTACLITLELPSSTGSSSAYIYLTDYFRDVRYNGILYTSGKVKSITTHKQNRDLSIGSLSFTITGTAEDEVLKLVQNGVSFLDRSISIHQAVIDEEGNILPVDPDTNGPLLYFRGKITGGGIKDNIGTSGISTSTITWNCSNQFYDFDRVNGRFTDDADHRGLEIVAGQLVPSNGAKRPEYQEDYGFFHANKSISILAKYQVQEERYKLQSKKKLFGLSRSYSLKKYYETVTKEVDIDFNLAAKFLPVVYGTQKIPGIPVFADTELHNPNIVYIVYAFCEGEIDGFLDFYFGDVPMICIDPNDSKSRTCFGTKKVAGDTMQRIASGQSSSEPSVHGQEYRYNDGNGDIRIWTYHGKADQSAADVLVNIAKEKGFYLQNMNENGPEYWDSRYKLLDTAYAIVRFTINENRTEIPEVSAEVQGKKIKIYHSDGRVTADKTSLNGIWQTLDYLTSDRYGANITIDQFPLQQLIQEAAILDIIDESYQVSWQPYWRYVGWTDAVGENRQIVQMNTILDTSESVFKNVQGLIESYGGAINNLSGQYRITVEKFSNTPLEIDFLDTYGDLELSDTTGRNKFNSVQASILDPALSWKTNSITFFNSIFKEQDKGLDKKLQLSFANITNYYTARSFADRELKKSRYSRTLTFSLPYHFIGIEPNDPISFTYGRYGWDKKYFLVDEVENSREGKINITLQEYGEDVFINSEQVDNSGNDIPDVSNNVLPPRDFMYTPTPGGQVGSIGKNGELSWLPSLTNNVVYYSIVHSGHADPYIVQQLETNPNLRMIQEIIGEPAGLAVFEIRAVDINGRRSSPVTLSVELNSAKNLSVVSNFRVTNTASGDASEFVGPDVKLAWDKIPEEDIIDGIFYTLEIYDNLDRLLRSVRIEDQYVYDYLLIYNKADYALHNEDALGINRKLRFRIRAEGDNGEQSVDWASI

Physico‐chemical properties

protein length:	949 AA
molecular weight:	107256,54510 Da
isoelectric point:	5,00919
aromaticity:	0,11275
hydropathy:	-0,42287

Domains

Domains [InterPro]

IPR032876
594–686

IPR032876

AXC41936.1

1 949

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

InterPro ID	Start	End	Source	Name
IPR032876	594	686	InterPro	Tip attachment protein J

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage S133 [NCBI]	2231356	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	No host information

Coding sequence (CDS)

Genbank protein accession

AXC41936.1 [NCBI]

Genbank nucleotide accession

MH370380 [NCBI]

CDS location

range 15584 -> 18433
strand +

CDS

ATGAAGAAAATTCTTGACAGTGCAAGAGAGTATTTAAGAACTAATAATAAAATAAAAACTGCATGCCTTATTACTCTTGAATTGCCAAGCTCTACTGGATCAAGTTCTGCCTACATATATCTTACAGATTATTTTAGAGATGTAAGATATAATGGGATTCTTTATACATCCGGTAAGGTTAAGTCTATAACAACACATAAACAAAATAGAGATCTTTCCATTGGAAGTCTTTCTTTTACTATCACAGGTACTGCTGAGGATGAAGTATTAAAACTAGTCCAAAATGGTGTATCATTCCTAGATAGATCCATCTCAATCCATCAAGCGGTTATTGATGAAGAAGGTAATATTCTTCCTGTAGATCCAGACACTAATGGTCCTCTACTTTATTTCCGCGGTAAAATAACTGGTGGTGGTATTAAGGATAACATTGGTACTTCTGGAATTAGCACATCCACTATCACATGGAACTGTTCGAACCAGTTTTACGACTTTGATAGAGTAAACGGACGTTTCACAGACGATGCTGATCATAGGGGACTTGAGATTGTTGCTGGCCAATTAGTTCCCTCTAATGGTGCTAAGCGACCTGAGTATCAAGAGGACTATGGATTCTTCCATGCTAACAAGAGTATTTCTATTCTTGCTAAATATCAGGTTCAGGAAGAGCGTTACAAGTTACAGTCTAAGAAAAAGTTATTTGGTCTTTCTAGAAGCTATAGCCTAAAGAAATACTATGAGACTGTGACTAAGGAAGTTGACATCGATTTTAACTTAGCGGCTAAGTTCCTTCCAGTAGTGTATGGAACTCAGAAAATCCCTGGAATCCCCGTATTTGCGGATACTGAGCTGCATAACCCTAATATCGTATATATAGTATATGCCTTCTGTGAGGGTGAGATTGATGGATTTCTAGATTTCTACTTTGGTGATGTACCAATGATCTGTATTGACCCTAACGATAGTAAGTCTCGTACTTGCTTTGGTACTAAGAAAGTAGCTGGAGATACCATGCAACGTATTGCTTCTGGTCAATCAAGCTCTGAACCCTCTGTTCATGGACAGGAATATAGGTATAACGATGGTAATGGTGATATACGTATCTGGACTTATCATGGTAAAGCAGACCAATCTGCTGCGGATGTTCTAGTTAACATTGCAAAAGAGAAAGGTTTCTACCTACAGAACATGAATGAGAATGGACCAGAATACTGGGACTCTCGTTATAAACTGTTAGATACTGCTTACGCTATTGTTCGCTTTACTATTAATGAAAACAGAACAGAAATTCCAGAAGTTAGCGCTGAAGTTCAAGGTAAGAAGATTAAGATATATCATTCAGATGGTAGAGTAACTGCTGATAAGACTAGCTTAAATGGTATCTGGCAAACCCTGGACTACCTAACCTCTGATCGCTATGGTGCTAATATCACTATTGATCAGTTCCCCCTCCAGCAACTTATTCAAGAAGCAGCTATTCTGGATATCATTGATGAATCCTATCAGGTTTCTTGGCAACCATATTGGAGATACGTTGGATGGACTGATGCTGTAGGAGAGAATAGACAAATAGTTCAAATGAACACTATTCTCGATACCTCTGAGTCAGTATTTAAAAACGTGCAGGGATTAATAGAGTCTTATGGTGGTGCTATCAACAACTTATCGGGACAGTATAGGATAACTGTTGAGAAGTTCTCAAACACCCCACTGGAGATTGACTTCTTAGATACTTATGGTGATTTGGAGCTATCAGATACTACTGGTAGAAATAAATTTAACTCAGTACAAGCCTCTATATTAGATCCAGCATTAAGCTGGAAGACTAACTCCATTACATTCTTTAACTCTATATTTAAGGAGCAAGATAAAGGGTTAGATAAAAAACTTCAGCTTTCTTTTGCAAACATCACTAACTACTATACTGCGCGTAGCTTTGCAGATAGAGAACTGAAAAAGTCTCGTTACTCACGAACTCTCACATTCTCATTACCATATCATTTCATAGGCATTGAGCCTAACGACCCAATTTCTTTTACTTATGGTCGTTATGGTTGGGATAAGAAATACTTCCTAGTTGATGAAGTTGAAAACTCTAGAGAAGGTAAGATTAATATTACACTGCAAGAGTATGGTGAGGATGTATTCATTAACTCCGAGCAGGTTGATAATAGTGGTAACGATATCCCTGATGTTAGTAATAACGTACTGCCCCCTAGAGACTTTATGTACACACCAACACCGGGTGGACAAGTAGGATCTATTGGTAAGAATGGTGAGCTATCTTGGCTTCCTAGCTTAACTAATAACGTTGTTTATTACTCCATCGTTCATTCTGGACATGCTGATCCTTATATCGTACAGCAACTAGAAACTAATCCAAATCTACGAATGATCCAAGAAATTATTGGAGAACCTGCTGGTTTAGCAGTCTTTGAGATTAGAGCTGTAGATATTAATGGTAGACGAAGTTCTCCTGTAACACTATCGGTAGAACTTAACTCTGCTAAAAACTTAAGCGTCGTTAGTAATTTCAGGGTTACTAACACAGCTTCAGGAGATGCATCGGAGTTTGTAGGACCAGACGTTAAGTTGGCCTGGGATAAAATTCCAGAAGAAGATATCATTGATGGAATCTTCTACACTCTAGAAATCTACGATAACCTAGATCGTTTATTAAGAAGTGTACGAATTGAAGATCAGTATGTCTACGATTATCTACTGATATACAATAAGGCAGACTATGCTCTTCATAACGAGGATGCTCTAGGTATTAATAGGAAGTTACGCTTCCGTATAAGAGCAGAAGGTGATAATGGCGAGCAATCTGTGGATTGGGCATCTATTTAA

Tertiary structure

PDB ID

fa502790ccb49078bbadf39b15be1817595b8f3d6bfe7a49cb0e1a07e555b965

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8234

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence