Protein

View in Explore

UniProt accession

Q6WHC1 [UniProt]

Protein name

Long tail fiber proximal subunit

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence RBPdetect

Probability 0,54

Evidence RBPdetect2

Probability 0,50

Protein sequence

MSEFRRAFRASGLDASGQNVINVANPRVDELLDGINQGYFIDENTVQEYDPSRAHYKVDFIVEFNQRLYKNIIEITAPEPFDPQKWKKMRTDPEWEDTDSSVGANVGDLLWLTASSAITITLPETPLTGDTVTIKDGRGILSTYPCTIAAAGGLTIQSYGINGGIQSDASLSFNRPNSTIYLVYNGIAWTYQIEQQLYHTYLDDSHPSQQGGYLTTGGYFTNVGETVTYEGSVKTIAISLPLHPNVGDTIHLKDVAYLESQTTIQIGVRPTAVGQVVQDPVSGDRSAVISLDTIGGADITFIDDNGTGVWVITIANNPHLWNYVGESSAVTLKPRTRYAIEIADAVSAMTITLPEKPVDGDWIEISHNKTAHKPVTVQVHPNFGDDDPGHGPDEYKVFLDFETYRYQKYRHYVDFVPFFVESFDISDYDSGYSFVLYYDGTRKVWSFGNIATRIDIADELHRKRPGIVPLADPTEALAHGIEYAHPEDVAKPWADQSPLKDHVITVETLDARRAAEDQVGMARIATLGVDEALEESRSGALVRYPDSAFRHDIMITPRSLNARTATETRRGVVEIATQTETRSTTNDVQVITPKKFHAAQAEENLTGVAELVKASNNINANGTVASTANMRSDRTVNGVVDTVYDKTDHLRIVTPKMLDEYRATENQPGTLWVAKSTELRVNDSTVDDAIITPKKLAAWKASSTIRGIARSATQAETNAISGTGEAWTTVFVTPETLNSRTATESRRGVAEIATQVEVDAGTDDTRIVTPLKVATWLAYDHFTSDGVAQGAGYGVSGISHTGDIWNGINLEIALATTTQRGTLETATETEAKVQQTWNGTSWDGTAAAADKIVTPLTLDRRRATETQYGLARRATNAEIDTATIGGVDNTPVYVSPKDLLRWTRTSTNSRSDETRFGVVRLATPAETFVGNSTDGSTQAYTAYLRTPYAVTPYSLNYALRNYLPLNAKADDSELLDGLDSTQFARRDINQTINGTYTFNAKNVEINAGGWLQVQNAPTGDIVKLDWFDSAPRIRVGGSGASSTATFSIQGAADFVRWQVNSSGYTTQASGATFGSTVTENESSANVDATYGTYSSPAAGTLRQKYLGINNVAKAAEKWVTARTVTFTGDLTGNFTIDGSGNVSTNVQVNDNSHNHSGENITSGTISNDRLIKSSRTNPGIVQVTSDVRTADPVNASDPHQALSAGAGKTLSERIDLFTPDGGTGDNVKYRDYIQVGSVRMSTNNQGVLEFTFGHAI

Physico‐chemical properties

protein length:	1256 AA
molecular weight:	136598,11460 Da
isoelectric point:	4,96826
aromaticity:	0,08201
hydropathy:	-0,38145

Domains

Domains [InterPro]

No domain annotations available.

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

No domain annotations available.

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Vibrio phage KVP40 (isolate Vibrio parahaemolyticus/Japan/Matsuzaki/1991) [NCBI]	75320	Uroviricota > Caudoviricetes > Pantevenvirales > Schizotequatrovirus > Schizotequatrovirus KVP40
Host	Vibrio [NCBI]	662	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales
Host	Vibrio parahaemolyticus [NCBI]	670	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Vibrionales

Coding sequence (CDS)

Genbank protein accession

AAQ64452.1 [NCBI]

Genbank nucleotide accession

AY283928 [NCBI]

CDS location

range 241025 -> 244795
strand -

CDS

ATGTCGGAATTCCGCAGAGCATTTCGTGCGTCAGGTCTTGATGCAAGTGGTCAAAATGTAATTAACGTAGCAAACCCACGAGTAGATGAATTGCTCGACGGTATTAACCAAGGCTACTTCATTGATGAAAACACTGTTCAAGAGTATGATCCATCACGAGCGCACTACAAAGTAGATTTCATCGTTGAATTTAACCAACGTCTCTACAAAAACATCATTGAAATCACCGCGCCCGAACCATTTGACCCACAGAAGTGGAAGAAGATGCGTACCGACCCAGAGTGGGAAGATACAGATTCTTCAGTTGGTGCAAACGTAGGTGACTTATTATGGTTGACAGCTAGTTCAGCAATTACAATTACACTACCAGAAACGCCATTAACCGGCGATACTGTTACAATCAAAGATGGGCGCGGTATTCTATCGACTTACCCATGTACGATTGCAGCAGCAGGCGGTCTAACTATTCAGTCGTATGGCATTAATGGCGGAATTCAATCTGATGCAAGTCTATCATTCAATCGCCCGAACAGTACAATTTATCTTGTGTACAACGGGATTGCATGGACGTATCAAATTGAACAGCAACTATACCACACGTACCTAGATGACAGCCATCCAAGTCAACAAGGTGGCTATCTAACTACTGGTGGTTACTTTACGAACGTAGGTGAAACTGTCACATACGAAGGTTCAGTAAAAACAATCGCGATCTCTCTACCGCTACACCCGAACGTGGGCGATACAATTCATCTTAAAGATGTTGCATATCTTGAAAGTCAAACGACAATTCAAATCGGCGTTCGACCAACAGCAGTAGGTCAGGTTGTTCAAGACCCTGTTTCAGGTGATCGCAGTGCAGTAATCAGCTTAGACACAATAGGTGGAGCTGACATCACGTTTATTGATGACAACGGCACTGGCGTTTGGGTTATCACTATTGCGAACAACCCGCATTTGTGGAACTATGTGGGTGAATCAAGTGCAGTTACGCTAAAACCACGTACTCGTTACGCGATTGAAATCGCTGATGCAGTTAGTGCAATGACAATCACGCTACCAGAAAAACCAGTTGATGGTGACTGGATCGAGATTTCACACAACAAGACTGCGCACAAACCTGTAACAGTTCAAGTTCACCCGAATTTTGGTGATGATGACCCAGGTCACGGCCCAGATGAATACAAAGTATTCTTGGACTTCGAGACTTACCGTTATCAAAAATATCGTCATTACGTCGATTTCGTTCCATTCTTCGTAGAATCGTTCGATATTAGCGACTATGACAGCGGTTACTCATTCGTACTGTACTATGACGGAACTCGTAAAGTATGGTCATTCGGTAACATTGCAACTCGTATCGACATTGCAGATGAACTTCACCGAAAACGTCCGGGTATCGTGCCACTAGCTGACCCAACTGAGGCTCTAGCTCACGGCATTGAATATGCACATCCAGAAGATGTTGCAAAACCATGGGCTGATCAGAGTCCGTTGAAAGATCACGTAATTACCGTTGAAACTTTAGATGCACGTCGTGCAGCCGAAGATCAAGTCGGTATGGCTCGTATCGCGACTCTTGGTGTTGATGAAGCACTTGAAGAATCACGTTCTGGCGCGTTAGTTCGCTACCCAGATAGTGCATTCCGTCATGACATCATGATCACGCCGAGAAGCTTGAACGCTCGTACAGCAACTGAAACACGTCGCGGTGTTGTTGAAATTGCGACACAGACTGAAACACGTAGCACAACTAACGATGTGCAAGTGATCACGCCTAAGAAGTTTCATGCTGCGCAAGCGGAAGAGAATTTAACAGGCGTTGCAGAACTTGTCAAGGCGTCAAACAACATTAACGCTAATGGCACAGTAGCTTCCACTGCAAATATGCGTTCTGACAGAACAGTTAACGGTGTTGTTGATACTGTATATGACAAAACTGATCATCTTCGCATTGTAACTCCGAAAATGCTTGATGAATATCGAGCTACTGAGAACCAACCGGGTACTCTATGGGTTGCTAAGAGCACTGAGCTTCGTGTAAACGACTCAACAGTTGATGATGCAATCATCACGCCTAAGAAATTAGCAGCGTGGAAAGCAAGCTCAACAATTCGCGGTATTGCACGTTCAGCAACTCAAGCTGAAACAAACGCAATCAGCGGGACAGGTGAAGCGTGGACAACTGTTTTCGTTACACCTGAGACATTAAACAGTCGTACAGCGACTGAATCTCGTCGCGGTGTTGCTGAGATTGCAACTCAAGTCGAAGTTGACGCAGGGACTGATGATACACGTATAGTTACGCCTCTGAAAGTTGCAACATGGCTTGCATACGATCACTTTACTAGTGATGGCGTTGCTCAAGGCGCGGGTTACGGCGTATCGGGTATCTCACATACAGGTGACATTTGGAACGGCATCAATCTAGAAATCGCACTGGCAACAACAACGCAACGCGGTACCCTAGAAACAGCGACTGAAACAGAAGCTAAAGTTCAGCAAACGTGGAACGGTACGTCTTGGGACGGCACAGCAGCAGCAGCCGATAAAATTGTCACACCATTGACACTTGATCGCCGTCGTGCCACTGAAACACAATACGGTCTTGCACGTCGTGCAACAAATGCTGAAATTGACACTGCGACAATCGGTGGCGTTGATAACACACCAGTTTACGTATCGCCAAAAGACTTGCTTCGTTGGACTCGTACTTCTACGAATTCACGTTCTGATGAAACACGCTTCGGTGTTGTTCGTCTAGCTACGCCAGCAGAAACATTCGTTGGTAACAGCACTGACGGTTCAACTCAAGCATATACAGCTTACTTGCGTACACCGTATGCAGTTACGCCGTACAGCTTGAATTATGCATTGCGCAACTACTTGCCATTGAATGCAAAGGCTGATGACTCAGAATTGCTAGATGGTTTAGACAGTACTCAGTTTGCTCGTCGTGATATTAATCAAACGATCAACGGAACTTATACGTTCAATGCTAAAAACGTCGAAATTAATGCAGGTGGCTGGCTTCAAGTACAGAATGCACCGACTGGTGATATTGTTAAGCTAGATTGGTTTGATTCTGCTCCCCGCATTCGCGTCGGGGGAAGCGGTGCTTCATCAACTGCTACGTTCTCGATTCAAGGCGCGGCTGATTTTGTTCGCTGGCAAGTTAATTCGTCTGGTTATACTACACAAGCAAGTGGTGCGACTTTCGGTAGCACAGTTACTGAAAACGAATCAAGCGCAAACGTTGATGCAACATACGGGACTTATTCAAGCCCAGCAGCAGGTACACTTCGTCAGAAGTACTTGGGTATCAATAACGTAGCAAAAGCGGCTGAGAAGTGGGTTACAGCGCGTACAGTGACGTTCACTGGCGACTTGACTGGTAACTTCACAATTGACGGAAGCGGAAACGTTTCTACAAACGTGCAAGTTAACGACAATAGTCACAATCACTCAGGTGAGAACATCACGAGCGGTACGATCTCGAACGACCGACTAATCAAGTCAAGTCGTACGAACCCAGGTATTGTTCAAGTAACAAGTGATGTACGTACAGCAGACCCAGTGAATGCTTCAGACCCACACCAAGCTCTATCGGCTGGTGCAGGTAAGACTCTATCTGAGCGAATTGACTTGTTCACGCCAGATGGCGGTACTGGTGACAACGTTAAATACAGAGACTACATTCAAGTTGGCTCTGTAAGAATGTCAACAAACAATCAAGGCGTGCTGGAGTTCACATTCGGTCACGCAATTTAA

Genome Context

Tertiary structure

PDB ID

c2a01d07b26d323e741e1083e7a1cbb0285c8cafe3fe916e8c6c725e2eecac7f

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5321

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence