Protein

View in Explore

Genbank accession

YP_009804427.1 [GenBank]

Protein name

tail length tape measure protein

RBP type

Evidence GenBank

Probability 1,00

Evidence RBPdetect

Probability 0,78

Protein sequence

MTDKLIRELLIDVKQKGATRTAKSIENVSDALENAAAASELTNEQLGKMPKTLYSIERAADRAAKSLTKMQASRGMAGITKSIEGIGDKLDDLALAMIEVSEKLESGFTHVGKSVKAMGNDVAAATEKVQDRLYDTNRALGNTARGFNDTTTSAGRASRAIGNTSGSARGATRDFAAMAKVGGSLPLMYAAIASNVFVLQSAFEQLKMGDQLNRLEKFGTIVGTQTGTPVQTLARSLQEAAGYAISFEEAMRQASSASAYGFDAEQLNKFGLVARRAAAVLGVDMTDALNRVIKGVSKQEIELLDELGVTIRLNDAYADYVKQLNAANTGITYNVNSLSTFQKQQAYANAVIAESTKRFGYLDDVLRATPWEQFAANADAALRKVQQAAAKYLGPVIDSINAVFYTSQASISASAARAQEETNRQIDPTNVGAVALSLSASEEGYNKALDMYKESLEKRNKLKADLDKRMQQADASTAGAIRLVAQGAPVGLAAGGFEVGGVRIGSSEENQKFIADTAALALQVERLDKEVEDSTGNLNAWKSAYQAAGAAAAKSNTEFQKQINLQKDANDPDAVYDFNSATLKGLTEQQKAYDQAKKTASDLANDIQNIAQNTNTAAKTSASLSDTIKTIESLSAGTGKNADEYVKSLNLGYNTLSEMKTASQALAGYVKLTGNETKNQLEVQQKIAEVYNQTKDKEKAQEAGRRLEIQQLEEQEAALKRVLETNKGNKAIEGEIAKIQLERIKITNQGMEAQKKVKDYTDKILGVDREIALLNNRTMTDTQYRLAQLNLELTVEKEKYEWYSKQVDKHKEAEQSRRAQAQIEREIWKFRQDQQREMAAGREEEQQRKFTANPLMGAAEHIKEQIQLFEDLKQKTLGNAAAQLEYNKKLAETRAQLAALRVQRDAEMQSSVGAAVGATYTPTTGLTGEDKNFADMQNRMASYDQAISKLSELNSEATAVAQSMGNLTNAMIQFSQGSLDTTSLVAAGMQTVSSMIQYSVGQQVSAIDAAIAAEQKRDGKSEQSKAKIKKLEAEKLKIQQDAAKKQIIIQTAVAVMQAATAVPYPFSIPLMVAAGLAGAMALAQASSASGMSSIGDSGAETAGYLTLGERQKNVDVSMSANAGELSYIRGDQGIGNANSFVPRAEGGNMYPGVSYQMGEHGTEVITPMVPMKATPTDELKGSSKGTSGRPIVLNISTMDAASFRDFASSNSAAFRDAVEQALNENGTTLKSLGNS

Physico‐chemical properties

protein length:	1235 AA
molecular weight:	132837,58120 Da
isoelectric point:	5,81624
aromaticity:	0,05263
hydropathy:	-0,43036

Domains

Domains [InterPro]

IPR056207
TAS
1–81

IPR056207 DC_0073 IPR056208

Coil
Unmapped
586–613

Coil Coil Coil

YP_009804427.1

1 1235

Architecture

TAS

STR

TAS

TAS 1-81 | STR 82-1197 | TAS 1198-1233 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR056207	TAS	DC_0547	1	81	InterPro cluster	Tape measure protein PB2, N-terminal	N-terminal	High	Text match	97 proteins / 97 hits
DC_0073	STR	DC_0073	82	1197	Novel HMM	DC_0073	Central	Low	Positional only	97 proteins / 97 hits
Coil	Unmapped	-	586	613	Coils	Coil	-	-	-	-
Coil	Unmapped	-	709	729	Coils	Coil	-	-	-	-
Coil	Unmapped	-	1021	1041	Coils	Coil	-	-	-	-
IPR056208	TAS	DC_0881	1198	1233	InterPro cluster	Tape measure protein PB2, C-terminal	C-terminal	High	Text match	95 proteins / 95 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage LVR16A [NCBI]	2041204	Uroviricota > Caudoviricetes > Demerecviridae > Epseptimavirus > Epseptimavirus LVR16A
Host	Salmonella enterica subsp. enterica serovar Kentucky [NCBI]	192955	Pseudomonadota > Gammaproteobacteria > Enterobacterales > Enterobacteriaceae > Salmonella > Salmonella enterica

Coding sequence (CDS)

Genbank protein accession

YP_009804427.1 [NCBI]

Genbank nucleotide accession

NC_048000 [NCBI]

CDS location

range 104626 -> 108333
strand -

CDS

ATGACTGATAAGCTAATACGAGAACTACTTATAGATGTAAAGCAGAAAGGGGCAACCCGTACTGCAAAATCTATTGAGAACGTTTCCGATGCGTTAGAAAATGCTGCTGCCGCTTCCGAACTGACTAATGAGCAGTTAGGAAAAATGCCCAAAACTCTTTACTCCATTGAGAGGGCGGCGGATAGAGCAGCTAAAAGTCTAACTAAAATGCAGGCTAGTAGAGGTATGGCTGGTATCACTAAATCCATTGAAGGTATTGGTGATAAGCTAGATGATCTTGCCCTTGCTATGATCGAAGTATCTGAGAAGCTAGAGTCTGGATTTACACATGTGGGTAAATCTGTTAAGGCTATGGGTAACGATGTAGCTGCTGCAACCGAAAAAGTTCAAGATAGATTATATGATACTAACCGAGCACTAGGCAATACTGCTAGAGGCTTTAACGATACAACTACCTCCGCAGGACGTGCTAGTCGTGCAATTGGTAATACTTCTGGTTCAGCACGTGGTGCTACTCGTGACTTCGCAGCAATGGCTAAAGTGGGTGGTAGTTTACCTCTTATGTATGCTGCTATCGCGTCTAACGTGTTCGTTCTACAATCTGCATTCGAACAACTTAAGATGGGTGACCAGTTAAACCGTCTTGAGAAGTTTGGTACTATTGTTGGTACTCAAACAGGTACTCCTGTACAAACTCTAGCTAGATCTCTACAAGAGGCTGCTGGTTATGCAATCTCCTTCGAAGAAGCAATGAGACAGGCATCCTCTGCTTCTGCATATGGATTCGATGCTGAACAACTTAATAAATTTGGTCTAGTAGCTCGTCGTGCTGCTGCTGTTCTTGGTGTTGATATGACTGATGCACTTAACCGTGTAATCAAGGGCGTATCTAAACAAGAAATCGAACTTCTGGACGAACTTGGTGTTACTATTCGTCTTAACGATGCTTACGCAGACTACGTTAAACAGTTAAATGCTGCTAACACAGGTATTACATATAACGTTAATAGTCTCTCTACTTTCCAGAAGCAACAAGCATATGCTAACGCAGTTATCGCTGAATCTACTAAACGTTTCGGCTATCTTGATGATGTACTTCGTGCAACCCCCTGGGAACAGTTTGCTGCTAATGCTGATGCTGCACTGAGAAAGGTTCAACAGGCTGCTGCTAAGTATTTAGGGCCAGTAATTGATTCTATCAACGCAGTATTCTATACTTCTCAAGCATCTATCTCGGCCTCTGCTGCTAGAGCACAGGAAGAAACTAACCGTCAGATTGACCCAACTAACGTTGGTGCTGTAGCTTTAAGTCTTTCCGCTTCTGAGGAAGGATATAATAAAGCTCTTGATATGTACAAAGAATCTCTAGAAAAGCGTAATAAGTTAAAAGCTGATCTAGATAAGCGTATGCAGCAAGCAGATGCATCTACAGCAGGGGCTATTCGTTTAGTTGCTCAAGGTGCACCGGTAGGGTTAGCTGCAGGAGGTTTTGAAGTAGGAGGAGTTCGCATAGGATCTTCTGAAGAAAACCAGAAATTCATTGCAGATACTGCTGCATTAGCTCTCCAGGTAGAGCGTCTTGATAAGGAAGTAGAGGATTCAACTGGCAATCTTAATGCATGGAAATCGGCATACCAAGCTGCTGGTGCTGCCGCAGCCAAATCTAATACAGAATTCCAGAAGCAAATTAACCTACAGAAAGATGCAAATGACCCGGATGCGGTTTATGACTTTAACTCTGCAACTCTGAAAGGATTGACAGAACAGCAGAAAGCGTATGACCAAGCCAAGAAAACTGCCAGTGACTTAGCTAACGATATCCAGAACATTGCTCAGAATACTAATACTGCGGCTAAAACTAGTGCATCCTTATCAGATACGATTAAGACTATTGAGTCTCTGTCCGCGGGTACTGGTAAAAATGCTGATGAGTATGTTAAGAGCCTGAATTTAGGGTATAATACTCTTAGTGAGATGAAGACTGCTTCACAAGCTCTTGCTGGTTACGTAAAATTAACTGGTAATGAGACTAAGAATCAGTTAGAAGTTCAGCAAAAGATTGCAGAAGTATACAACCAGACTAAGGACAAAGAGAAAGCACAGGAAGCTGGTAGACGTCTGGAAATCCAACAGTTAGAAGAACAGGAAGCAGCTCTTAAGCGTGTCCTAGAAACTAACAAAGGTAACAAAGCAATCGAAGGTGAAATAGCTAAGATTCAGTTAGAACGTATCAAGATTACTAACCAGGGTATGGAAGCTCAGAAGAAGGTTAAGGACTATACCGATAAGATTCTTGGTGTTGATCGTGAAATTGCTCTCCTGAATAACCGTACTATGACAGATACTCAATATCGTTTAGCTCAGTTGAATCTTGAACTGACTGTCGAGAAAGAAAAGTATGAATGGTACTCCAAACAGGTTGATAAGCATAAGGAAGCTGAACAATCAAGACGTGCTCAGGCACAAATTGAACGTGAAATCTGGAAATTCCGTCAGGATCAGCAAAGGGAAATGGCTGCTGGCAGGGAAGAGGAGCAACAAAGGAAGTTTACTGCAAATCCTTTAATGGGAGCTGCGGAACATATCAAGGAGCAAATCCAGCTATTCGAAGACCTTAAGCAAAAAACTTTAGGGAATGCTGCTGCTCAGTTAGAGTATAATAAAAAGCTAGCAGAAACTAGAGCCCAGCTCGCAGCTTTAAGAGTACAGCGCGATGCAGAAATGCAGTCTTCTGTAGGTGCGGCTGTAGGGGCTACCTATACTCCTACTACTGGATTAACTGGAGAAGATAAAAACTTCGCAGATATGCAGAATAGAATGGCGTCCTATGACCAGGCTATTTCTAAGCTGTCTGAACTGAACTCCGAAGCAACTGCTGTAGCACAAAGTATGGGTAACCTAACTAATGCTATGATCCAGTTCTCTCAAGGATCTCTGGATACTACCTCTCTAGTAGCGGCTGGTATGCAAACTGTATCTTCAATGATTCAGTATAGTGTTGGTCAACAGGTAAGTGCTATTGATGCAGCTATTGCAGCAGAACAGAAACGTGATGGTAAATCTGAGCAATCTAAAGCTAAGATCAAGAAGTTAGAGGCTGAAAAGCTCAAGATCCAGCAAGATGCAGCTAAGAAGCAAATCATTATCCAGACGGCAGTAGCGGTGATGCAGGCAGCAACAGCTGTTCCGTATCCATTCTCTATTCCTCTGATGGTTGCGGCTGGTTTAGCAGGTGCTATGGCTCTTGCTCAAGCATCTTCTGCATCTGGTATGTCTTCTATTGGGGACTCTGGTGCTGAGACAGCTGGTTACTTAACTCTTGGAGAACGCCAGAAGAATGTAGACGTTTCTATGTCGGCTAATGCAGGTGAACTTTCTTATATTCGAGGAGATCAAGGGATTGGTAATGCTAACTCTTTCGTACCTCGTGCAGAAGGTGGTAATATGTATCCTGGAGTTAGTTACCAGATGGGTGAGCATGGTACCGAAGTAATCACTCCTATGGTTCCGATGAAGGCTACCCCTACTGATGAACTCAAAGGATCTTCAAAAGGCACATCGGGTAGACCTATTGTGCTGAACATCAGTACGATGGATGCGGCTAGCTTCCGAGATTTTGCTTCGAGCAATAGTGCTGCTTTCAGGGATGCCGTGGAACAGGCTCTTAATGAGAATGGAACCACCCTGAAATCACTTGGTAATTCTTAA

Genome Context

Tertiary structure

PDB ID

38de4ecfca86534ee20007005c7922627517d964d51ce425ca782d7a0aa07908

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6232

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence