Protein

View in Explore

UniProt accession

E5EQ25 [UniProt]

Protein name

Gp34 long tail fiber proximal subunit

RBP type

Evidence UniProt/TrEMBL

Probability 1,00

Evidence RBPdetect

Probability 0,55

Protein sequence

MVGINTSFRASYGLDAAGEKVINVALADKSVLTDGVNVEYLIQENTIQQYDSARGYTKSFAVIFNNRIWLAKNPIAKPAGVFNETLWSPLRTDPKWYPVDSGVRQLQVGDYITVDTAQGNPVELTLPSDAQDGDNIVIKDVGGFAGISSVIVKAGIQSIIDKGVRIKTAQMTVPFSEWVFVYVNKLWNLYNGSEADLGRFLKPSATPQQIQAGETIIRQYDRQSPIILKFPKYANNGDMIHFVGMDNNSVPYFHLELQSFDATSSVVRPGTTSTIIQRSLSGYFIYSEEFKTWLLFDADMTDRLRTVSSDTNLFPNETVSVVGSSNDVVAPITLTLPQNVSPGDQITIALNYMRLGQTVNIVPGGTDKILTTKELTQFPKRSTYPPVGNWVNTTKLTYSGKDDYPPVITLAYIDMGPIKQWLVVDSVPALERVDSLNNDTRARLGVIALANATQAQVDHENSPNTDTAITPELLAKRVATEEIRGIAKIAKQADVNKPSDDPSYADDLIVTPKKLDAKKASETMRGLAEIATQTETNTNSNDTHIITPKKLDGRRATANLSGVVQLVETGGTSSTARNDAGTGVFNYADNARVVTPTTLREFKASETQQGTGFLALGAEVIAGTPNPAGIPLLVTPEQLHKKTAQEDRIGFTQTATQTQVTAGTDDFTYVSPKKLAARISTESLAGIAKIATQIEFNDGTPGMIAAPDKIKDFFSQPGRTSVVPESGLTQSGNIWTTTRFDIVAASESQRGTLKLATQPQTDAGTDDTTAITPKKLHAKKATGNTEGIIRIARADETTAGTSDVLAVCPLNLKNTIQVEKTWEAQTTVRGTVKMTENALTFVGNDVSGSTANLETYLKTGYAISPYELNKTLLNFMPRKAKAVDSDLLDGLDSSQFIRRDIDQVVNGTLDLAKNFSVVGTSSLSGMVNIGKNGDGTFETDKTRIRLKTPKWDAEWLHTLNDSQLSSVAKYSIGYNNAKTITMHGADSGANILQVHGELNADKSVNVADSLNVTRHVYVANGSYWHGDKTVIAKGTDPNNLLLGNTEQTTYVRTIDANNLMTQDAGNNYKILNQKNMNAILDPIYVNAAGDSMTGRLNISAPITASILESQALVNNAPSANNFGTWTLSVTSSTVYNLLPGYVVGVPEINNETGLPTGYIDHYDEFKGPGTLSQMGSSASNGIGTYQIWAPRPASNTVGHMAQTFWTRQWNPVTSKWDGWGRMYTSNNPPTAKDIGAMSDNGSVFSSLRIRDWIQIGNLRIYADPATKNVRFDWID

Physico‐chemical properties

protein length:	1275 AA
molecular weight:	138451,68910 Da
isoelectric point:	5,57752
aromaticity:	0,07451
hydropathy:	-0,30863

Domains

Domains [InterPro]

DC_1986
ATT
11–135

DC_1986 DC_1209

IPR048391
ATT
1117–1223

IPR048391

E5EQ25

1 1275

Architecture

ATT

STR

ATT

STR

ATT 11-135 | STR 344-1116 | ATT 1117-1223 | STR 1224-1262 |

Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_1986	ATT	DC_1986	11	135	Novel HMM	DC_1986	N-terminal	Low	Positional only	693 proteins / 693 hits
DC_1209	STR	DC_1209	344	1262	Novel HMM	DC_1209	Central	Low	Positional only	904 proteins / 904 hits
IPR048391	ATT	DC_0875	1117	1223	InterPro cluster	Long-tail fiber proximal subunit domain	C-terminal	Medium	Text match	795 proteins / 796 hits

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Acinetobacter phage Acj9 [NCBI]	760939	Uroviricota > Caudoviricetes > Pantevenvirales > Twarogvirinae > Acajnonavirus
Host	Acinetobacter johnsonii [NCBI]	40214	cellular organisms > Bacteria > Pseudomonadati > Pseudomonadota > Gammaproteobacteria > Moraxellales

Coding sequence (CDS)

Genbank protein accession

ADG60141.1 [NCBI]

Genbank nucleotide accession

HM004124 [NCBI]

CDS location

range 155533 -> 159360
strand +

CDS

ATGGTTGGAATCAATACATCATTTCGTGCGTCGTACGGTCTTGATGCAGCAGGTGAAAAAGTCATCAATGTTGCATTGGCAGACAAGTCAGTACTGACAGACGGCGTCAATGTCGAATATCTCATTCAAGAAAACACAATCCAACAGTACGATTCTGCACGTGGCTATACCAAATCTTTTGCGGTCATTTTTAATAACCGAATTTGGCTTGCAAAAAATCCTATTGCAAAACCTGCAGGTGTATTCAATGAAACACTTTGGTCACCATTACGTACGGACCCTAAATGGTATCCAGTTGACAGTGGCGTTCGTCAACTGCAAGTTGGTGACTACATCACTGTTGATACAGCACAAGGTAATCCAGTTGAATTGACTTTGCCATCCGATGCACAAGATGGTGACAACATTGTCATCAAAGATGTTGGTGGATTTGCAGGTATCTCTAGCGTTATTGTTAAAGCTGGCATTCAGTCAATCATCGACAAAGGTGTGCGTATTAAAACTGCGCAAATGACTGTGCCATTCTCTGAATGGGTATTTGTGTATGTCAATAAATTGTGGAACCTGTACAACGGCTCAGAAGCAGATTTAGGACGATTCTTAAAACCTTCTGCGACTCCACAACAAATTCAAGCAGGCGAAACAATCATTCGCCAATACGATCGCCAATCGCCAATCATTTTAAAATTCCCGAAATATGCAAACAACGGTGACATGATCCACTTTGTGGGCATGGACAACAACTCTGTGCCATATTTCCATTTAGAACTTCAATCATTTGATGCAACATCAAGTGTTGTTCGTCCAGGCACTACCTCTACGATTATCCAACGTTCATTGTCAGGGTATTTTATCTATAGCGAAGAATTTAAAACTTGGCTATTATTTGATGCGGATATGACGGATCGTTTGCGTACAGTTTCATCAGACACTAATTTGTTCCCTAATGAAACTGTGTCTGTTGTAGGTTCAAGTAATGATGTTGTAGCTCCTATCACGTTGACATTACCTCAAAACGTATCACCAGGCGACCAAATCACTATTGCGTTGAATTATATGCGCCTTGGACAGACAGTCAATATTGTTCCTGGTGGCACAGATAAGATTTTGACCACAAAGGAATTAACACAATTTCCAAAGCGCTCGACGTATCCTCCTGTCGGGAATTGGGTCAACACCACTAAATTAACATATAGCGGTAAAGATGATTATCCACCTGTAATCACTCTTGCGTATATTGATATGGGACCTATCAAACAATGGCTTGTTGTTGACAGTGTACCGGCATTAGAACGTGTGGACTCTTTGAATAATGATACACGTGCACGCCTAGGTGTTATTGCATTAGCTAATGCAACTCAAGCCCAAGTTGATCATGAGAATTCTCCTAACACTGACACTGCAATCACTCCTGAACTTTTAGCGAAACGCGTTGCAACTGAAGAAATCCGCGGTATTGCTAAGATTGCAAAACAAGCCGATGTCAATAAGCCATCAGATGACCCATCTTATGCAGACGACTTGATCGTGACGCCTAAGAAGCTTGATGCAAAGAAAGCTTCTGAAACGATGCGAGGCCTTGCAGAAATTGCTACACAAACTGAAACAAATACAAACTCTAATGATACTCACATCATTACGCCTAAGAAACTTGACGGGCGACGTGCAACAGCTAATTTATCTGGTGTAGTTCAATTGGTTGAGACAGGTGGAACTTCTTCAACAGCACGCAATGATGCCGGAACTGGTGTGTTTAACTATGCAGACAATGCCCGTGTTGTAACTCCAACAACTTTGCGAGAATTCAAAGCGTCCGAAACTCAACAAGGCACTGGCTTCTTGGCATTAGGCGCAGAAGTTATTGCAGGTACACCTAACCCTGCGGGAATTCCTTTACTTGTTACGCCTGAACAACTTCACAAGAAAACTGCTCAAGAGGATCGAATCGGCTTCACACAAACCGCAACTCAAACTCAAGTTACAGCAGGAACAGATGATTTCACATATGTTTCGCCTAAGAAATTAGCTGCTCGTATTTCAACCGAAAGTTTAGCTGGTATTGCTAAGATTGCAACTCAGATTGAATTCAATGATGGCACACCTGGCATGATTGCAGCGCCAGACAAAATCAAAGATTTCTTTAGTCAACCTGGACGCACTTCTGTAGTTCCGGAATCCGGTTTAACACAAAGTGGAAATATTTGGACAACAACTAGATTTGACATCGTTGCTGCAAGCGAATCTCAACGTGGTACTTTGAAACTTGCAACCCAGCCTCAAACCGATGCAGGCACAGATGATACTACCGCGATTACTCCTAAAAAGTTACATGCAAAGAAAGCTACAGGCAACACAGAAGGTATCATCCGTATTGCACGAGCTGATGAAACTACTGCTGGCACGTCAGATGTATTGGCCGTATGCCCTCTCAACTTGAAAAATACAATCCAAGTTGAAAAGACTTGGGAAGCACAAACCACTGTTCGTGGCACAGTGAAGATGACTGAAAACGCATTAACATTTGTTGGTAATGATGTATCTGGTTCGACTGCAAACCTAGAGACATATTTGAAAACTGGCTATGCGATTTCGCCATACGAGTTGAACAAAACCCTGTTGAACTTTATGCCTCGCAAAGCAAAGGCGGTTGATTCTGATTTGTTAGATGGGCTTGATTCGTCTCAATTCATTCGTCGTGACATTGATCAAGTTGTCAATGGTACGTTGGATTTGGCCAAGAATTTTTCTGTGGTTGGCACATCATCATTAAGCGGTATGGTCAACATCGGTAAAAATGGCGATGGTACATTTGAAACTGACAAGACTCGGATCCGTTTGAAGACACCTAAGTGGGATGCTGAATGGCTTCACACATTAAATGATTCGCAATTGAGTTCTGTTGCCAAGTATTCAATCGGGTATAACAATGCTAAAACGATTACAATGCATGGTGCTGATTCTGGGGCGAATATTCTTCAAGTACACGGGGAATTGAACGCTGATAAATCGGTCAATGTTGCAGACTCATTGAATGTTACACGTCATGTGTATGTGGCAAATGGATCATATTGGCACGGTGACAAAACGGTCATTGCTAAAGGCACTGATCCAAATAACTTATTGTTAGGCAACACAGAACAAACCACATATGTACGAACAATCGATGCTAACAATTTGATGACTCAAGATGCTGGAAATAATTACAAAATCTTGAACCAGAAAAACATGAATGCGATTTTAGATCCGATTTATGTTAATGCAGCTGGCGATTCTATGACTGGGCGTTTGAATATTTCTGCACCTATTACTGCGTCAATTCTTGAATCTCAGGCATTAGTTAATAATGCACCAAGTGCAAACAACTTCGGAACATGGACATTAAGTGTTACTTCTTCTACAGTTTACAACTTATTGCCTGGCTACGTTGTGGGTGTACCTGAAATCAACAATGAAACTGGTTTGCCTACTGGTTACATTGATCATTATGATGAATTCAAAGGGCCTGGTACATTATCTCAAATGGGTTCATCTGCTTCTAATGGCATAGGAACATACCAAATTTGGGCTCCACGTCCTGCTTCGAATACTGTTGGACATATGGCTCAGACGTTCTGGACTCGCCAATGGAACCCTGTTACAAGCAAATGGGATGGATGGGGACGTATGTACACATCTAACAACCCTCCAACAGCTAAAGATATCGGAGCAATGTCTGATAACGGATCGGTTTTCTCGTCATTGAGAATTCGCGACTGGATCCAAATCGGAAACTTACGCATCTATGCTGATCCTGCTACTAAGAATGTTCGATTCGATTGGATTGATTAA

Genome Context

Tertiary structure

PDB ID

c95b0925036cc15edb40f96e177288b20cd1af10d7cfd72b66b29067623160ef

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,5405

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence