Phage RBP Database

Genbank accession

VUF56014.1 [GenBank]

Protein name

hypothetical protein

RBP type

TSP

Evidence DepoScope

Probability 1,00

TSP

Evidence RBPdetect

Probability 0,84

TSP

Evidence RBPdetect2

Probability 0,61

Protein sequence

MATLKQIQFKRSKTAGARPAASVLAEGELAINLKDRVLFTKDDQGNIIDLGFAKGGSIDGNVIHTGNYNQTGDYILNGVFTQTGNFNLTGIARVTRDIIAAGQIMTEGGELITKSSGTAHVRFFDNNSRERGIIYAPANDGLTTQVLNIRVQDYAAGSESTYAFSGSGLFTSPEVSAWKSISSPQILTNKVITNNKSTGDYDIYSMADNVPLSESTTAINHLRVMRNAVGSGIFHEVKDNDGITWYAGDGLDTYLWSFTWSGGIKSSHSISIGLTPGNKDYSILGPSSIALGDNDTGFKWHQDGYYFSVNNGTKTFLFSPSETTSLRKFVAGYSTNGTDLTTPPTENYALATVVTYHDNNAFGDGQTLLGYYQGGNYHHYFRGKGTTNINTHGGLLVTPGNIDVIGGSVNIDGRNNASTLMFRGNTTGSSSVDNMTISVWGNTFTNPSEGTRKNVMEISDATSWMSYIQRTTAGKVESVINGTQIVNENLTVVKNATFDGTISAAGEIATNAVNGLRIWNADYGAIFRRSEGSLHIIPTAYGEGKYGDIGPLRPFSMALDTGKVTIPDLQSSYNTFAANGYIKFVGHGAGAGGYDIQYVQAAPIFQEIDDDAVSKYYPIVKQKFLNGKSVWSLGTEINSGTLVIHHLKEDGSQGHTSRFNQDGTVNFPDNVQVGGGEATIARNGNIFSDIWKSFTSAGDTTNIRDAIATRVAKEGDTMTGKLIIRRDSDAINLAAPSATDASYLLSTGGGENQWYIGKGGADNTVSFYNYKTNGAVQINSIGEIALIPQGAATFNFNRDRLHINGTQWTAHQAGDWGNQWRQEAPIFVDFGSVGNDSYYPIIKGKSVITNEGYVSGVDFGMRRIPNNWAQAIIRVGNQENASDPQAIFEFHYNGNMYVPDMVKAGVRISAGGGDPVWTGACVVIGDNDTGLVHGGDGRINMVANGMHIASWSSAYHLHEGLWDTTGALWTEQGRAIISFGHLVQQSDAYSTFVRDVYVRSDIRVKKDLVKFENASEKLSKINGYTYMQKRGLDEEGNQKWEPNAGLIAQEVQAILPELVEGDPDGEALLRLNYNGIIGLNTAAINEHTAEIAELKSEIEELKALVKSLLK

Physico‐chemical properties

protein length:	1110 AA
molecular weight:	119979,67790 Da
isoelectric point:	5,46077
aromaticity:	0,09550
hydropathy:	-0,31396

Domain architecture

VUF56014.1

1 1110 aa

ATT 449–555 · STR 728–782 · CHP 1000–1098 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR048390
ATT

IPR048390 G3DSA:6.20.80.10 IPR030392

IPR030392
CHP

IPR030392 Coil

VUF56014.1

11110 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0538
STR

DC_0538 DC_2083

DC_0339
STR

DC_0339

VUF56014.1

11110 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR048390	ATT	DC_0836	449	555	InterPro cluster	Long-tail fiber proximal subunit, trimerization domain	C-terminal	Medium	Text match	656 proteins / 656 hits
G3DSA:6.20.80.10	STR	G3DSA:6.20.80.10	728	782	Merged direct domain	G3DSA:6.20.80.10	Central	Low	Positional only	37 proteins / 37 hits
IPR030392	CHP	DC_0088	1000	1098	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
IPR030392	CHP	DC_0088	1000	1059	InterPro cluster	Intramolecular chaperone auto-processing domain	C-terminal	High	Text match	3502 proteins / 3959 hits
Coil	Unmapped	-	1084	1104	Coils	Coil	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

VUF56014.1

1 1110 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	215	215	0,2520
Central domain	216	414	200	0,3624
C-terminal	415	1110	695	0,7391

Note: Constraints were applied during segmentation.
Fixed 169 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Escherichia phage T4_ev151 [NCBI] · taxon 2742944

Viruses Duplodnaviria Heunggongvirae Uroviricota Caudoviricetes

Host No host information

Genbank protein accession

VUF56014.1 [NCBI]

Genbank nucleotide accession

LR597660 [NCBI]

CDS location

range 153959 -> 157291
strand +

CDS

ATGGCTACTTTAAAACAAATACAATTTAAAAGAAGCAAAACTGCAGGAGCACGTCCTGCCGCTTCAGTATTAGCCGAAGGTGAATTGGCTATAAACTTAAAAGACCGTGTACTTTTTACTAAAGATGACCAAGGAAATATTATTGATCTGGGTTTTGCTAAAGGCGGTAGTATTGACGGGAATGTTATTCATACAGGCAATTATAACCAAACTGGCGATTATATTTTAAATGGTGTCTTCACTCAGACTGGTAATTTTAATTTAACCGGTATTGCTCGAGTAACTCGCGATATTATTGCCGCTGGGCAGATTATGACTGAAGGCGGAGAACTTATTACAAAAAGTTCAGGTACAGCGCATGTTCGTTTTTTCGATAACAATAGTCGCGAACGCGGAATCATTTATGCCCCGGCTAATGATGGTTTAACTACACAAGTACTTAATATCAGGGTTCAAGACTACGCCGCTGGTAGCGAAAGCACTTATGCATTTTCAGGCAGTGGACTATTTACTTCACCTGAAGTATCAGCATGGAAATCTATTTCGTCTCCACAAATTCTAACCAACAAAGTCATTACTAATAATAAATCTACGGGTGATTATGACATCTATTCGATGGCAGACAATGTTCCATTGTCTGAAAGCACTACTGCTATTAATCATCTTCGTGTCATGCGTAATGCCGTTGGTTCTGGTATTTTCCATGAAGTTAAAGATAATGATGGAATAACTTGGTATGCAGGTGATGGACTTGACACCTATCTTTGGTCATTTACTTGGAGCGGCGGAATTAAATCAAGTCACTCAATTTCTATTGGTTTAACACCTGGTAATAAAGATTATTCAATATTAGGACCATCTAGTATTGCTTTAGGAGATAATGATACTGGATTTAAATGGCATCAAGATGGATATTATTTTAGCGTTAATAATGGAACAAAAACGTTTTTATTTAGTCCTAGCGAAACAACTAGCCTAAGAAAATTTGTAGCTGGATATTCTACTAACGGAACCGATTTAACTACTCCTCCAACTGAAAACTATGCTCTCGCTACTGTCGTGACATATCACGATAATAACGCGTTTGGAGATGGTCAGACTCTTTTAGGATATTATCAAGGCGGTAACTATCATCATTATTTCCGCGGCAAGGGTACCACAAACATTAATACTCACGGCGGTTTGTTAGTTACTCCTGGTAATATTGACGTTATTGGTGGTTCTGTTAATATCGATGGTAGAAATAATGCTTCTACACTGATGTTTAGAGGTAACACAACTGGTAGCAGTTCAGTTGATAATATGACAATTTCCGTGTGGGGTAATACCTTTACTAATCCTAGCGAAGGCACCCGTAAAAATGTCATGGAAATTTCTGACGCAACTAGTTGGATGAGCTATATTCAACGAACAACTGCAGGTAAAGTCGAATCGGTTATAAATGGCACCCAGATTGTTAATGAAAACTTGACAGTAGTAAAAAATGCTACATTTGACGGTACAATCAGCGCAGCCGGTGAAATCGCGACAAATGCTGTAAATGGTCTTCGCATTTGGAACGCAGATTATGGAGCTATTTTTAGACGTTCAGAAGGAAGTCTTCATATTATTCCAACTGCTTACGGTGAAGGTAAATATGGCGATATCGGTCCACTTCGCCCGTTTAGTATGGCTTTAGATACTGGTAAAGTTACTATTCCAGATTTACAATCAAGTTACAATACGTTCGCTGCTAACGGTTATATTAAATTTGTTGGTCATGGAGCGGGTGCCGGCGGTTATGACATTCAATATGTTCAAGCGGCTCCTATTTTCCAGGAAATCGATGATGATGCTGTAAGCAAATATTATCCTATTGTTAAACAGAAGTTTCTAAACGGTAAATCCGTTTGGTCTTTAGGTACTGAAATTAATTCGGGTACATTGGTTATTCATCATCTGAAAGAAGATGGATCACAAGGCCATACGTCTCGTTTTAATCAAGACGGTACTGTTAACTTCCCTGATAACGTTCAGGTCGGCGGCGGTGAAGCTACTATTGCTCGTAATGGTAATATTTTCTCGGATATTTGGAAATCGTTCACTTCAGCAGGAGACACTACAAATATTCGTGACGCAATAGCTACCCGTGTTGCCAAAGAAGGTGATACGATGACCGGCAAGTTGATTATTAGAAGAGATTCTGACGCTATTAACTTAGCTGCGCCTTCAGCAACTGATGCAAGTTACCTTCTTTCTACTGGCGGTGGAGAAAATCAATGGTATATTGGTAAAGGCGGCGCTGATAATACTGTATCATTCTACAACTATAAAACCAACGGGGCTGTGCAAATTAACTCTATTGGTGAAATCGCGCTGATTCCACAAGGTGCTGCAACATTTAACTTTAACCGCGATCGTCTCCATATAAATGGGACTCAATGGACTGCACATCAAGCTGGTGACTGGGGTAACCAATGGCGTCAAGAAGCTCCTATATTTGTGGATTTTGGTAGTGTCGGTAATGATAGTTATTATCCTATTATTAAAGGAAAATCTGTTATTACGAATGAAGGATACGTATCTGGTGTTGATTTCGGTATGCGACGCATTCCTAATAACTGGGCTCAGGCTATTATCCGTGTTGGTAACCAGGAAAATGCTAGCGATCCGCAAGCTATCTTCGAATTCCACTATAATGGAAACATGTACGTTCCTGACATGGTTAAAGCTGGAGTAAGAATATCAGCTGGTGGAGGTGACCCTGTATGGACAGGCGCATGTGTTGTTATTGGTGATAATGATACCGGATTAGTTCATGGTGGTGACGGCCGAATCAATATGGTTGCAAATGGAATGCATATTGCTTCATGGTCGTCCGCTTACCATCTCCATGAAGGTCTTTGGGATACCACTGGTGCTTTGTGGACTGAACAAGGAAGAGCTATTATTTCTTTTGGTCATTTAGTCCAACAGAGCGATGCCTATTCCACATTTGTTCGAGATGTTTATGTCCGTTCTGATATTCGTGTTAAAAAAGACCTTGTTAAATTTGAAAATGCTTCTGAGAAGCTTTCCAAAATTAACGGTTACACTTATATGCAGAAGCGAGGCCTAGATGAAGAAGGCAATCAGAAATGGGAACCTAACGCCGGTTTAATTGCTCAAGAAGTTCAAGCTATTTTACCAGAATTAGTTGAAGGTGACCCTGATGGCGAAGCTTTACTTCGTTTGAACTATAACGGTATAATTGGTTTAAATACAGCTGCAATCAATGAGCATACTGCAGAAATTGCAGAACTTAAATCAGAAATCGAAGAACTTAAAGCATTAGTTAAATCATTGTTAAAATAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)