Phage RBP Database

UniProt accession

A0A8S5NVC4 [UniProt]

Protein name

Tail protein

RBP type

TSP

Evidence RBPdetect

Probability 0,80

TF

Evidence RBPdetect2

Probability 0,49

Protein sequence

MIRLVIARNPFDLTTKQETIVPFVEGKKLNQYFTEPGEWVHSINGELVDDTASPTDEAYVVVLPKLEKQAFAILLSIGLSIATAGIASGAIFGITSVLGRTLAAMAIGMIGNAIISKIAAPKTDNSNTEQSATYGWQGAQTIIGQGHPLAITYGKCKSAGMLISRHVTSDGEKQYLNLLYCAGEGPIDAITDVKLNGNPIGNYKEVQLDVRLGTNDQEIIPNFNDNYADQPLTYELTNDWSIHQTQGNLSTALEVTISLPNGLYYSNDKGGLSETSVTIEGGYRKVGSAEWIPLPISNNGGQSAMLEKTDNRWFKRNSHSRTSIDNSQYTGVIKDSSNKAIYRVFRFDVKEPGQYEIRMRCAHKDGNSNRHVNKVYWSQLTQIVYDDFIHPGKVLIGIKALATDQLNGNDPNVTWIQERKTVWVFNTYTGAYEAKPANNPAWACYDILHHCRKIGDEYVVKGAPRERFVYDAFKAWADKCDEKHITFNYIYDNASQVWDALKYAENVGRGKVIPLGTRFSCIYDYAATPTQLFTVGNIKMDSFMEEFQATSSRANAIEVSFLNKAKDYERDVLPVFSEEYDVTTSLTSPAQVELMGCVDVDQAYNYAKHYLRANKYEVRTCTFEAFTDAIACTIGDVILLQHDVTDWGQGGRVESAVGNKVTLDREVTFEQGKTYRLMVRNAKTDALESYDVTGVTGKTLTLASNAVIQTDDLYTYGEATKEAKPFRVLSISKSNSEMTRKISCIEYYPELYAGDEGSVPIIDYTTKSDVIKVINLVLLADVKTLKDGTVLCDINGTWQLPRGKVAKNIIVYYKPVTAKEWQQFKVLDGSATSVTIPSVATDVNYDVKIVCTNNTGAAYEGVERAVYVSGKEIPPATPKGFKVTQDAVNSSVLHLSWEPNTEADLHGYTLYDGNDVVLIKHIGGTSYSYFIPNTGNYLFKLSAIDTSGNESGKAEARITASVSAESVATPKAPARGEVKIGKTITAAWDPVENTYIDYYEVRLDSNVGQSNNLLAKTTDIRSEIKLSARRGAVFVYAHNPVKGYGPALRLDYNAAVPKAPTNVKVKGNITGVSVVFDSIPDTCIGANIYIGTEKYFVITNVNMIPHDPGVFDVKVAYVDVFGEGTYSNIIGSSVPASIDPALIDKESLGIKAMDDKIKELTKTANAYSTQVKNLTTNMATQFSQLEDGIDLKLKALNGDELISRINLSSTGTRIDGKLLHVTGQALFDNNIITKRMLAAKAVSADKLNVSSLSAISANLGEVTGGKIIGGTIQNKTGTFKVDANGNIVGANITGSRIDAQSIMQAGFKIRNIDVQIYKVRHGDYCPLLEGFTESQCTFIPVGYKMTEDYSDVTGGTSDGREKWDIANGRRIDDCTIYFQSNISSNYHDTKPTIGLNGRRAVCQSIWYRYFSNRDDDGYHHHISFGELYVLVIGKK

Physico‐chemical properties

protein length:	1435 AA
molecular weight:	157842,12570 Da
isoelectric point:	5,84318
aromaticity:	0,09199
hydropathy:	-0,26544

Domain architecture

A0A8S5NVC4

1 1435 aa

ATT 230–385 · ATT 525–648 · STR 793–968 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

IPR053171
Unmapped

IPR053171 Coil

IPR055385
ATT

IPR055385 IPR032876 IPR013783 IPR013783

NF040662
Unmapped

NF040662 IPR003961

IPR036116
STR

IPR036116

A0A8S5NVC4

11435 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0129
STR

DC_0129

DC_0469
RBD

DC_0469

A0A8S5NVC4

11435 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
IPR053171	Unmapped	-	184	951	InterPro	Viral Tip Attachment Protein	-	-	-	-
IPR055385	ATT	DC_0360	230	385	InterPro cluster	Tip attachment protein J, HDII-ins2 domain	N-terminal	High	Text match	1136 proteins / 1139 hits
NF040662	Unmapped	-	331	753	NCBIfam	host specificity factor TipJ family phage tail protein	-	-	-	-
IPR032876	ATT	DC_0307	525	648	InterPro cluster	Tip attachment protein J	Central	Medium	Text match	1111 proteins / 1112 hits
IPR013783	STR	IPR013783	793	862	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
IPR003961	STR	DC_0003	797	856	InterPro cluster	Fibronectin type III	Central	High	Text match	998 proteins / 1603 hits
IPR036116	STR	IPR036116	797	878	Merged direct domain	Fibronectin type III superfamily	Central	Low	Positional only	52 proteins / 52 hits
IPR013783	STR	IPR013783	874	968	Merged direct domain	Immunoglobulin-like fold	Central	Low	Positional only	144 proteins / 144 hits
Coil	Unmapped	-	1150	1177	Coils	Coil	-	-	-	-

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

A0A8S5NVC4

1 1435 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	283	283	0,6802
Central domain	284	482	200	0,1771
C-terminal	483	1435	952	0,1305

Note: Constraints were applied during segmentation.
Fixed 3 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Myoviridae sp. ctPT18 [NCBI] · taxon 2825098

Uroviricota Caudoviricetes

Host No host information

Genbank protein accession

DAD98689.1 [NCBI]

Genbank nucleotide accession

BK015266 [NCBI]

CDS location

range 31021 -> 35328
strand +

CDS

ATGATTAGATTAGTAATTGCTCGAAACCCATTCGACCTTACCACTAAACAAGAGACCATTGTGCCTTTTGTTGAAGGTAAAAAGCTAAACCAATATTTCACTGAACCAGGTGAATGGGTGCACTCCATAAATGGTGAGTTAGTAGATGATACCGCATCACCTACTGATGAAGCTTATGTAGTGGTATTGCCTAAACTTGAAAAGCAAGCATTCGCTATCTTATTATCTATTGGTTTATCAATAGCGACTGCCGGTATTGCCTCCGGTGCGATATTCGGTATTACTAGCGTATTAGGTCGTACGTTAGCAGCAATGGCTATCGGTATGATTGGTAACGCGATCATATCTAAAATAGCTGCACCTAAGACAGATAACTCTAATACAGAGCAGTCCGCTACTTATGGTTGGCAAGGGGCACAGACTATTATTGGCCAAGGTCATCCTTTAGCCATTACCTATGGTAAGTGTAAAAGTGCCGGTATGCTTATATCTCGCCACGTAACGAGCGACGGTGAAAAGCAATATCTTAACCTCTTATACTGTGCGGGTGAGGGGCCTATTGACGCTATAACGGACGTTAAATTAAACGGTAACCCTATCGGCAACTACAAGGAAGTTCAACTCGATGTAAGACTCGGTACGAATGACCAAGAGATTATCCCTAACTTTAACGATAACTATGCTGACCAACCTTTGACGTATGAGCTTACCAACGACTGGTCAATACATCAAACGCAAGGTAACTTATCTACTGCGTTAGAGGTTACTATATCACTCCCTAATGGTTTGTATTATTCAAATGATAAGGGCGGACTGAGTGAAACGTCAGTCACTATTGAAGGTGGCTATCGTAAAGTAGGCTCTGCAGAGTGGATACCATTACCGATTAGTAACAATGGTGGCCAAAGCGCTATGCTTGAAAAGACAGATAATCGTTGGTTTAAACGGAACAGTCACTCAAGAACGTCTATCGACAATAGCCAATATACTGGCGTTATCAAGGATAGCTCGAATAAAGCTATCTATCGTGTGTTCCGGTTCGATGTAAAAGAACCAGGGCAATACGAAATCCGTATGCGATGTGCACATAAGGACGGTAATTCTAACCGCCACGTAAACAAAGTATACTGGTCACAGTTAACTCAGATTGTCTACGATGACTTTATTCATCCTGGTAAGGTGCTCATCGGTATTAAGGCACTAGCTACTGACCAATTAAATGGTAATGATCCAAACGTAACTTGGATTCAAGAGCGTAAAACAGTATGGGTATTTAACACCTACACTGGAGCGTATGAAGCTAAGCCTGCTAATAATCCTGCATGGGCTTGCTACGATATCCTTCATCATTGCCGTAAGATTGGCGATGAGTATGTAGTTAAAGGTGCTCCTCGTGAGCGCTTCGTATATGACGCATTTAAGGCGTGGGCCGATAAGTGCGACGAGAAGCATATTACATTTAACTACATTTATGACAATGCTAGCCAAGTATGGGATGCACTTAAATACGCTGAGAATGTAGGTAGAGGTAAGGTAATACCTTTAGGTACTCGGTTTAGTTGTATTTATGATTATGCTGCTACACCTACTCAGCTATTTACTGTAGGTAATATCAAAATGGATTCCTTTATGGAAGAGTTCCAAGCTACATCATCTAGGGCAAATGCTATCGAGGTATCATTCCTCAATAAAGCAAAAGACTATGAGCGTGATGTACTTCCTGTGTTTAGTGAAGAGTATGACGTGACTACATCGCTCACCAGTCCAGCGCAAGTCGAACTCATGGGATGTGTGGATGTAGACCAAGCCTACAATTACGCTAAACACTACCTAAGAGCGAATAAGTACGAGGTGCGTACTTGTACCTTTGAGGCTTTCACAGACGCCATAGCGTGTACGATAGGGGATGTAATCCTACTACAACACGATGTGACGGACTGGGGGCAAGGTGGCCGTGTAGAGTCTGCTGTAGGTAATAAAGTAACTCTTGATAGAGAGGTTACTTTTGAACAAGGTAAGACTTATAGGCTCATGGTGCGTAACGCTAAAACGGATGCTTTAGAGTCTTACGACGTAACTGGTGTAACCGGTAAGACCTTAACGCTTGCTAGTAATGCGGTTATTCAGACCGACGATTTATACACCTATGGTGAAGCTACAAAAGAAGCTAAACCATTTAGGGTATTATCCATTAGCAAGTCTAACTCTGAAATGACTCGTAAGATATCCTGTATTGAGTACTACCCTGAGTTGTACGCCGGTGATGAAGGATCAGTACCAATCATCGACTACACAACAAAGTCTGATGTAATTAAGGTTATTAACTTAGTGCTCTTAGCTGACGTCAAGACATTAAAAGACGGTACTGTACTTTGTGATATCAATGGTACTTGGCAACTGCCACGGGGTAAGGTGGCCAAAAATATTATCGTGTATTACAAGCCTGTTACCGCTAAAGAGTGGCAACAGTTCAAAGTACTAGATGGCAGTGCTACTAGCGTAACTATTCCAAGTGTAGCGACCGACGTTAACTACGACGTTAAGATTGTATGCACCAATAATACTGGTGCTGCGTATGAAGGAGTAGAGCGTGCAGTGTATGTGAGTGGTAAGGAAATACCACCGGCTACACCTAAAGGCTTTAAGGTGACTCAGGACGCAGTAAATAGTAGCGTACTTCACTTATCATGGGAGCCTAATACAGAGGCTGACCTACATGGTTACACTTTATATGACGGAAATGATGTAGTGCTGATTAAACATATAGGCGGTACATCCTACTCATACTTCATTCCGAATACTGGCAATTACCTGTTCAAGCTATCTGCTATTGATACATCTGGTAATGAAAGTGGTAAGGCTGAAGCTCGTATTACTGCGAGTGTATCCGCTGAGAGTGTGGCTACACCTAAAGCACCGGCTCGAGGTGAGGTGAAAATTGGTAAGACGATCACTGCTGCATGGGACCCAGTAGAGAATACCTACATCGATTACTACGAAGTTCGACTTGATAGTAATGTTGGACAGTCCAATAATCTATTAGCCAAGACTACAGACATTCGCTCTGAAATTAAGTTATCGGCTCGTAGAGGTGCGGTATTCGTTTACGCACACAATCCTGTTAAAGGTTACGGTCCGGCGCTTAGACTTGACTATAATGCAGCAGTTCCTAAAGCTCCGACGAATGTCAAAGTAAAAGGTAATATTACAGGCGTTAGCGTGGTCTTTGATAGCATACCGGATACTTGTATAGGCGCTAATATCTACATCGGCACAGAGAAGTATTTCGTTATTACAAACGTAAATATGATACCGCATGACCCAGGTGTATTTGATGTAAAAGTTGCCTATGTTGACGTGTTCGGCGAAGGTACATACTCCAATATTATTGGTAGCTCTGTACCGGCTAGTATTGACCCGGCTTTAATTGACAAGGAATCTCTTGGCATTAAGGCTATGGACGATAAGATTAAGGAGCTCACAAAGACTGCTAATGCATATTCTACTCAAGTTAAAAACTTAACTACTAATATGGCTACTCAATTCAGCCAATTAGAAGACGGCATTGACTTGAAATTAAAAGCATTAAATGGTGATGAGCTAATCAGTCGTATCAATCTAAGCTCTACAGGAACAAGAATTGACGGTAAGTTACTGCACGTTACAGGGCAAGCATTATTCGACAATAATATCATTACTAAACGGATGCTCGCTGCCAAAGCAGTATCTGCAGACAAGCTAAACGTTAGCTCCTTAAGTGCTATCTCAGCTAACCTAGGTGAAGTAACAGGCGGTAAGATTATCGGCGGTACGATCCAAAATAAAACCGGTACATTTAAAGTTGACGCCAACGGTAATATAGTAGGTGCTAACATTACAGGCTCTCGTATTGACGCTCAATCCATTATGCAAGCCGGGTTTAAAATCAGAAACATTGACGTACAAATCTACAAAGTACGTCATGGCGACTATTGTCCCCTACTAGAAGGCTTTACAGAGTCTCAATGTACGTTTATCCCTGTTGGCTATAAAATGACAGAAGATTATAGTGACGTAACAGGAGGTACTAGCGATGGTCGAGAAAAATGGGATATCGCTAATGGGCGAAGGATTGATGATTGCACAATATATTTCCAGTCTAATATATCGAGCAACTATCACGATACTAAGCCAACCATTGGACTAAATGGTCGCAGGGCTGTTTGCCAATCGATATGGTATCGTTATTTCAGCAATCGGGATGATGATGGCTATCATCATCATATCTCCTTTGGGGAACTATACGTTCTCGTCATTGGTAAAAAGTAG

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)