Phage RBP Database

UniProt accession

A0A4Y1NMW4 [UniProt]

Protein name

Long tail fiber protein

RBP type

TF

Evidence UniProt/TrEMBL

Probability 1,00

TSP

Evidence DepoScope

Probability 0,58

TSP

Evidence RBPdetect

Probability 0,66

TSP

Evidence RBPdetect2

Probability 0,77

Protein sequence

MALDPNINRIKFLRSSTAGAKPTTAAIQPGEIAINLADRTLYSTDGNAIIDIGFGLGGSVNGPINATGQISTNDFLYSKYGFSVNSETADGRGISLYGNGYTASNGLPSYGLAMAATSKYGTFGAVSGSHATYLTTNSGTNRGWIFNYNGTTNVASISGTGIATFARVDAPLNGNANTATKLQSARNINGVLFDGTSDINTPAITDVVSFDNRTVKPSDVRNKAMGVYFTSKAGLNGAADTNYGDFLSLSTYQDGTGGKVNGLYFNKLSREILHYQTDLNSNSWGTPKTIAYTDSSITGNAASATRLQTARTINGTAFDGTANINVNATYSEFIPDGADLNDYKTPGLYYCPTDAGAATQLNLPFSNAYSLFVERHAGIKQTITQYATNKTFIRKFYNGYWDNWRQLAFLDPSDQKFTENITLEKASSDVAINIKTTTDNTSELILSNRNKTASVSLVSDGTFLLWDSNRQTSFMSFTPDGVQSTLNSKLLINTPASLNVTGGETFAVTGGESSPIRFKINRAGAITTNVPETGAAIVHATSYNWYNTEWQIGNIRGGSTNSLGFGITKFNDTLVWRHDGNTMTNYGNISNTGSISTQGDISSNGNISNTGSISTQGDISSNGNLRTAGSIDGDSLITRTGRIGAPTSTYHYLDIGRDGTDITTVGQYGGAFRVVDTAIGKNTFSVDPNTAIFAGRIITKPGTFYQNITDLGNATAVITVPDTVAPKDVTGYVPFIHGSVQTNGSGYRTNVSIGALRGSNTWSSSGAYIAIGGNDNYTTEDFRFMSGGYIGTSRGTLNILGTLNAPTLTSTTGSFTTVNTTNINAQGSIVMSAAPGGSGRSGMYTGNGDGASFSTCNMDIGSHWGLGFKDNLGNRNIFFDTRAGNASFKGSIRIGASFADETQLLPVSNQLQILTSGGQARNISTGGVLASDVYADASKVPVNGIYSKGDIKTDLWMYASNFTGPTGSGDGRFDGNANTATRLQTARTFQITGGITTNAVSFDGQQNVVLTANAVDGSKVSGVVPEAIKAQTLAVTPQKNAKLVASWKGTILQSMTPTLTIVDANTLRVRLADDNPSNRLPVLRFNVKIGTVYHLAFSDTMLPINGTVTFVQTGLTWVEVDLNSPNHGLSGSGNGVNVMAITYSAYGCYFEGSISQIIGTTGPKDSQWAYVLKLNSPTTDATYNLSGSSQDATWVWDKDIWYLNPAQPVITAGAMISPDRLNFFAADTDTATRMRSNMVTAQIWDIV

Physico‐chemical properties

protein length:	1247 AA
molecular weight:	131990,36080 Da
isoelectric point:	6,12545
aromaticity:	0,09222
hydropathy:	-0,22414

Domain architecture

A0A4Y1NMW4

1 1247 aa

STR 334–408 · STR 820–900 ·

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

InterPro domains

cd19958
STR

cd19958 IPR005601

A0A4Y1NMW4

11247 aa

ATT Attachment Domain STR Structural Domain RBD Receptor-Binding Domain CBM Carbohydrate-Binding Module LEC Lectin-like Domain ENZ Enzymatic Domain CHP Intramolecular Chaperone LNK Linker/Spacer Domain TAS Tail-Associated Structural TTP Tail Tubular Protein UNK Uncharacterized Domain Unmapped

Novel HMM domains (de novo, PhaRBP-HMM)

Experimental de novo families on regions without InterPro annotation. Separate from the InterPro architecture above.

DC_0113
STR

DC_0113 DC_0113 DC_1619

A0A4Y1NMW4

11247 aa

InterPro domain annotations

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
cd19958	STR	DC_0464	334	408	InterPro cluster	cd19958	Central	Low	Positional only	1183 proteins / 1674 hits
IPR005601	STR	DC_0859	820	900	InterPro cluster	Tail fibre protein p36	Central	Low	Positional only	349 proteins / 351 hits

Proteins with similar domain architecture

Segmented into three structural domains: N-terminal, central, and C-terminal.

Domain layout

A0A4Y1NMW4

1 1247 aa

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	571	571	0,1285
Central domain	572	770	200	0,5457
C-terminal	771	1247	476	0,4126

Note: Constraints were applied during segmentation.
Fixed 51 C-terminal predictions appearing before Central domain

N-terminal Central domain C-terminal

View these domains on the 3D structure via the Color by → Tail spike option in the Tertiary structure section below.

Phage

Acinetobacter phage AM101 [NCBI] · taxon 2178927

Uroviricota Caudoviricetes Pantevenvirales Twarogvirinae Lazarusvirus

Host

Acinetobacter baumannii [NCBI] · taxon 470

cellular organisms Bacteria Pseudomonadati Pseudomonadota Gammaproteobacteria Moraxellales

Genbank protein accession

AWY10444.1 [NCBI]

Genbank nucleotide accession

MH165274 [NCBI]

CDS location

range 156219 -> 159962
strand +

CDS

ATGGCATTAGATCCAAATATTAACAGAATTAAATTTTTACGATCTTCTACTGCTGGAGCTAAACCTACTACTGCAGCGATTCAACCAGGCGAAATTGCTATCAATTTGGCAGATAGAACTCTTTACTCAACCGATGGTAATGCTATTATTGATATCGGTTTTGGCTTGGGTGGAAGTGTCAATGGGCCAATAAATGCAACAGGGCAAATTAGTACCAATGACTTTTTATATTCAAAGTATGGATTTTCTGTAAATTCAGAAACTGCAGATGGACGCGGTATTTCATTATATGGTAATGGATATACCGCATCAAACGGTCTGCCGTCATACGGGCTTGCGATGGCTGCTACAAGTAAATATGGTACATTTGGTGCTGTGTCAGGTTCGCACGCAACTTACCTTACTACAAACTCAGGTACTAACCGTGGTTGGATTTTTAACTATAACGGGACTACCAATGTAGCTTCAATTTCGGGAACCGGCATTGCGACATTTGCTCGTGTAGATGCTCCGTTAAACGGTAATGCTAATACAGCAACCAAACTTCAATCAGCTAGAAACATTAATGGCGTGTTGTTCGACGGCACATCAGATATTAATACACCAGCTATCACTGACGTTGTTTCATTTGATAATAGAACTGTTAAACCTTCTGATGTTAGAAATAAAGCCATGGGTGTTTATTTTACTTCAAAGGCAGGTTTAAATGGCGCGGCTGATACCAATTATGGTGATTTTTTATCTCTAAGCACTTATCAAGATGGCACTGGAGGAAAGGTAAACGGTTTATATTTCAATAAATTATCTCGAGAAATATTACATTACCAGACAGATTTAAATTCAAATTCGTGGGGAACTCCGAAAACGATTGCGTATACCGATAGTTCTATTACCGGCAATGCTGCATCAGCAACACGCTTACAGACAGCAAGAACTATCAATGGTACTGCATTTGATGGTACTGCGAATATCAATGTCAATGCTACATATTCGGAATTTATTCCTGATGGTGCGGATTTAAATGATTATAAAACTCCAGGGCTATATTATTGTCCTACTGATGCTGGTGCAGCGACTCAATTAAATTTACCGTTTAGTAATGCGTATTCGTTGTTTGTTGAGAGACATGCTGGAATTAAACAGACTATTACCCAATATGCGACAAATAAAACTTTTATTCGTAAATTTTATAATGGTTATTGGGATAATTGGCGTCAATTAGCTTTCTTAGACCCAAGTGATCAGAAATTTACAGAAAATATCACTTTGGAAAAAGCTTCTTCTGACGTAGCAATCAACATTAAAACTACTACTGATAATACTTCTGAACTTATTTTAAGCAATAGAAATAAAACAGCGTCTGTAAGTCTTGTATCAGACGGTACTTTTTTATTATGGGATTCAAATAGACAAACATCATTCATGTCATTTACACCAGATGGTGTACAATCGACATTAAATTCTAAGTTGTTGATTAATACTCCAGCATCGCTAAATGTTACAGGCGGAGAAACATTTGCTGTTACGGGTGGAGAAAGTTCCCCAATCAGATTTAAAATTAACCGCGCTGGAGCTATTACCACAAATGTTCCTGAGACTGGCGCCGCTATTGTCCATGCTACTTCATACAACTGGTATAACACTGAATGGCAAATTGGTAACATTCGTGGCGGTTCTACTAACTCTCTTGGGTTTGGTATTACTAAATTCAACGATACATTAGTATGGCGCCATGATGGCAATACTATGACCAACTACGGTAACATTAGTAATACGGGTTCGATCAGTACGCAAGGAGATATTTCATCTAATGGTAACATTAGTAATACGGGTTCGATCAGTACGCAAGGAGATATTTCATCTAATGGTAACTTGCGTACTGCAGGTTCGATCGATGGTGATAGTTTAATCACTAGAACTGGACGTATCGGTGCGCCAACATCTACGTATCACTATCTCGATATCGGTAGAGACGGTACAGATATTACTACGGTCGGTCAATATGGAGGTGCATTTAGAGTTGTTGATACAGCTATCGGCAAAAATACATTCAGTGTTGACCCAAATACGGCTATTTTCGCTGGAAGAATTATCACGAAGCCTGGTACATTTTATCAAAATATAACAGACTTGGGTAATGCGACTGCAGTTATTACAGTTCCAGATACTGTTGCTCCAAAAGATGTCACTGGATATGTTCCGTTCATCCATGGATCAGTTCAAACGAATGGCTCTGGTTATAGAACTAACGTATCTATTGGTGCTTTGAGAGGTTCTAATACTTGGTCATCTTCGGGTGCTTATATCGCTATCGGTGGAAATGATAACTATACGACAGAAGATTTTAGATTCATGTCTGGTGGTTATATTGGTACAAGTCGCGGTACTTTAAATATCTTAGGTACTTTAAATGCACCTACTTTAACATCTACAACTGGATCTTTCACTACCGTTAATACAACAAATATTAACGCCCAAGGCAGTATTGTGATGAGTGCTGCGCCTGGTGGATCTGGACGAAGCGGTATGTATACAGGAAATGGTGACGGTGCGTCCTTCTCTACCTGTAATATGGATATAGGTTCTCATTGGGGCTTAGGATTCAAAGATAATTTAGGAAACAGAAATATTTTCTTTGATACCCGTGCAGGTAATGCGTCGTTTAAAGGATCTATTAGAATCGGTGCATCTTTTGCTGATGAGACTCAATTATTACCTGTATCAAACCAACTTCAAATATTAACTTCAGGCGGTCAAGCTAGAAATATTTCGACTGGTGGTGTATTGGCTTCTGATGTTTACGCTGATGCTAGTAAAGTTCCTGTAAACGGCATCTACTCAAAAGGTGATATTAAAACTGACCTATGGATGTATGCATCTAATTTCACTGGTCCTACAGGATCAGGCGACGGTCGTTTTGATGGTAACGCAAACACAGCAACTCGTTTGCAAACTGCAAGAACTTTCCAAATTACTGGAGGCATCACAACAAATGCGGTATCATTTGACGGACAACAAAATGTAGTATTGACTGCAAACGCGGTTGATGGTTCTAAAGTATCTGGTGTGGTTCCTGAGGCGATTAAAGCGCAAACTCTTGCAGTGACACCGCAAAAAAATGCGAAATTGGTTGCATCATGGAAGGGTACCATATTACAATCTATGACGCCTACACTAACTATTGTTGATGCAAATACACTTCGTGTTAGATTAGCAGACGATAATCCGAGTAACAGATTGCCAGTATTGAGATTTAATGTGAAAATCGGCACAGTGTATCATCTCGCATTTAGTGATACTATGTTGCCGATCAATGGCACAGTAACTTTCGTCCAAACTGGGTTAACATGGGTTGAAGTTGATCTTAATTCACCTAACCACGGGCTATCAGGTTCAGGCAATGGTGTAAATGTTATGGCGATAACATATTCTGCATATGGTTGTTATTTTGAGGGCTCAATTAGCCAAATCATTGGCACAACCGGTCCGAAAGACAGTCAATGGGCATATGTATTGAAACTCAATTCTCCGACAACTGATGCTACATATAATCTTAGCGGATCTTCGCAAGATGCAACATGGGTTTGGGATAAGGATATTTGGTATCTTAATCCCGCGCAGCCGGTGATAACTGCAGGCGCTATGATTTCTCCTGATAGATTGAATTTCTTCGCTGCTGATACAGATACTGCAACAAGAATGCGTTCTAATATGGTAACTGCACAAATCTGGGACATTGTATAA

Protein

Domains

Tail Spike Domain Segmentation

Taxonomy

Coding sequence (CDS)

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)