Phage RBP Database

Genbank accession

CAB4122887.1 [GenBank]

Protein name

tail fiber protein

RBP type

TF

Evidence Phold

Probability 1,00

TSP

Evidence DepoScope

Probability 1,00

Protein sequence

MTSSIDPNNINPNVPVSDQDNNSQNLRDNFANIQENFAQAADEIGGLQATTVGLTGPVYSPTLGTLGANNSLILTTQFATSNDTYVLSLPGTSAVRIPAGSTAQRPASASAGMVRYNTNLNYLEYYDAAINQWQAVGVPGPTGVTGPSGGPPGPTGSTGEQGYMGLQGPQGIPGVPGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPTGPGKPAEPNASVQFNDNGSFGGSELMTWDGATLNTNALRSQNTVIANDIIRNAMLNGDLRLQGGSGGQVKVEGDLLITGKTIGAFPEVTGVLYVTMDGDDLNEGLTLDRAKKTIASACAAAANKIRYQGWTYATVFVRAGTYNEPNPVTVHSGITVFGDNLRSVTVIPQNPTQDLFWVNPKTYLYGMTFRGHLHPAAVVAFPKNGTSVIHDLHDWASPYVQNCSSITIGKYDGTGGQKNFDITAGSNVLIGTDTTGLFVGQGVVGTDLLPGTVVTHIDPGVQVIISTYALKDVSGEQFEFELGVAEEAGSGMIVDGLRGRKLSDPDPGGISVQSINQIVNPNTLIVYDDVIVGGGGSNFGAYTWNYLQSGVVGTPSNIVAINSTTVGGIAAWSIQLADDILGTQTISKFDEIVDDSTVIVLDSTSSNLGSGTNQIAPNWAITDTNVDNAATLLIANKKFFQQQIAAYVDTNYAAVNDVYRAASYRDIGLIVDCITEDMVQGSRDRTTEAANFYWNAGVSVVPGTVGEACKYAWDWLRQLMLKVINNETVDQLYTSDWVITNHGSIVPQITYPALTGGSIGSTSITTNIDYLIQVVQNGVGSDGFAQAANLIDLNRAFIQRGTTNWIKKSFPDFVYNMDKCERDVGYIVDAVASDIKGGGYARSVASGLAYFAGNASLIAGEEFQTVQALRYTEFLVSQVINNLAVNPRATALPQIIDTNYQYGNLWTGTVSNLMNKIGHIIQTGAADQPENPDYLNAQSLLVYNLPFIRDQVSAWVQAHYPSGYTLTASQLNKCKRDVGIIIMGVMNDVLAQTTTNSVAVGNSYYNGVVSVLTYSSAQQKTLTSNALSYALTLIQQVINNDTITPDYPSANSQVIKLDFTNGSAAYSTYSSLMATVQDIIVNGPSADPANPIPTSMGNFAAQTLAWDNLEFIKTETIYWINQNYPSLTYDRTKCARDVALIVTCVLADVLSGVTFNSITAGNRYWNSVTSVLPSTEIPATVATLNYVARLVNSVISNLVVSDTEYPQQFDNNQPLGGVAQAVVNEAFDVICNIILKGPSIKPTAGTINAGMGTAYALIQKNKAFIQDQVQLRIADVYPSFQYDVALCNRDVGLIVDCISSDVYWGKHDRAIAAGTGYWKGVTNVVANEVIQTVDAVEWIGVMAQSIVQNAAPPTVYTIGATKTQYTTSGTAGAISTNRIQQAVDIITNIIQYGPNGLAPSVGFDSARTLLQRNKSFMAQQVNALIHSTTFISAHPGFTITDARSITCMRDVGYIVDCISQDVITGGQAESVAAGLAYWNGATSYLTTEEEKTATKDAILYLGNIANLIVQNLTVTPIDGTVTEIQYSDGGNLILGTDAAPLIVQNLTLVSNIIITGSTAANVASFMGNASVVINTNRNFIQAEVASWVNINYPDFEYDIALCVRDAGYIVDAVVNDLAQGGIITNSVNAGRAYWNGTQTKIPGQEPQTTGAVAYAQSLAINIINNVAVTTTQSFVSQTFEPTLLDSSNAAPQVNNSFNTMINLIRHGAYTQTLLPKPYRDASLLIQDNILWMQAKTNAYINSSNFTTWFPGVITDSISAKCTRDTAFIAEAVSTDLTTGNDEQSRQTGQAYWNGVTSVLPVPQREPTANVIGYLSTLMVNVVQNSVVSDAYPVSESQTTNINLDGTGAVDAVTDNMSIISDIITNGGVNQRPLYIGTGRTKVTSITPTTLNSQPAWEIRFADALGGNYWAPATFVSYTGPFNFVTPASVSPYQGQGLNSMVLDAFTQYNQISKQGLSAGGKGIVVRNGGYAQLVSIFEICCNIGVLTESGGYCSITNSNTDFGNYGLWADGVSDKQYSTVMTGYEPYTGIMAIAGLPEYPAGSGLYKRPYVGQVVTISKYLPPEPRENGVEFGYTAQEFYTLDSINVMYGGSGYTTPPKITIKSPSNKTGGVKAQAVAVLAGPVGNKTVVSINLLVSGSMFTLQQIQDPDFITIDPPENPGGTAKAQAVANIIYYDITTSTDPVAGTSMISVDQRLPFTPDLTGSPNGASSMNFYQVSRIISSSHCLEYVGSGTDIGKCIPARGGVPDQTKEVIMTTGGRVAYTSTDHLGNFRIGPELVINQNTGTLSGRTFNKSLFAIMTPYILALE

Physico‐chemical properties

protein length:	2352 AA
molecular weight:	249563,40440 Da
isoelectric point:	4,58721
aromaticity:	0,08333
hydropathy:	-0,03882

Domains [InterPro]

Domain ID	Category	Cluster	Start	End	Layer	Name	Pref Zone	Confidence	Evidence	Support
DC_0620	STR	DC_0620	4	432	Novel HMM	DC_0620	Central	Low	Positional only	205 proteins / 205 hits
Coil	Unmapped	-	16	43	Coils	Coil	-	-	-	-
PTHR24637	Unmapped	-	111	232	PANTHER	COLLAGEN	-	-	-	-
IPR011050	STR	IPR011050	336	488	Merged direct domain	Pectin lyase fold/virulence factor	Central	Low	Positional only	572 proteins / 572 hits
DC_0069	STR	DC_0069	489	903	Novel HMM	DC_0069	Central	Low	Positional only	57 proteins / 57 hits
DC_0763	STR	DC_0763	1625	2352	Novel HMM	DC_0763	Central	Low	Positional only	71 proteins / 71 hits

Tail Spike Domain Segmentation

This protein has been segmented into three structural domains: N-terminal, central domain, and C-terminal.

Domain Layout

N-terminal

Central

C-terminal

CAB4122887.1

1 2352

Domain	Start	End	Length (AA)	Confidence
N-terminal	1	396	396	0,9273
Central domain	397	2341	1946	0,2535
C-terminal	2342	2352	10	0,1047

Note: Constraints were applied during segmentation.
C-terminal too short, adjusted boundary

Legend: N-terminal Central domain C-terminal

3D Structure with Domain Coloring

The structure is colored according to the domain segmentation: N-terminal (blue), Central (green), C-terminal (pink).

Domain Coloring

N-terminal
1-396

Central
397-2341

C-terminal
2342-2352

	Name	Taxonomy ID	Lineage
Phage	uncultured Caudovirales phage [NCBI]	2100421	Uroviricota > Caudoviricetes > Peduoviridae > Maltschvirus maltsch >
Host	No host information

Coding sequence (CDS)

Genbank protein accession

CAB4122887.1 [NCBI]

Genbank nucleotide accession

LR796167.1 [NCBI]

CDS location

range 75691 -> 82749
strand -

CDS

ATGACGAGCTCAATAGACCCCAATAACATCAACCCCAATGTTCCTGTTAGCGATCAAGACAACAACAGTCAAAATCTCAGGGACAATTTCGCCAATATACAGGAAAACTTTGCGCAAGCTGCGGATGAAATCGGCGGTCTGCAAGCTACCACTGTGGGGTTGACTGGTCCCGTTTATTCTCCCACGCTTGGCACTTTGGGCGCAAACAACAGTTTGATTCTCACAACACAGTTTGCCACAAGCAATGACACTTATGTCTTGAGCTTGCCTGGCACCAGCGCTGTGCGTATCCCTGCTGGCAGCACCGCGCAACGACCAGCCAGTGCCAGTGCCGGCATGGTGCGTTATAACACCAACCTCAACTACCTGGAATATTACGATGCTGCTATTAACCAATGGCAAGCTGTGGGTGTTCCTGGTCCCACTGGTGTAACTGGACCCAGCGGGGGACCACCAGGACCAACTGGCTCAACAGGTGAACAAGGATACATGGGTCTGCAAGGACCACAAGGTATACCCGGGGTGCCTGGTCCCACTGGTCCCACAGGCCCAACTGGTCCTACCGGTCCCACAGGCCCAACTGGTCCTACCGGTCCTACCGGTCCCACGGGCCCAACTGGTCCCACAGGCCCCACAGGCCCAACTGGTCCTACCGGTCCCACAGGCCCAACTGGCCCTGGCAAACCAGCTGAGCCCAATGCCAGTGTGCAGTTTAATGACAACGGCAGTTTCGGCGGCAGTGAGTTGATGACATGGGACGGTGCCACTCTCAATACAAATGCATTGCGCAGCCAAAACACAGTCATTGCCAATGACATCATCCGCAATGCCATGCTCAATGGTGATCTGCGCCTGCAGGGCGGCAGTGGCGGACAGGTAAAAGTGGAAGGTGATTTGCTGATCACCGGCAAAACAATAGGAGCGTTCCCTGAAGTCACAGGTGTGCTGTATGTCACCATGGATGGAGATGACTTAAATGAAGGGTTGACACTGGATCGTGCCAAGAAAACCATTGCCAGTGCCTGCGCCGCGGCGGCCAACAAGATCAGATATCAAGGTTGGACTTACGCAACGGTGTTTGTGCGGGCTGGGACATATAACGAACCCAACCCAGTCACAGTTCACAGTGGAATCACAGTGTTTGGCGATAACTTGCGTTCAGTAACAGTTATTCCTCAAAATCCCACACAGGATCTATTCTGGGTGAACCCCAAAACCTACTTGTATGGCATGACATTCCGCGGCCATTTGCACCCAGCCGCAGTGGTTGCCTTCCCAAAGAACGGCACCAGCGTGATTCATGACTTGCATGACTGGGCTTCGCCATACGTGCAGAATTGCTCCAGCATCACCATCGGCAAGTATGACGGCACCGGAGGACAAAAGAATTTCGATATTACAGCCGGAAGTAACGTTCTAATTGGAACTGATACAACAGGATTATTTGTGGGACAAGGAGTGGTGGGTACTGATTTGCTGCCGGGCACTGTTGTTACACATATAGATCCCGGCGTCCAGGTTATTATCAGCACGTATGCATTGAAAGATGTTAGTGGCGAACAATTTGAATTTGAACTTGGTGTGGCTGAAGAGGCCGGATCGGGAATGATTGTGGATGGATTGCGAGGACGAAAGTTGAGCGATCCTGATCCTGGCGGTATCTCTGTGCAAAGTATCAATCAAATCGTGAACCCCAACACATTGATCGTTTACGATGATGTGATAGTGGGAGGAGGAGGATCGAACTTTGGAGCATATACATGGAACTATCTGCAAAGCGGAGTTGTGGGAACACCCAGTAACATAGTTGCCATCAACAGCACCACCGTGGGTGGTATTGCTGCATGGTCGATTCAACTGGCTGACGACATCCTGGGCACACAAACAATAAGTAAATTTGATGAAATAGTAGATGACAGCACTGTGATAGTGTTGGATAGCACATCGTCCAACTTGGGCAGCGGCACAAACCAAATTGCTCCCAACTGGGCCATCACAGACACCAACGTGGATAACGCAGCAACATTGCTAATTGCCAACAAAAAGTTTTTCCAACAACAAATTGCAGCCTATGTGGATACCAACTACGCAGCCGTAAACGACGTTTACCGAGCCGCCAGCTACCGAGACATTGGCTTGATTGTGGATTGCATCACAGAAGACATGGTGCAAGGCAGCCGAGACCGCACAACAGAGGCAGCCAACTTCTACTGGAATGCCGGCGTCAGTGTGGTTCCTGGCACAGTGGGGGAAGCATGTAAGTATGCATGGGACTGGCTGCGCCAGCTCATGTTGAAAGTCATCAACAACGAAACAGTGGATCAACTTTACACCAGCGATTGGGTTATAACAAACCATGGTTCCATAGTTCCGCAAATTACATATCCAGCCCTGACTGGCGGCAGCATTGGCAGCACCAGCATCACCACAAACATCGATTACTTGATTCAAGTGGTGCAAAACGGTGTGGGATCAGATGGGTTTGCACAAGCTGCCAACCTGATAGATCTCAACAGAGCATTTATACAACGCGGAACCACCAACTGGATCAAAAAGTCATTCCCAGACTTTGTCTATAACATGGACAAATGTGAACGCGATGTGGGTTACATTGTGGATGCAGTGGCCAGTGACATCAAAGGCGGAGGATATGCTCGCAGTGTGGCCAGCGGACTGGCATACTTTGCTGGCAATGCCAGCTTGATTGCCGGAGAAGAATTCCAGACTGTGCAAGCACTGAGATACACTGAATTTTTGGTCAGTCAAGTAATAAACAACTTGGCCGTTAACCCCCGTGCAACTGCTCTGCCGCAGATAATCGACACCAACTATCAATATGGAAATCTTTGGACTGGCACAGTGTCCAATCTCATGAATAAAATTGGTCACATCATTCAAACCGGTGCGGCGGATCAACCTGAAAATCCTGATTACCTCAATGCACAGTCGTTGTTGGTCTACAACTTGCCCTTTATACGTGATCAAGTAAGTGCATGGGTGCAAGCCCACTACCCATCAGGATACACCCTCACAGCATCCCAACTCAACAAGTGCAAGCGTGATGTGGGTATCATCATCATGGGTGTCATGAACGACGTGTTGGCCCAAACGACCACCAACTCAGTGGCCGTGGGCAACAGCTATTACAATGGTGTTGTTTCAGTACTGACATACAGCAGCGCCCAACAAAAAACCTTGACAAGCAACGCCCTCAGCTATGCGTTGACACTGATACAACAGGTTATTAACAACGACACAATCACTCCAGATTATCCCAGCGCCAACAGCCAGGTCATTAAACTGGATTTCACTAATGGATCAGCAGCTTACAGCACATATTCCTCTCTCATGGCCACAGTGCAAGATATCATTGTTAACGGACCCAGCGCCGATCCTGCCAATCCCATCCCCACGTCCATGGGAAATTTTGCAGCACAGACACTGGCATGGGACAACTTGGAGTTTATCAAAACTGAGACCATCTATTGGATCAATCAAAACTACCCCAGCCTCACTTATGACCGTACCAAATGTGCTCGCGACGTGGCATTGATAGTCACTTGCGTCTTGGCTGACGTGCTGAGCGGTGTGACATTCAACAGCATAACTGCCGGCAACAGATATTGGAACAGCGTCACCAGCGTGTTGCCCAGCACTGAGATTCCTGCAACTGTTGCAACACTTAACTATGTGGCACGTCTGGTCAACAGTGTAATCAGCAACTTGGTAGTGAGTGACACTGAGTATCCACAGCAGTTTGACAACAACCAGCCTCTGGGCGGAGTAGCACAAGCAGTTGTAAACGAAGCATTTGACGTTATCTGCAACATAATCCTCAAGGGACCCAGCATCAAACCCACAGCGGGAACTATCAACGCTGGCATGGGCACAGCTTACGCACTGATACAGAAGAACAAAGCGTTCATTCAAGACCAAGTTCAGCTTCGCATTGCCGACGTATATCCCAGCTTCCAATACGATGTGGCTCTTTGCAATCGAGACGTCGGTCTCATTGTGGATTGCATCAGCAGTGATGTATACTGGGGCAAACATGACCGTGCCATTGCTGCAGGCACTGGCTATTGGAAAGGTGTGACAAACGTCGTAGCCAACGAAGTCATCCAAACTGTGGATGCGGTGGAATGGATTGGTGTCATGGCGCAAAGCATTGTGCAAAACGCAGCACCACCCACAGTGTATACGATTGGTGCCACAAAAACACAATACACCACATCAGGCACAGCAGGTGCGATTTCCACCAATCGTATCCAACAAGCTGTTGATATCATTACCAATATCATCCAATATGGTCCCAACGGCTTGGCACCCAGCGTGGGCTTTGACAGCGCCAGAACCTTGCTACAACGTAACAAGTCCTTCATGGCACAGCAAGTCAACGCATTGATCCATAGTACCACGTTTATATCAGCGCACCCAGGTTTCACCATTACAGATGCCAGATCCATAACTTGCATGAGAGACGTGGGTTACATTGTGGATTGCATCAGTCAAGACGTCATCACAGGCGGTCAGGCAGAAAGTGTGGCTGCTGGATTGGCATACTGGAATGGCGCAACAAGTTATTTGACTACAGAGGAGGAAAAAACAGCAACCAAAGACGCAATACTATACTTGGGTAACATTGCCAACTTGATTGTGCAAAACCTCACTGTGACGCCAATTGATGGCACAGTTACTGAAATTCAATACAGCGACGGCGGAAACTTGATTTTGGGAACCGATGCAGCACCATTGATTGTGCAAAACCTCACATTGGTGTCCAACATCATCATAACAGGCAGCACCGCTGCCAACGTGGCGTCCTTTATGGGCAACGCCAGCGTGGTGATCAATACCAACAGAAACTTCATCCAAGCCGAAGTGGCCAGCTGGGTCAATATCAACTATCCTGATTTTGAATATGACATTGCATTGTGTGTGAGAGACGCCGGATACATTGTGGATGCTGTGGTAAACGATCTTGCCCAAGGTGGCATCATTACCAACAGTGTCAACGCCGGCCGTGCATACTGGAATGGCACTCAAACCAAGATCCCCGGTCAAGAACCACAAACAACTGGCGCTGTGGCATATGCACAGAGCTTGGCCATAAACATCATCAACAACGTCGCTGTAACCACAACACAGAGTTTTGTGAGTCAGACCTTTGAGCCCACTCTTCTCGACTCAAGTAATGCAGCACCACAAGTAAACAACAGCTTCAATACCATGATCAACTTGATCAGACACGGTGCCTACACACAGACACTGTTGCCCAAGCCATATCGCGACGCCAGCTTGCTGATACAGGACAACATTCTTTGGATGCAAGCCAAGACCAATGCCTATATCAACAGCAGCAACTTCACCACATGGTTCCCAGGTGTCATTACTGATTCAATATCTGCAAAATGCACCCGAGACACAGCATTTATTGCAGAAGCTGTGTCAACAGATTTGACCACCGGCAACGACGAACAAAGTCGCCAAACTGGTCAGGCTTATTGGAACGGCGTCACCAGTGTGCTGCCAGTGCCTCAGCGCGAGCCCACTGCCAATGTCATTGGCTATCTCAGCACGTTGATGGTCAATGTTGTTCAGAATTCTGTTGTCAGTGATGCGTACCCAGTATCTGAGTCGCAGACCACCAACATCAACTTGGATGGCACTGGTGCGGTGGATGCAGTCACCGACAACATGAGCATCATATCAGATATCATAACAAACGGCGGTGTCAACCAACGTCCGTTGTACATTGGCACTGGCAGAACCAAGGTTACCAGCATCACACCCACAACTCTAAACAGCCAACCAGCTTGGGAAATCCGATTTGCCGACGCTCTGGGCGGAAACTACTGGGCTCCTGCAACATTTGTCAGCTACACTGGTCCGTTCAACTTTGTCACACCAGCCAGCGTGTCACCATATCAGGGCCAAGGTTTGAACAGCATGGTGTTGGATGCATTTACACAATACAACCAGATCAGCAAGCAAGGATTGAGTGCTGGCGGCAAGGGCATTGTGGTGCGTAACGGCGGATATGCACAGTTGGTGTCCATATTTGAAATTTGCTGTAACATCGGCGTGCTCACAGAGAGTGGTGGTTATTGCTCTATTACCAACAGCAACACCGACTTTGGCAACTACGGGCTGTGGGCAGATGGTGTGAGTGATAAACAATACAGCACAGTAATGACAGGATATGAGCCATATACTGGCATTATGGCAATTGCAGGTCTTCCTGAATACCCTGCTGGCAGTGGGTTATACAAGAGACCATATGTGGGACAAGTTGTCACCATCAGCAAATACCTGCCACCGGAACCACGGGAAAATGGTGTAGAGTTTGGATACACTGCACAGGAATTCTATACATTAGACAGCATCAATGTCATGTATGGTGGCAGTGGATACACAACTCCACCCAAAATAACTATAAAGAGCCCCAGCAACAAAACAGGAGGGGTAAAGGCGCAGGCGGTTGCAGTTCTTGCAGGCCCGGTTGGTAACAAAACGGTGGTGTCTATCAATTTGCTGGTGAGCGGAAGCATGTTTACATTACAGCAAATTCAAGATCCTGATTTTATCACTATCGACCCTCCTGAAAACCCTGGCGGCACTGCCAAGGCACAAGCGGTAGCTAATATAATATATTACGACATCACAACATCAACAGATCCAGTGGCAGGGACCAGTATGATTTCAGTTGATCAGCGACTGCCGTTTACTCCTGATCTAACAGGATCACCAAACGGTGCCAGCAGCATGAACTTCTACCAAGTCAGCCGCATCATCAGCAGCAGCCATTGCTTGGAGTATGTGGGATCTGGCACTGATATTGGCAAATGCATTCCAGCACGCGGCGGTGTGCCAGATCAAACCAAAGAAGTCATAATGACCACTGGCGGACGTGTGGCATACACCAGTACTGATCACTTGGGCAACTTCCGTATTGGACCCGAGCTGGTGATCAACCAAAACACAGGAACATTGAGCGGCAGAACTTTCAACAAGAGCCTGTTCGCTATCATGACTCCATACATACTTGCACTCGAATAA

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Tail Spike Domain Segmentation

Tail Spike Domain Segmentation

3D Structure with Domain Coloring

Domain Coloring

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Genome Context

Genome Context

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence