Genbank accession
CAI9421185.1 [GenBank]
Protein name
Tail fiber protein
RBP type
TF
Evidence UniProt/TrEMBL
Probability 1,00
TF
Evidence GenBank
Probability 1,00
Protein sequence
MAGGRRFQAGLGSEHKRLYKEGQQINTLLLAQVIQVNYKYNTVDLLALQHKEVFQNSYANEGRFSARLPMEFGGRNLAGQPYGQVNPIAVGTVVLVGFINSDKDMPIVISVYNNNDVNKQLSRTRFANAEPTDMALAGQMYQKFSLYPSLTYDSIDGDGNRIVTFSGKSFIAFDTKDMQNSPMTDASYGSRYEDLGTSYYNDGELIEPMKGRAPNVLFKHQGILDDDNKPDTHNFMIHINPDGTYRTSMMDTEQDWRTMFEMTPEGKIRLRRQGDTVRLNDGFEIGELGINEEGIVYLRNGDMDLEVREDGIYSQGKLITESINLDDIYEKLANVTFEINKTNESLQILAGKSEVQDGKIVNLETEITIVAGKVESKVSATEVQDMIDSSIVDMAEAIKQAQEDADRANQIISDMASDNRLTPSEKLDLLKEWDIVKNEYPTYLAQAELYEVDSTTYTAKYKALETFVTPLLEDMEATSVVDGSIMRKTFSAYYTERINLLNAITKGLKDGLEKAMKKASQASVDATQALADSAQAQIDANNAKQLIADIASDGKLTASEKYQLKKEWDVIVKEYPTTIAQATKYKVNTDNYTAKYKALETFVTPLFANMDETSVVNGEQLRTVFSDYYAVKITLLKSITDIARDELTDYGNRITVAETKITQTSEAITLMASRVETVENDVRTNTAQLKVQADLISQKVTASEVKDAIDNAIDNMSIGGSNLFVINTQTAGLLNENNGTVGTAVDKSVVSNYIKVTARMPYVASLYGNTGTNSIIIAWYDTSKTFISGQAVADSGDFHKTYVAPENAVYARLSYKKSDTVKMKFEVGTKPTDYSPAWDDIKGDQTALEEYIKQVEEQAKQAQQEAENAKNEAENANSAIADMSNDNMLTANEKQQILLQWEEIKTEYPINLDQATKFGVSATQYTTAYNALKTYLDPLLADMTTTSVIIGSTMRSTFNTYYDRRTTLLNRVADLAKQVADQAKDTADKVDDDLNNIGGYNYIGFSSGDHMYPRLMIKNVGYYAVPSMGIAEFVGDMVCLKPKTTEKKVQYEIGSSSANIAGVGLANYRMKEVKTGQWLTASANLKVVGTGKAYITIFTLENGSWKFSLSDMVTASQGVTRVVAQRKVTDQTQGVFIRISGDIIDEVHFGNTQLEVGIRSTPWKKSDIDIQEDINNVADDIKDYIGARSDNLITNGFGELGNNTNIGGIFDGADRIVGKGSFRQEEANKSLLFSEHIVIDNKKVYNFDYYMHTLKGVGRSYAMIAPYDVDGKRITFPSLGGRNYNSTTPVEFTKLTKPLKVGDTEVFVEDVSLWNGQAPQDYQRSIIMWGYKNSFGYTYPDGTYSQLMQMRTYDIGAVDTTANKITLNKPWAVANPNSSDGIFPVGHTLSPTSDGSTYLYLSGHVNIQVPTTYTKYSHLISGSSEFANTTIIPVETGSIQLGFLLNRDTTGEKSWLNGLRLRDYTDTYKLNDDVRETQENVDKAQADANKANQSIADLSNDNLVTPNEKLDLKKEWEIIVAEKPKNDAQADKFGVSKVAYGTAYTALSNYITPILASTTTNSAIVGQTMRDTFKAYYTARTDLLNAVATKAKDLADTAQSGVEQVKAKAEKAQADATKAQQDASKAQQDATKANQAITDLSNDNLVTPNEKLDLKKEWEIIVAEKPINDTQADKFGVSKTDYGTKYTALSNYITPILTDLTTNSAIVGQTMRDTFRAYYTARTNLLNSISVKAKELADRAQTDANNAQNSANNAQSSANQAQTDATNAQNSANKAQADATKANQSIADLSNDNLVTPNEKLELKKEWEIIVAEKPKNDAQADKFGVSKTTYGTAYNALNTYLTPILANLTTNSAIVGQTMRDTFKTYYSARTDLLNAIASKAKDLADNAQDTADNIAVGTRNLLIGTQDFSKGKYPGNTHITITDEKLFGNAVMKNDFTTGTGYSDMYQLTTSIIPTGTQYTLSFYAKADIDKTKMSCYFYNPNTTVNSVNNQGGRITSSDGRSVFVLSTEWTKYWVTWTQTQADRPKSVIIGRKTGGEEPNSAFYMSSPMLVEGNKPQTWMKAPEDIETAINGKEGAWVYSPTAPTNPAIGLVWVDSSKTPNQPKRWVGGETGWVALTPEEVKDLPWGEDGSNLADWVAQAEQKISSDAIINTVLGSEDFTGIFDKKANTEDLNNLASYDDLDAMQAEYERLLKEGIAGIDFSPYVTNTELEQLKDSFTFSVQQAGGVNMLKNSLGFSGTDFWQASSGIDTTQNDQLAKLGFGSGFMINRVQNATIKQAIELPEAKQGLQYALSFYMNVATFGDTTGLQCGAHIYEEGVLKYTVGVTDATQGIPSDYHLYKLVFEPESPNTVIELFVTNGAQATVIISGVMYNIGNIALKWQPYPSEIYNTNVKIDINGITVKNNQTDGYTMITPQEFSGYARVNGEMERIFTLNGQVTEVKMLQAEKRITMEPISVFAMNSKETNTIGWAFVASGDVSHTTVSNT
Physico‐chemical
properties
protein length:2487 AA
molecular weight: 274433,27170 Da
isoelectric point:4,87965
aromaticity:0,08685
hydropathy:-0,44222

Domains

Domains [InterPro]
Coil
Unmapped
391–418
PTHR43941
Unmapped
848–1803
DC_0015
STR
1613–1771
CAI9421185.1
1 2487
Architecture
ATT
STR
ATT 74-512 | STR 560-2487
Legend: ATT STR RBD CBM LEC ENZ CHP LNK TAS TTP UNK Unmapped

Taxonomy

  Name Taxonomy ID Lineage
Phage Enterococcus phage Porthos
[NCBI]
2795670 Uroviricota > Caudoviricetes > Herelleviridae > Schiekvirus > Schiekvirus Porthos
Host No host information

Coding sequence (CDS)

Coding sequence (CDS)
Genbank protein accession
CAI9421185.1 [NCBI]
Genbank nucleotide accession
LR990835.2 [NCBI]
CDS location
range 74261 -> 81724
strand +
CDS
TTGGCAGGAGGACGTAGATTTCAGGCAGGGTTAGGTTCCGAACATAAAAGATTATACAAAGAAGGACAACAAATTAATACTTTGTTGCTAGCCCAAGTTATCCAAGTTAATTATAAATATAATACAGTTGATTTATTAGCATTACAGCATAAAGAAGTTTTCCAAAACTCATATGCCAATGAAGGTAGATTCTCTGCTCGTTTACCAATGGAGTTTGGTGGACGAAACCTTGCAGGACAACCATATGGTCAAGTAAACCCCATTGCCGTTGGTACTGTTGTCCTAGTAGGTTTTATTAACTCTGATAAAGATATGCCGATTGTTATTAGTGTATACAATAACAACGATGTGAATAAACAATTATCTCGTACACGTTTTGCTAATGCAGAGCCTACAGATATGGCTTTAGCAGGACAGATGTACCAAAAATTTAGTTTGTACCCATCACTGACTTATGATAGCATTGATGGAGATGGTAACCGAATAGTTACATTCTCAGGTAAATCCTTTATCGCATTTGATACAAAAGACATGCAAAACTCTCCAATGACAGATGCTAGCTACGGTTCTCGTTATGAAGACCTAGGAACATCTTATTACAATGACGGGGAACTAATTGAACCGATGAAAGGTCGAGCACCTAATGTGTTATTCAAACACCAAGGTATTCTTGACGATGATAATAAACCTGATACACATAACTTCATGATTCACATTAACCCAGATGGAACATACCGTACATCTATGATGGATACGGAACAAGACTGGCGGACAATGTTTGAAATGACACCAGAAGGTAAAATACGTTTACGTAGACAGGGAGATACTGTACGCTTAAACGATGGTTTTGAGATTGGTGAGCTAGGTATTAATGAAGAAGGTATCGTTTACCTACGTAATGGGGATATGGACTTAGAAGTTCGTGAAGACGGTATCTATTCCCAAGGTAAACTAATTACAGAAAGTATCAATCTTGATGATATTTATGAAAAGTTAGCTAATGTTACTTTTGAAATTAATAAGACAAATGAGTCCTTGCAAATTTTAGCTGGTAAATCAGAAGTCCAAGATGGTAAAATTGTAAATCTAGAAACAGAAATTACAATTGTAGCCGGTAAAGTAGAGTCTAAAGTAAGTGCAACAGAAGTACAAGACATGATTGACAGTTCTATCGTAGACATGGCAGAGGCTATTAAACAAGCCCAAGAAGATGCAGATAGAGCAAATCAAATTATTTCTGATATGGCTAGTGATAACCGTTTGACTCCTAGTGAGAAGCTAGACTTACTAAAAGAGTGGGACATTGTTAAAAATGAATACCCAACTTATTTAGCACAAGCTGAATTATACGAAGTAGACAGCACGACATATACTGCTAAGTACAAAGCTTTAGAAACATTTGTTACTCCTTTATTGGAAGACATGGAAGCTACTAGTGTAGTAGACGGCTCTATTATGCGTAAAACATTTAGCGCATACTACACAGAACGAATCAACTTACTTAACGCAATTACTAAAGGATTGAAAGATGGTCTAGAGAAAGCGATGAAGAAAGCTTCTCAGGCTTCTGTAGATGCGACACAAGCTTTAGCAGACTCTGCGCAGGCACAAATTGATGCAAACAATGCAAAACAGTTGATTGCAGATATTGCTAGTGACGGTAAGCTGACTGCTTCTGAAAAGTACCAGTTGAAAAAAGAGTGGGACGTTATTGTTAAGGAGTACCCTACAACAATTGCCCAAGCAACAAAGTATAAAGTAAATACTGATAACTATACAGCTAAGTACAAGGCGCTAGAAACATTTGTTACTCCTTTGTTTGCGAACATGGATGAAACAAGTGTTGTTAACGGGGAGCAACTACGGACAGTATTCTCTGATTACTATGCTGTGAAGATTACCTTATTGAAAAGTATTACAGATATTGCTCGTGATGAACTGACTGATTATGGTAACCGTATTACTGTAGCAGAAACAAAAATCACACAAACATCCGAAGCTATCACGTTAATGGCTTCCCGAGTGGAAACTGTTGAAAATGATGTTAGAACAAACACAGCGCAATTGAAAGTACAAGCAGACCTAATTAGTCAGAAAGTAACTGCTAGTGAAGTAAAAGATGCTATTGATAATGCAATTGATAACATGTCTATTGGTGGTTCTAACTTGTTTGTAATCAATACTCAAACAGCAGGACTATTGAATGAAAATAATGGTACTGTAGGAACAGCCGTAGATAAATCTGTAGTATCTAACTATATCAAGGTAACAGCTAGAATGCCTTATGTAGCTTCTTTATATGGAAACACAGGGACAAACAGTATTATCATTGCATGGTATGACACAAGTAAAACGTTTATCTCTGGTCAAGCTGTAGCTGATTCTGGTGATTTCCATAAAACTTATGTTGCACCAGAAAACGCAGTATATGCTCGTTTAAGCTATAAGAAATCTGATACTGTTAAGATGAAATTCGAAGTAGGTACAAAACCAACTGATTACAGCCCTGCATGGGATGATATTAAGGGTGACCAAACTGCTTTAGAGGAATACATCAAACAAGTAGAAGAACAAGCTAAGCAAGCACAGCAAGAAGCGGAAAATGCTAAGAATGAAGCTGAGAATGCAAATAGTGCAATTGCTGACATGTCTAACGACAACATGTTAACAGCAAATGAGAAACAACAAATCTTACTGCAATGGGAAGAAATTAAGACGGAGTACCCAATTAATTTAGACCAAGCAACTAAATTTGGAGTTTCTGCTACGCAATATACAACAGCGTATAATGCACTAAAAACATACTTAGACCCATTGTTGGCAGACATGACAACAACTTCTGTAATTATTGGCTCTACTATGCGCAGTACATTCAATACGTACTATGACCGTAGAACAACATTGCTTAACCGTGTAGCTGACCTAGCTAAACAAGTAGCTGACCAAGCTAAGGATACAGCAGATAAAGTAGACGATGACTTAAACAACATTGGCGGATACAACTATATTGGGTTCTCTTCCGGAGACCATATGTATCCTCGTTTAATGATTAAGAATGTTGGTTACTATGCTGTACCTTCTATGGGGATTGCAGAATTTGTAGGTGACATGGTATGTTTAAAGCCAAAAACAACAGAAAAGAAAGTTCAGTATGAAATTGGCTCCTCATCAGCTAACATAGCCGGTGTTGGTTTAGCAAATTATCGGATGAAAGAAGTTAAAACAGGTCAATGGTTGACTGCTTCTGCAAACTTAAAAGTTGTTGGTACTGGTAAAGCATATATTACTATCTTTACTTTAGAGAACGGCTCTTGGAAATTTTCACTAAGTGATATGGTTACAGCAAGTCAAGGAGTAACTCGTGTAGTAGCTCAAAGAAAAGTGACAGACCAAACACAAGGGGTATTCATACGCATCAGTGGAGATATTATTGATGAAGTTCATTTTGGTAATACACAACTTGAAGTTGGTATTCGCTCTACCCCTTGGAAGAAATCAGACATTGACATTCAAGAAGACATCAATAATGTTGCGGACGATATTAAAGATTATATTGGTGCTCGTTCTGATAACTTAATCACAAATGGTTTTGGTGAACTAGGGAACAATACGAACATTGGTGGTATCTTTGATGGTGCTGATAGAATTGTAGGTAAAGGTTCCTTCCGTCAAGAAGAAGCAAATAAATCACTGCTATTTAGTGAACACATTGTTATTGATAATAAAAAAGTCTACAACTTTGACTACTACATGCACACATTAAAAGGTGTAGGTCGAAGTTATGCAATGATTGCTCCGTATGACGTAGATGGGAAACGTATCACATTTCCTTCTCTCGGGGGACGAAACTACAACTCTACTACCCCTGTTGAATTTACAAAACTGACAAAACCGCTGAAAGTCGGGGATACAGAGGTTTTTGTAGAAGATGTTAGTCTATGGAACGGACAGGCACCGCAAGACTACCAACGTAGTATTATCATGTGGGGCTATAAAAACTCGTTCGGCTATACTTATCCCGATGGAACGTATAGTCAGCTAATGCAGATGAGGACATATGATATTGGTGCAGTTGACACCACAGCTAACAAGATTACGTTAAACAAGCCATGGGCAGTTGCAAATCCAAATAGTTCAGATGGGATTTTCCCAGTAGGGCATACACTTAGCCCAACTTCTGACGGCTCCACATATTTGTATTTGAGTGGTCACGTAAATATACAAGTACCTACTACGTACACCAAGTACAGCCATTTGATTAGTGGCTCTTCTGAGTTTGCTAATACAACGATTATCCCAGTAGAAACAGGTTCTATTCAACTTGGATTCTTGTTGAACCGTGATACAACAGGTGAAAAATCTTGGCTAAATGGTTTACGTCTACGTGACTATACAGATACGTATAAACTAAACGATGACGTTAGAGAAACACAAGAAAACGTAGACAAAGCCCAAGCAGATGCTAATAAAGCTAACCAGTCAATTGCCGACCTATCTAATGATAATCTAGTTACTCCTAACGAGAAATTGGATTTGAAAAAAGAATGGGAAATCATTGTTGCCGAAAAACCTAAGAATGATGCTCAGGCAGATAAGTTCGGGGTAAGCAAAGTAGCTTATGGTACTGCGTATACAGCTTTAAGTAACTACATCACACCTATCTTAGCAAGCACAACAACGAACTCAGCTATTGTAGGGCAAACTATGCGGGACACGTTTAAAGCATATTACACAGCTCGTACAGACCTTTTAAATGCTGTTGCTACAAAAGCGAAAGACCTAGCCGATACAGCTCAGTCTGGGGTAGAACAAGTTAAAGCAAAGGCTGAGAAGGCACAAGCTGATGCTACTAAAGCTCAACAAGATGCAAGTAAAGCACAACAAGATGCTACTAAAGCAAATCAGGCTATTACAGACTTATCTAATGATAATCTAGTTACTCCTAATGAAAAGCTAGACTTGAAAAAAGAATGGGAAATCATTGTAGCTGAAAAACCTATTAACGACACTCAAGCGGATAAATTCGGAGTAAGTAAAACGGACTACGGTACGAAGTACACAGCTTTAAGTAACTACATTACACCTATCTTGACTGATTTAACAACTAATTCCGCTATTGTAGGTCAGACTATGAGAGATACGTTCAGAGCATACTACACTGCAAGAACGAATCTACTAAACTCAATCAGTGTAAAAGCTAAGGAACTAGCAGATAGAGCCCAAACAGATGCTAACAATGCACAGAATAGTGCAAATAACGCACAAAGTTCAGCTAACCAAGCTCAAACGGATGCTACAAATGCACAAAACAGTGCAAACAAAGCTCAAGCAGATGCTACTAAGGCTAACCAATCAATTGCGGACTTGTCCAATGATAATCTAGTTACTCCTAACGAGAAGTTAGAATTGAAAAAAGAGTGGGAAATTATTGTAGCTGAAAAACCCAAGAACGATGCTCAAGCAGATAAATTTGGTGTAAGTAAAACCACCTATGGTACTGCATATAATGCACTGAACACCTATCTAACTCCAATACTGGCAAATTTAACAACAAATTCTGCGATTGTTGGACAGACTATGAGAGATACGTTTAAGACGTACTACTCTGCTCGTACTGATTTATTAAATGCTATTGCATCTAAAGCTAAGGATTTAGCTGATAACGCACAAGATACAGCGGATAACATAGCTGTCGGTACTCGTAACCTTTTAATCGGGACACAGGACTTTTCCAAAGGTAAATATCCGGGGAATACGCATATTACAATTACAGATGAAAAACTGTTTGGAAATGCAGTAATGAAAAATGACTTTACTACAGGTACAGGATACTCAGACATGTATCAACTGACTACCTCAATTATTCCAACAGGTACTCAGTATACGTTATCGTTCTATGCAAAAGCAGATATAGACAAAACAAAAATGTCTTGCTACTTCTACAACCCAAACACTACGGTAAATAGTGTAAACAATCAAGGAGGTAGAATTACCTCTAGTGATGGACGTTCTGTATTCGTTTTAAGTACAGAATGGACTAAATACTGGGTAACTTGGACACAGACACAAGCAGACAGACCTAAATCAGTAATTATTGGTCGTAAGACTGGTGGGGAAGAACCTAACTCTGCTTTCTACATGTCTTCTCCAATGCTAGTAGAAGGGAACAAACCACAAACGTGGATGAAAGCCCCAGAAGACATCGAAACGGCTATAAACGGTAAAGAAGGTGCTTGGGTTTACTCACCAACAGCACCAACAAATCCGGCTATTGGTTTAGTCTGGGTGGATTCTTCTAAGACTCCAAACCAACCAAAACGTTGGGTAGGAGGAGAAACTGGATGGGTTGCTCTAACCCCAGAAGAAGTAAAAGACTTACCTTGGGGTGAAGACGGTTCTAACCTTGCTGACTGGGTGGCACAAGCAGAACAAAAGATTTCTTCTGATGCAATCATTAATACTGTATTAGGTTCTGAGGACTTTACAGGTATCTTTGACAAGAAGGCTAACACAGAAGACTTGAACAACCTTGCTTCTTACGATGACTTAGATGCTATGCAAGCTGAGTATGAACGTTTGCTAAAAGAAGGTATTGCAGGAATTGACTTCTCACCATATGTAACTAATACGGAGTTAGAACAGTTGAAAGATAGCTTCACTTTCTCTGTCCAACAAGCCGGTGGGGTTAATATGTTGAAGAACTCTCTAGGATTCTCTGGGACTGATTTCTGGCAAGCTTCTTCTGGTATAGACACTACCCAGAATGACCAATTAGCTAAATTAGGTTTTGGTTCTGGATTTATGATAAATCGAGTGCAAAATGCAACTATCAAACAAGCGATTGAACTACCAGAAGCTAAACAAGGCTTGCAATATGCTTTGTCCTTCTATATGAACGTAGCTACCTTTGGAGACACTACAGGTTTACAATGTGGGGCACATATTTATGAAGAAGGTGTGCTAAAATACACAGTAGGAGTAACAGATGCTACACAAGGCATTCCAAGTGACTACCACTTGTATAAACTTGTATTTGAACCGGAATCCCCAAATACTGTCATTGAGCTGTTTGTTACAAATGGAGCACAAGCAACTGTAATCATATCAGGGGTTATGTACAACATTGGTAACATTGCGTTGAAATGGCAACCGTACCCAAGTGAAATCTATAATACGAACGTTAAGATTGATATTAACGGTATTACTGTTAAGAATAATCAAACAGATGGTTATACAATGATTACTCCGCAAGAGTTTTCAGGTTACGCAAGGGTTAATGGAGAAATGGAACGTATCTTTACGTTAAATGGTCAGGTAACAGAGGTTAAGATGTTACAAGCAGAGAAGCGTATTACAATGGAACCTATTTCTGTGTTTGCGATGAACTCCAAGGAAACCAACACGATTGGTTGGGCGTTCGTAGCTTCCGGAGATGTTAGCCATACTACGGTGTCTAACACATAA

Genome Context

Genome Context

Tertiary structure

PDB ID
c6fce2c6c7ac11d3890d4db84bf78d240e4e33ef298f0ca0d469f88fe2ef43c1
ColabFold
Source ColabFold
Method ColabFold
Resolution 0,6970
Oligomeric State monomer
Model Confidence
Very high
pLDDT > 90
High
90 > pLDDT > 70
Low
70 > pLDDT > 50
Very low
pLDDT < 50