Protein

View in Explore

Genbank accession

YP_007011007.1 [GenBank]

Protein name

central tail fiber J

RBP type

TSP

Evidence RBPdetect

Probability 0,84

Evidence RBPdetect2

Probability 0,96

Evidence Phold

Probability 1,00

Protein sequence

MSSGGGKASTPKLLDDNLKSKQFYRVLDLISEGPIAGPVDQEHMSSFMLNKTPITDASGNVNVNGISVAWRPGSETQQPINGFSAIEATTIVNTDVTHDTPLVRTITDQDVTRVRFNVGVTGLVEQDTKGNQNNTSVTMVLESRTGASGWVIEKTVTITGKISGQYLEAHLIDAPDIKPFDIRVRRITPDSSSDLLSNGTIWNSYSEITDDNLSYPFSAIAGAVIDRDQYTDTPSRTYHLRGLIVDVPDNYDPIARTYSGLWTGGFKKAWTNNPAWLFRELAKNTRFGLAKRAGYIDVDDGALYVLSQYCDQLVNDGYGGQEPRMTLNAYITEQASARDILDKIASMFRGIALWDGMRLSVMLDAPQDPIATITNSNVVDGEFKRSSVKRSEKYNAVVVSWTDPDNGWEQVKEYVSDDEMIARGNYNETTLEAFGCTSRGQAWRAGKWLLETAKRESSRLSFQMARDAIHFTPGDIVEIMDNNYAGARLGGRIMSHSGNKITVDAVESSLIAGGDTMSIMGSSGKFVKYVIDGVANNVVTLKTTPSWVRDGTVFAISTSNVSTRLFRILSVAETENNSVYSITASQHDPNKQAIVDEGAVFEIPNDTLNGYRVPNVENLRIINTNSETVQVMATWETATTTKKLVFELYVYSGDGKVVSQYETDQFRYEFYGLAAGSYTLGVRGRNENGMKGVETQISMIIGAPPAPSSIIWTPGLFSADLVPVMRITATTDTSFEFWYSGQNKITDPANIEDLAQFLGRSNQWTLHGLQADKTYYVYVRTRNAFGVSEFVEASGQASSDIPGMIDLIDEQIRESDAFKNVQEGVDINLEGVMSNALANHGKVEHQYQQYGEVRADILVVKTTVATAEQGLADLSTYVQAQIGPEGELTSAVNQKMTAEVNSDGTAKASYTLNMGIVRNGVKYNTGFGMSIEPSGNSYKSTVVFAAEQFGIYSGNNPGNWQAAFFVYNGQVFIRSALIQEASIDFAKITDSLQSANFIPGGGGRGWNLPKSGSPEFHGKLYADSGEFAFNGVNNVTRIDGNGITVNLSGGGRVVVGRWT

Physico‐chemical properties

protein length:	1059 AA
molecular weight:	115696,66990 Da
isoelectric point:	4,96394
aromaticity:	0,09160
hydropathy:	-0,29292

Domains

Domains [InterPro]

IPR053171
1–880

IPR053171 IPR015406

IPR055385
87–211

IPR055385 IPR032876 IPR055383 IPR057587

IPR003961
613–691

IPR003961 IPR003961

IPR036116
617–792

IPR036116

IPR003961
726–794

IPR003961

YP_007011007.1

1 1059

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR053171	1	880	InterPro	Viral Tip Attachment Protein
IPR055385	87	211	InterPro	Tip attachment protein J, HDII-ins2 domain
IPR032876	332	494	InterPro	Tip attachment protein J
IPR055383	606	704	InterPro	Tip attachment protein J, Fn3-1 domain
IPR003961	613	691	InterPro	Fibronectin type III
IPR036116	617	792	InterPro	Fibronectin type III superfamily
IPR057587	706	809	InterPro	Tip attachment protein J, second Ig-like domain
IPR003961	719	788	InterPro	Fibronectin type III
IPR003961	726	794	InterPro	Fibronectin type III
IPR015406	891	1020	InterPro	Tip attachment protein J, central straight fiber domain

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SPN3UB [NCBI]	1147140	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica subsp. enterica serovar Typhimurium [NCBI]	90371	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Salmonella

Coding sequence (CDS)

Genbank protein accession

YP_007011007.1 [NCBI]

Genbank nucleotide accession

NC_019545.1 [NCBI]

CDS location

range 21678 -> 24857
strand +

CDS

ATGTCTTCAGGTGGTGGTAAAGCATCAACCCCAAAACTCCTCGACGATAACCTCAAATCAAAACAGTTTTACCGGGTTCTCGATCTGATATCGGAAGGTCCGATTGCAGGGCCTGTCGATCAGGAACACATGTCATCGTTTATGCTTAACAAGACACCAATCACGGATGCAAGCGGAAACGTTAATGTGAATGGAATTAGCGTAGCGTGGCGCCCCGGATCGGAAACTCAGCAGCCAATTAATGGCTTTTCTGCTATTGAAGCAACCACCATCGTAAACACAGATGTAACCCATGACACCCCTCTTGTTCGTACCATAACCGACCAGGACGTAACCCGGGTGCGGTTCAACGTAGGCGTTACCGGTCTGGTTGAGCAGGACACTAAAGGAAACCAGAACAACACTTCCGTCACCATGGTGCTTGAGAGTAGAACAGGTGCTTCAGGATGGGTCATTGAAAAGACAGTTACTATCACCGGTAAAATATCAGGCCAATATCTCGAGGCTCATCTGATCGACGCTCCAGATATTAAGCCGTTTGATATTCGTGTACGCCGCATTACGCCTGACAGCAGCAGCGATTTACTGTCCAACGGCACTATCTGGAATAGCTACAGTGAAATCACCGACGACAATCTGAGCTACCCATTTTCAGCCATCGCTGGCGCTGTTATCGACCGCGACCAGTACACTGACACTCCAAGCCGCACCTACCATCTTCGCGGACTGATTGTGGACGTTCCTGACAACTATGATCCGATTGCCAGAACTTACTCGGGGTTGTGGACTGGCGGATTCAAAAAAGCGTGGACTAACAACCCGGCGTGGCTGTTCCGTGAACTGGCCAAGAATACGCGTTTTGGCCTGGCGAAACGTGCCGGTTATATCGATGTAGATGACGGTGCGTTGTACGTCCTCTCACAATATTGCGATCAGCTTGTGAACGATGGCTATGGCGGGCAGGAACCAAGGATGACGCTGAATGCCTATATTACCGAGCAGGCGAGTGCGCGTGACATTCTCGACAAGATAGCGAGCATGTTTCGGGGTATAGCGCTGTGGGACGGGATGCGACTGTCTGTCATGCTGGACGCGCCACAGGATCCGATAGCGACAATCACGAATTCTAACGTGGTTGATGGCGAGTTCAAGCGTAGCTCCGTGAAGCGTTCAGAGAAATACAATGCCGTTGTTGTGTCCTGGACTGACCCTGATAACGGCTGGGAGCAGGTAAAAGAGTATGTTTCCGACGATGAGATGATTGCCCGCGGAAACTACAACGAAACCACTCTTGAGGCGTTTGGCTGTACCTCACGCGGTCAGGCATGGCGAGCAGGGAAATGGCTGCTGGAAACAGCAAAGCGTGAAAGCAGCAGACTGTCTTTCCAGATGGCGCGCGATGCTATCCACTTCACACCGGGTGACATAGTTGAAATCATGGACAACAACTATGCTGGCGCGCGGCTCGGCGGCAGAATTATGTCACATTCAGGCAATAAAATTACCGTTGATGCTGTCGAATCATCGCTTATAGCTGGCGGCGATACCATGTCTATCATGGGGAGCAGCGGTAAGTTCGTGAAGTACGTCATTGATGGCGTTGCTAACAACGTTGTAACCCTGAAGACGACTCCATCATGGGTGCGGGATGGAACAGTGTTTGCTATCTCTACCAGCAACGTTTCAACTCGGTTATTTCGTATCCTCAGCGTCGCAGAGACAGAAAACAATTCCGTATACAGTATTACTGCATCACAGCATGATCCGAATAAACAGGCCATTGTGGATGAAGGCGCAGTGTTCGAAATTCCTAACGACACGCTTAATGGCTACCGCGTTCCGAACGTTGAAAACCTGCGGATTATTAACACCAATTCGGAAACGGTACAGGTTATGGCGACATGGGAAACAGCTACGACGACCAAAAAGCTTGTTTTCGAACTTTATGTCTACTCGGGTGATGGGAAAGTGGTTTCTCAGTACGAAACAGACCAGTTCCGGTATGAGTTTTATGGGCTGGCCGCCGGTAGCTACACGCTGGGTGTTCGTGGCCGCAATGAAAACGGGATGAAAGGTGTTGAAACGCAGATCAGTATGATTATCGGTGCGCCACCTGCACCATCCAGCATTATCTGGACGCCCGGCCTGTTTTCTGCTGACCTGGTGCCAGTCATGCGTATCACCGCCACCACAGATACTTCTTTCGAATTCTGGTACTCAGGGCAAAACAAGATTACCGATCCGGCTAATATCGAAGACCTGGCGCAGTTTTTGGGGCGCTCAAACCAGTGGACACTCCACGGCCTGCAGGCAGATAAGACATATTACGTTTATGTGCGCACCAGGAATGCTTTTGGTGTGTCTGAGTTTGTTGAGGCGTCAGGTCAGGCGTCATCCGATATTCCAGGTATGATAGATCTCATTGATGAGCAGATACGCGAGTCAGACGCGTTCAAAAATGTTCAGGAAGGTGTCGACATTAACCTGGAAGGCGTCATGTCGAACGCACTGGCTAATCACGGTAAGGTTGAACATCAGTACCAGCAGTATGGGGAGGTTCGCGCCGACATCCTTGTTGTGAAAACAACTGTCGCTACTGCCGAGCAGGGGCTCGCCGATCTTTCCACTTACGTACAGGCACAAATAGGCCCTGAAGGAGAGTTAACCTCAGCCGTAAATCAGAAAATGACCGCTGAGGTAAATAGTGATGGGACTGCAAAAGCCTCTTACACACTCAATATGGGGATTGTCAGGAACGGTGTGAAATATAACACCGGATTCGGCATGTCTATCGAGCCATCGGGGAATAGCTATAAATCTACCGTTGTATTTGCCGCGGAACAGTTCGGCATTTATTCCGGTAATAACCCCGGCAACTGGCAGGCTGCATTCTTCGTCTATAACGGACAGGTATTTATTCGTAGCGCATTAATTCAGGAAGCATCCATCGATTTTGCGAAAATTACCGATTCACTTCAGTCTGCAAACTTTATCCCCGGTGGTGGTGGACGCGGATGGAATTTACCAAAATCTGGTAGCCCAGAATTCCATGGGAAACTCTATGCCGACAGCGGTGAATTTGCATTTAACGGAGTGAATAACGTTACTCGCATTGACGGCAATGGGATCACAGTAAATCTCTCAGGAGGTGGTCGTGTTGTTGTTGGACGATGGACATAA

Tertiary structure

PDB ID

271a01a4eb7bba8d90da4205ac770e619d49a6cd5eac27685dbc0d33df8f4b0f

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,8070

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence