Protein

View in Explore

Genbank accession

AFL46947.1 [GenBank]

Protein name

putative phage tail protein

RBP type

Evidence RBPdetect2

Probability 0,95

Evidence Phold

Probability 1,00

Protein sequence

MEQFKKKRLPLLIAGAGGKKSSSSSRTPVEADDTVNSRAMASILDLLGEGVIGGLVNGAKSIFIDDLPILNEDGSANYSGITWDFRDGSQDQTPMDGFDFVETPKSINIQLKKTHEVTVSIDNDEADRVRVILKFPSLRSVDKKSGDTNGTAVKYKFQIANGDGTFADVVAEGEKSVEVALTAKKTGVYYRSYELKLPKPGRAYKVRVIRLTDDSKTQYLYNDTWVDSIGEIVDTPMNYPNSALVGLKVNSEQFGSSMPSRSYLVRGLKIRVPSNYNENTNTYVGVWDGTFKLLSSSNPAWILFDVLTNARYGLGQFVSESMIDLGQMYQIGRYCDEEVVDGFGGKEKRFAINTQITSRQDAYRLIQDIAGAFRGMVFWAGGMVNVMQDSPSDPVMMFTNANVKDGLFSYKGSARKDRPSVALVTYNNKEDGYKQNIEYVEDQEAMRRYGERKTEVVAFGCTSRGQAHRVGLWLLYTARMESDVITFTAGLDASFLMPGETVLIQNKYRSGKRNSGRIMSFNKNSITLDAPVSLKKSGSYIRILNQEGKIVERDILETGENITKVTFSKSLASGEMPVMNGIWTITEPDLEPMRVRVINVAQGDAQGSFDVTVVQNNPSKYEAIDNGATLIPENNTVLDPTYSKPTNLQVTEGTYISSPGNLSIKLIATWEGKSAEYWISWRRSDENNVSNWQSARVTEEQYEIINIAENGQYDIQLYAVSFSGKKTEIISTVYKVQGTMTPPGAPTALTAVGDYRNVILNWVNPDSIDLDHINVYASQTNDLDTAKLIAEAASTTFTHAGLGDSETWFYWVRAANKRGMLSPPNSNLGTEAMTKDVLSFLTGKITSSELGQELLEEIDSKVSQEAVDSIYQQMEESLKDLDDKLTAADQRLEEAQNGLKTEVSGTLDKVNDALQQVEDSNAALVELQETVSEQGKAVAGAVEAAHAALDNASALIAEEREARVEGDMANAKQIEAMKSSVDDSVAAVEEMKKTVAEVERASAEVTTNIEALAKTNIDLALRQDEDQHKQMVNNAKIATTQKTFADDMSAMASKVEEIRAEIGEDIRASITEETTARVEADKAIATQITKLEAQINDDIAAAIVTEQEARATADESLSKQITTLQAKVEGDISAALAEEQIARATADESLAQQITTLKAQTGADIKAAVAEETKARTDADSALAGQITDLQAQTGKDISAAITSEATARAEADKALGGRIDTIKAEVDGNSATIQQQAQAIADTNKKVSTAWTLKMETSTSGGQKYVAGIALGIDSTGLSQFLVQADRFGLVNSVNGKITTPFVVENSVAYMNGAFIKDGTITNAKVGDLQSTNFVSGRSGWRFGKNGVLEINGNSGGNGRLVINGQRIDVYDDNNVLRVRIGLL

Physico‐chemical properties

protein length:	1385 AA
molecular weight:	150769,85550 Da
isoelectric point:	4,82798
aromaticity:	0,06498
hydropathy:	-0,36123

Domains

Domains [InterPro]

IPR053171
1–1110

IPR053171 IPR015406

IPR055385
101–235

IPR055385 IPR032876 IPR003961 IPR013783 Coil Coil Coil

IPR003961
644–744

IPR003961

IPR036116
665–822

IPR036116

AFL46947.1

1 1385

Legend: Pfam SMART CDD TIGRFAM HAMAP SUPFAM PRINTS Gene3D PANTHER Other

Domains [InterPro]

InterPro ID	Start	End	Source	Name
IPR053171	1	1110	InterPro	Viral Tip Attachment Protein
IPR055385	101	235	InterPro	Tip attachment protein J, HDII-ins2 domain
IPR032876	358	519	InterPro	Tip attachment protein J
IPR003961	643	725	InterPro	Fibronectin type III
IPR003961	644	744	InterPro	Fibronectin type III
IPR036116	665	822	InterPro	Fibronectin type III superfamily
IPR013783	742	838	InterPro	Immunoglobulin-like fold
Coil	871	898	Coils	None
Coil	907	930	Coils	None
Coil	988	1008	Coils	None
IPR015406	1233	1367	InterPro	Tip attachment protein J, central straight fiber domain

Taxonomy

	Name	Taxonomy ID	Lineage
Phage	Salmonella phage SSU5 [NCBI]	1177632	Viruses > Duplodnaviria > Heunggongvirae > Uroviricota > Caudoviricetes
Host	Salmonella enterica subsp. enterica serovar Typhimurium str. LT2 [NCBI]	99287	Bacteria > Proteobacteria > Gammaproteobacteria > Enterobacteriales > Enterobacteriaceae > Salmonella

Coding sequence (CDS)

Genbank protein accession

AFL46947.1 [NCBI]

Genbank nucleotide accession

JQ965645 [NCBI]

CDS location

range 17749 -> 21906
strand +

CDS

ATGGAACAGTTCAAGAAGAAAAGGCTGCCTCTCCTGATCGCAGGTGCAGGCGGCAAGAAAAGCAGCAGCTCCAGCCGCACGCCGGTTGAAGCCGATGATACCGTTAACTCGCGTGCTATGGCGTCTATCCTCGACTTGCTCGGGGAAGGCGTTATTGGCGGTCTTGTCAACGGGGCAAAGTCGATTTTCATCGACGACCTGCCGATTCTCAATGAAGACGGCTCTGCCAACTACAGCGGTATTACTTGGGACTTTCGTGACGGCTCGCAAGACCAGACGCCGATGGACGGTTTCGATTTTGTTGAAACGCCCAAATCCATCAACATTCAGCTGAAAAAGACACATGAGGTGACAGTCTCCATCGATAACGATGAAGCTGACCGCGTTCGAGTCATCCTCAAATTTCCCTCTCTGCGTAGCGTGGATAAGAAATCGGGTGACACCAACGGCACAGCAGTCAAATACAAGTTTCAGATCGCCAATGGCGATGGAACATTTGCTGATGTAGTTGCTGAAGGCGAGAAAAGTGTTGAAGTTGCCCTGACAGCGAAGAAGACAGGTGTTTACTACCGCAGCTACGAACTCAAACTGCCGAAACCTGGCCGTGCATACAAGGTTCGTGTCATACGCCTAACCGACGACAGCAAAACTCAGTATCTCTATAACGATACGTGGGTGGACTCCATCGGTGAAATCGTCGATACGCCAATGAACTATCCGAACTCTGCGCTTGTTGGACTCAAGGTTAACTCCGAGCAGTTCGGTAGCTCTATGCCTTCTCGTTCGTATCTGGTGCGTGGTTTGAAAATCCGCGTGCCGTCAAACTACAACGAGAATACCAATACCTATGTTGGTGTTTGGGACGGTACGTTTAAGCTGCTGTCATCCTCTAACCCAGCCTGGATTCTCTTCGACGTTCTGACCAACGCTCGATATGGCCTTGGGCAGTTTGTCTCTGAGTCCATGATTGATCTTGGACAGATGTATCAGATCGGTCGCTATTGCGACGAAGAGGTTGTCGATGGTTTCGGCGGCAAGGAGAAGCGTTTCGCCATCAACACCCAGATAACCAGCCGGCAGGATGCCTATCGACTGATTCAGGATATCGCTGGCGCCTTCCGCGGTATGGTCTTCTGGGCTGGTGGAATGGTCAACGTCATGCAGGACAGCCCGTCAGATCCGGTCATGATGTTTACCAACGCAAACGTCAAAGATGGCCTGTTTAGCTATAAAGGTTCAGCTCGTAAAGATCGTCCTTCCGTTGCGCTTGTCACCTATAACAACAAAGAAGACGGCTACAAACAGAACATCGAGTACGTCGAAGACCAGGAGGCGATGCGTCGTTATGGCGAGCGCAAAACCGAAGTGGTTGCGTTCGGTTGTACCAGCCGTGGCCAGGCGCATCGTGTCGGTTTGTGGTTGCTGTATACCGCTCGCATGGAGTCTGACGTTATTACCTTTACTGCAGGTCTTGACGCTTCGTTCTTAATGCCTGGTGAAACCGTGCTGATCCAGAACAAGTACCGTTCGGGCAAGCGCAACTCCGGTCGCATTATGTCCTTTAACAAGAACAGCATCACATTAGACGCACCAGTATCGTTGAAGAAAAGCGGCAGCTACATTCGCATCTTGAACCAGGAAGGCAAGATCGTCGAACGCGACATTCTGGAGACGGGGGAGAATATCACTAAAGTGACGTTCTCGAAGTCTCTGGCATCCGGCGAAATGCCAGTAATGAATGGCATCTGGACTATCACCGAACCAGACCTGGAGCCAATGCGAGTACGCGTTATCAACGTTGCGCAGGGTGATGCTCAAGGGTCTTTCGATGTGACGGTCGTCCAGAATAACCCTTCGAAGTACGAAGCGATAGACAATGGGGCGACGCTGATTCCGGAGAACAACACCGTTCTCGATCCAACATACTCGAAGCCGACAAACCTGCAGGTGACGGAAGGAACGTATATTTCCAGCCCTGGCAACCTTTCCATCAAGCTTATTGCGACCTGGGAAGGTAAGTCTGCTGAATATTGGATCAGTTGGCGTCGCTCGGACGAGAACAACGTTTCTAACTGGCAGTCCGCGCGTGTCACTGAAGAGCAGTACGAAATCATCAATATTGCCGAGAATGGCCAATATGATATCCAGCTTTATGCTGTGTCATTCAGCGGCAAAAAGACTGAGATCATCAGTACAGTCTATAAAGTTCAGGGAACGATGACACCGCCAGGCGCACCGACTGCGTTGACAGCCGTGGGTGACTATCGCAACGTGATTCTGAATTGGGTTAACCCTGATTCAATCGATCTCGACCACATCAACGTGTATGCGTCACAGACCAACGACCTGGACACCGCAAAACTGATTGCCGAGGCCGCCAGTACTACTTTCACCCATGCAGGTCTGGGGGATAGCGAAACGTGGTTCTATTGGGTTCGCGCGGCAAATAAGAGAGGCATGTTGAGTCCGCCAAACTCCAATTTGGGTACCGAGGCGATGACAAAGGATGTTCTCTCATTCCTGACAGGGAAAATCACATCTTCTGAGTTGGGACAGGAGTTGCTTGAGGAAATCGACTCTAAGGTTTCTCAGGAGGCTGTTGATTCTATCTATCAGCAGATGGAAGAGAGCCTCAAAGATCTCGATGACAAGTTGACGGCGGCAGATCAGAGACTAGAAGAAGCGCAAAACGGGCTTAAAACGGAAGTGTCCGGCACTTTGGATAAGGTCAATGACGCTCTGCAACAGGTTGAAGATTCCAATGCGGCTTTAGTTGAGTTACAGGAAACTGTATCCGAGCAGGGCAAAGCCGTAGCTGGCGCGGTCGAAGCAGCTCATGCAGCACTCGATAATGCCTCTGCATTGATTGCCGAAGAACGTGAGGCCCGAGTAGAAGGCGATATGGCGAACGCCAAACAGATTGAGGCGATGAAGTCTTCTGTTGACGATAGCGTTGCTGCTGTTGAAGAGATGAAGAAAACTGTGGCCGAAGTCGAGCGAGCCAGCGCGGAAGTGACCACCAATATTGAGGCATTGGCCAAAACCAATATCGATCTTGCTCTGCGTCAGGATGAAGACCAGCACAAGCAGATGGTCAATAACGCGAAGATTGCCACCACTCAGAAGACGTTTGCCGACGATATGTCTGCAATGGCCTCGAAAGTGGAAGAGATCCGCGCAGAAATTGGTGAAGATATTCGCGCTTCTATCACTGAAGAAACGACGGCTCGTGTTGAGGCTGATAAGGCTATTGCGACCCAAATAACCAAGCTTGAAGCTCAGATTAACGACGATATCGCTGCGGCAATTGTGACCGAACAAGAGGCTCGTGCAACAGCGGATGAGTCGTTGTCGAAGCAGATCACAACATTGCAAGCGAAGGTTGAGGGAGATATCAGCGCGGCGCTGGCCGAAGAGCAGATTGCAAGAGCGACCGCCGACGAATCGTTGGCGCAACAAATCACAACACTAAAGGCCCAAACAGGCGCCGACATTAAGGCGGCTGTTGCGGAAGAAACGAAAGCCAGAACCGATGCCGACTCTGCGCTGGCAGGGCAAATCACCGATTTGCAGGCTCAGACAGGAAAAGATATCAGTGCCGCAATTACTTCTGAAGCAACTGCACGCGCGGAAGCCGATAAAGCACTAGGTGGTCGTATTGATACGATTAAGGCTGAAGTAGACGGCAACTCGGCCACTATCCAGCAGCAGGCCCAGGCAATTGCCGATACCAACAAAAAGGTTTCGACAGCGTGGACGCTTAAAATGGAGACTTCCACGAGCGGTGGCCAGAAATATGTTGCCGGTATCGCGCTGGGCATTGATAGCACAGGTCTTTCTCAGTTCCTTGTTCAAGCAGACCGCTTTGGTCTTGTGAACTCGGTTAACGGGAAAATCACCACACCGTTTGTGGTCGAAAACAGCGTTGCTTACATGAACGGCGCTTTTATCAAGGATGGAACAATCACCAACGCCAAAGTTGGCGACCTACAGTCCACCAACTTTGTCTCTGGCCGTTCGGGATGGCGCTTTGGGAAAAATGGCGTGCTGGAGATCAACGGTAATAGTGGCGGTAACGGTCGTCTGGTCATCAACGGCCAGCGTATCGACGTCTATGACGACAACAACGTTCTCCGAGTGAGGATTGGGCTTCTTTGA

Tertiary structure

PDB ID

73d2000b6968b4d62f4deee2f823278edd56f014632f5cd678046c2912b8146f

ESMFold

Source ESMFold

Method ESMFold

Resolution 0,6927

Oligomeric State monomer

Download PDB

Model Confidence

Very high
pLDDT > 90

High
90 > pLDDT > 70

Low
70 > pLDDT > 50

Very low
pLDDT < 50

Literature

Title	Authors	Date	PMID	Source
Complete Genome Sequence of Bacteriophage SSU5 Specific for Salmonella enterica serovar Typhimurium Rough Strains	Kim,M., Kim,S. and Ryu,S.	2012	22966187	GenBank

Protein

Domains

Domains [InterPro]

Domains [InterPro]

Taxonomy

Coding sequence (CDS)

Coding sequence (CDS)

Tertiary structure

Predicted Aligned Error (PAE)

Model Confidence

Literature