Pfamから得たプロファイルHMMでhmmsearch
カイコ(Bombyx mori)のEnolaseに関する論文がacceptになりました。研究成果としてすでに公開されている配列情報データベースから候補をドライ解析(in silico)で探し出してきて、それらをウェットベンチで精査し、実際に確認したところに新規性がある研究です。この論文で使用した候補の探し方を紹介します。
まずはhmmerをインストールします。
brew install -v hmmer
で簡単に入ります。
そして、タンパク質ファミリーのデータベースPfamから利用するタンパク質ファミリーを検索します。今回の場合はEnolase_CとEnolase_Nがそれで、どれが利用すべきエントリかを選ぶところで生物学的な知識が発揮されます。Curation & model タブ中のHMM informationにあるdownloadからタンパク質配列のプロファイル(profile HMM)をダウンロード、ダウンロードしたファイルをEnolase_N.hmmと名前を変更し、以下のようにhmmsearchを実行します。
hmmsearch Enolase_N.hmm Bombyx_mori.GCA_000151625.1.30.pep.all.fa
Enolase_C.hmmに関しても同様に実行し、ヒットしてきた=このドメインを含むとみなされる候補のcDNA(or 予測遺伝子)配列を利用して、その後のベンチでの実験に使ったというわけです。