Machine Learning for Life Science
機械学習を生命科学に使う!
ヒトゲノム解読プロジェクトが始まった1990年代から、ニューラルネットワークや隠れマルコフモデル(HMM)などの機械学習を生命科学データに適用することは行われてきた。 当初は解読したゲノム配列の中のどこに遺伝子があるかを見つけるGene Findingや、RNAの二次構造予測などに。 そのうちいくつかは実用的なアプリケーションとして今も使われており、特に私などはHMMを実装したツールHMMERを使ってきた。 HMMERを使って興味のある機能を持つタンパク質の持つ配列の特徴を記述し、またそのHMMを塩基配列から予測したアミノ酸配列に対して検索することで新たな生物種でのその遺伝子配列を見出すなどしてきた。
その後四半世紀経って、対象するデータも広がり、データ量も増えてきている昨今。 このような「機械学習を生命科学に使う!」というようなタイトルの「実験医学増刊」が出版されることにこの分野の変化を感じる。 生命科学を研究する上で、必須の実験手法になっているのだ。
これも、じっくり読んで勉強したい。