遺伝子機能予測から遺伝子機能アノテーションへの20年
このブログでも紹介したカイコアノテーションパイプラインは急に思い立ってそれを開発したわけでなく、大学院時代から続けてきた遺伝子機能予測の延長上にある研究です。 1998年に出した初めてのfirst author論文は、今ではどちらかというとKEGGのパスウェイデータ解析の最初の論文としてciteされることが多いようですが、実はゲノムスケールの遺伝子機能予測ツールGFIT(Gene Function Identification Tool)に関する最初の論文です。対象はゲノム配列が決定され、そこから予測された読み枠(ORF: Open Reading Frame)から得られるアミノ酸配列セットに対して、でした。 さらに、対象とする生物種を高等真核生物のマウスに、mRNAから逆転写して得られるcDNA配列セットに対してこの遺伝子機能予測を適用しました。しかし、機械的に遺伝子機能予測しただけでは不十分だろう、ということで、その予測結果を専門家に集まってもらってすべて見てもらうことにしました。それが、遺伝子機能アノテーション(注釈)といわれるようになり、それこそがFANTOM(Functional Annotation of Mouse)と呼ばれているものです。 FANTOMは遺伝子機能アノテーションから離れてどんどん進化していっていますが、遺伝子機能アノテーション自体はさまざまな生物種でゲノムワイドな解析をする際に必要不可欠です。近縁のよく遺伝子機能アノテーションがなされている生物種に配列類似性検索をALL対ALL、すなわち全てに対してかけてその対応を取ることがなされています。カイコアノテーションパイプラインに関しては、ヒトの疾患モデル動物としてカイコを使うことを意図した研究でしたので、そこを近縁のショウジョウバエに敢えてせずにヒトを使ったという点がポイントでした。