ゲノム情報に基づく遺伝子機能予測と パスウェイ解析

坊農 秀雅

生物学はポストシーケンス時代へと移行しつつある。 ポストシーケンス時代の遺伝子機能解析ではターゲットとなる遺伝子配列があらかじめすべて分かっていて、 その分かっている情報が最大限活用され、例えばリン酸化される可能性のあるシーケンスモチーフなどがあらかじめ提示される。 そういった機能予測情報は、例えば膨大な組み合わせの考えられる遺伝子間相互作用の可能性を絞り込むことなど実験の手間を減らし、生物学の理解の速度を加速する。 著者は「パスウェイ解析」と呼ばれる方法、すなわちゲノムの決まったある特定の生物種の遺伝子すべてを、現在までに生物学的知識としてまとめあげられているパスウェイの上に載せる方法で、ゲノムスケールの遺伝子機能を予測することを検討した。 具体的には代謝パスウェイを例として (1) 遺伝子コード領域が容易に予測可能な微生物と (2)cDNA 配列情報から遺伝子構造が実験的に得られている哺乳類のモデル生物マウス で解析を行った。

20世紀初頭より蓄積された代謝パスウェイの知識に対して、酵素の機能割り当てを双方向からのスコアの最高値を取る配列相同性検索(bi-directional best hit) を利用して、ゲノムが決まったばかりの生物種で代謝パスウェイを再構築するシステムGFIT(Gene Function Identification Tool) を開発した。 そしてGFITを使って当時ゲノムの決まった生物種(9種類)すべての遺伝子配列から各生物種のオーソロガス遺伝子を割り当てていくことで20種類のアミノ酸合成経路の再構築を行い、その結果アスパラギン酸アミノトランスフェラーゼ[EC: 2.6.1.1] の基質特異性の緩和を仮定することで大腸菌(E.coli )、ヘムフィルス(H.influenzae)、枯草 菌 (B.subtilis) では完全に、またシアノバクテリア(Synechocystis sp.) と酵母菌 (S.cerevisiae) ではおそらく、再構築されると予測できた。 また高等真核生物では遺伝子のエクソン・イントロン構造や選択的スプラインシングの多様性の問題から、ゲノム配列のみからコンピュータ予測される遺伝子構造だけでは遺伝子の数が確定しない問題がある。 哺乳類のモデル生物マウスにおいては cDNA として実験的に得られた転写配列情報が、理化学研究所マウスエンサイクロペディアプロジェクトによって大量に利用可能となったのでそれを利用して代謝経路の再構築をマウスにおいても解析した。 さらに理研20kマイクロアレイを用いたマウス20 組織の発現プロファイル情報も合わせて、より多くのデータを組み合わせた代謝パスウェイ解析を行い、トリプトファン分解経路においてこれまで知られているパスウェイとは別のパスウェイの存在を示唆する結果が得られた。


Download full paper;
PDF (648 Kb)
supplemental materials
Hidemasa U Bono