代謝パスウェイデータベースを用いた酵素遺伝子の機能予測

Systematic Prediction of Enzyme Genes Utilizing the Metabolic Pathway Database

理学研究科生物科学専攻 坊農秀雅

生物学はゲノムシーケンシングの時代に突入した。シーケンシングが終了した 後のゲノムプロジェクトの次のターゲットはその生物が持つすべての遺伝子の 機能の解析である。

KEGG (Kyoto Encyclopedia Genes and Genomes) は京都大学化学研究所スーパー コンピューターラボラトリーで行なわれている計算機による遺伝子の機能解析 のプロジェクトである。そのKEGGプロジェクトの一環として、生物学でもっと も良く研究がなされてきた代謝パスウェイを扱った。酵素反応を特徴づける酵 素番号のおかげで代謝パスウェイをコンピューターに応用することができた。

我々はORF (Open Reading Frame) が決定されたタンパク質配列から酵素番号 を割り当てるシステムを開発した。システムは複数の質問配列とこれまでにゲ ノムの決まった生物種すべての遺伝子に対して相同性検索を行い、質問配列の orthologous gene(オーソロガス遺伝子)を割り当て、その結果を総合して酵 素遺伝子の機能を予測する。また、代謝パスウェイデータベース、PATHWAYを 利用して、各生物固有の代謝パスウェイを再構築するシステムも開発した。

再構築された各生物固有の代謝パスウェイを調べることでmissing enzyme(欠 けている酵素)を見いだすことができる。その例としてゲノムの決まった生物 種すべてでアミノ酸合成パスウェイの再構築を行った。2種類のMycoplasmaは ほとんどこのパスウェイを構成する酵素がなかったのに対し、E.coli, H.influenzaeSynechocystisでは再構築が可能であった。 missing enzymeを詳細に解析することでPATHWAYにあるデータを修正すること ができる。また、missing enzymeと同じ機能を持つタンパク質配列を用いて、 missing enzymeのORFの予測も可能である。


Download full paper;
PDF (560kb)
Hidemasa U Bono