Genome and I in 2020
(執筆は2020年)
ゲノムと私の四半世紀
今年(2020年)、大学院に入ってからちょうど四半世紀、丸25年を迎えて区切りの年を迎えている。 以前(2005年)に研究活動10年の節目にRNAと私の10年を書いた。 それから早15年。 25年の節目の今、ゲノムと私の四半世紀ということで、ゲノムとの関わりを焦点に書いてみようと思う。
そもそもゲノムという言葉を意識したのは、1993年に受けた生物物理学の講義である。 その講義をされていたのは永山國昭先生で、そのころは私が所属していた東京大学教養学部基礎科学科におられた。 ヒトゲノムプロジェクトに関する新聞記事が配られ、旬なネタとして紹介された。 その時にゲノムにかんする研究やりたい、とおぼろげに思ったことを今でも覚えている。 その後の卒業研究では、分子生物学のラボに属してDNAやRNAを扱う研究(いわゆるウェット)を始めたものの、大学院の進路の関係でそれは続けられなかった。 そのラボの大学院には受からなかったためであり、ウェットの研究を積極的に止めたわけではない。 それがベースにあるため、今でもウェット&ドライな研究を目指しているのである。
そういうわけで、大学院生時代(1995-2000)は一転ピペットをキーボードに持ち替えた研究をすることになった。 今でいうドライな研究である。 ゲノムネットを運営していたラボで、生命科学分野のデータベースの日本での提供やBLASTやClustalWなどのサービスを行っていた。 自分の研究としては、ゲノムが決定された微生物の(タンパク質配列の)読み枠(Open Reading Frames(ORFs))を相手に(今でいう)配列解析をしていた。 しかもそれらは核酸配列からアミノ酸配列に翻訳した配列群で、「ゲノム研究」といいつつゲノム配列じゃない、でもゲノム配列から得られた情報が研究対象だった。 複数の、ゲノムにコードされた全てのORFs由来のアミノ酸配列を配列類似性検索かけて結果を回収するために独自のプログラムを作成し、最終的にそれらのコードをBioPerlのFTPサイトに置いてもらったり。 当時はそれをプログラムというと怒られるような時代だったが、systematicにプログラムを実行し個別の結果をparseして必要なデータだけ残すという作業自体は現在も変わっていない。 現在もやっている「配列データ解析の基本型」をその時に習得した気がする。 また、その時配列類似性検索に使っていたデータベースはSwissProt(現在のUniProtKB)で、そこから今使われているゲノム配列解読されてきれいに機能アノテーションされたタンパク質配列セットが整備されていったのである。 しかしながらその時には、ゲノム配列を直接何かするということはなく、ゲノムから予測されたタンパク質配列、しかも酵素やシグナル伝達に関わる遺伝子だけを見ていた。
理研ポスドク時代(2000-2003)は、ゲノム科学総合研究センターに所属していた。 やはりゲノムを直接に、ではなく、ゲノムから転写されたmRNAを逆転写したcomplementary DNA(cDNA)がメインだった。 出発点が誰かが決めてくれた(予測)アミノ酸配列ではなくcDNAになり、自らアミノ酸配列に翻訳しながら比較するように変わったものの、やっていることは本質的に同じだった。 その集大成がFANTOMである。 FANTOMの詳しい説明は他所に譲るが、結果として非コードRNA(non-coding RNA(ncRNA))がその研究成果としてみんなが注目するようになった。 FANTOMを始めたその頃はヒトゲノムやマウスゲノムの完了報告の時期だったので、「ゲノム配列があるとき」を想定した新しい研究方法を考えていた。 その一つが、遺伝子コード領域の外側にある遺伝子制御配列の解析である。
その流れで、埼玉医大ゲノム医学研究センター時代(2003-2007)は、研究を進めた。 解読したゲノムから得られた配列を元に設計したプロモーターアレイを設計・作成し、ChIP(Chromatin Immunoprecipitation)解析と組み合わせて(ChIP-on-chip)、転写因子の新規ターゲット探しをしていた。 その結果を、知られていた転写因子結合配列のコンセンサスパターンを先にゲノム中から予測する仕組みを作って比較するようなことをやっていた。 ゲノムタイリングアレイなるものが一時期流行ったが、それはちょうどその頃である。
DBCLS時代(2007-2020)はウェットの現場から離れてデータベースの整備とその利用普及に明け暮れていた。 しかし、ゲノム配列情報を中心としたデータベース化された生命情報の流通促進に寄与できたのではないかと思う。 特にデータベースやツールのチュートリアル動画を作成する統合TVプロジェクトと全国の大学や研究機関を行脚して行ってきた統合データベース講習会。 それらで得た経験は、自ら執筆することになった複数の本の編集やコンテンツに生かされている。
そして今年(2020年)、広島大学でゲノム編集の卓越大学院(ゲノム編集先端人材育成プログラム)でバイオインフォマティクスを教える教員として雇ってもらえることになった。 それと同時に、同大学に2019年に設置されたゲノム編集イノベーションセンターにbonohulabと呼称する研究室を構えることになった。 さまざまな生物種でゲノム編集を使った実験が可能となるように、ゲノム配列解読も視野に入れた研究計画を練りつつある。 特別な設備を持たない研究室においてもゲノム配列が可能となってきており、それも含めてウェット&ドライで進めていきたい。 そしてなんとか、それをする予算を獲得することができた(と言ってもお試しでまずやってみるという予算だが)。
という具合に、所属機関名やプロジェクト名にゲノムと入ったところにずっといたことが振り返ってみて、よくわかった。 そして今、生命現象をゲノム配列からHackする楽しみを広めたい気持ちでいっぱい、そんな2020年、研究を始めて25年の節目。 これから多くの若い大学生・大学院生にその楽しさを伝えていきたい。