Fanflow4Insects

昆虫用Fanflowにいたるまで

論文がまた一本出た。 と言っても、bonohulabからは、去年2021年12月以来、ほぼ半年ぶり。 久しぶりの自分がfirst authorの論文だった(と言っても1年4ヶ月ぶり)。 今回のテーマは、機能アノテーションのためのワークフロー。 遺伝子の機能アノテーションこそが私の研究人生のスタート地点であり、今なお取り組んでいるテーマである。

今年2022年から遡ること約四半世紀(25年前)、バクテリアのゲノムが次々と決定されてOpen Reading Frame(ORF)がゲノム中に予測されコードするタンパク質配列の情報も合わせて公開されていたのを利用する研究をということで始めた。 その時に作ったシステム名が Gene Function Identification Tool (GFIT)。 遺伝子機能予測のシステムで、主に酵素遺伝子に対してその酵素番号を予測するということでKEGGでも使っていただいた。

Reconstruction of Amino Acid Biosynthesis Pathways from the Complete Genome Sequence. 1998 DOI: 10.1101/gr.8.3.203

その仕組みを理研で当時集めていたcDNAコレクションにもということで。 ただ、機能予測しただけではコミュニティーの賛同を得られないと考え、その機能予測した結果をいろんなバックグラウンドの研究者に見てもらうという会を企画した。 それが Functional annotation of mouse (FANTOM) になっていった。

  1. Functional Annotation of a Full-Length Mouse CDNA Collection. 2001 DOI: 10.1038/35055500
  2. Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs. 2002 DOI: 10.1038/nature01266

そして、機能アノテーションの「パイプライン」を作成した。

Development and Evaluation of an Automated Annotation Pipeline and CDNA Annotation System. 2003 DOI: 10.1101/gr.992803

それをカイコの研究でも、ということで、Kaiko Annotation Pipeline も作って、それを使って

Identification of Key Uric Acid Synthesis Pathway in a Unique Mutant Silkworm Bombyx Mori Model of Parkinson’s Disease. 2013 DOI: 10.1371/journal.pone.0069130

それをさらに多くの昆虫種に使えるように改良を重ね、さらにnon-coding RNAや発現情報からの機能アノテーションパイプラインをプラスして「ワークフロー」となり、今回の Fanflow4Insects となった。

Systematic functional annotation workflow for insects. (2022) DOI: 10.3390/insects13070586

for insectsに限定しているのは、他のいろんな生物種に適用できるようにして、Functional annotation workflow (Fanflow)としたいから。 まだまだ完全というには程遠いが、より実際にワークフローとして使ってもらえるようにしていきたい。


Written by Hidemasa Bono in papers on 火 28 6月 2022.