Bono本読書会

Written by bonohu in drbonobon on 日 15 10月 2017.

拙著の読書会の企画が公表され、参加者の募集が開始に。ConBio2017(第40回日本分子生物学会年会+第90回日本生化学会大会)の終わった次の週の2017年12月16日の土曜日に、場所は静岡駅前のビルの会議室にて。

静岡駅前は、一泊4,5000円台のホテルも多数。夜の部も企画される模様なので、一泊してはいかが。次の日は日曜日なので、駿府城跡を散策したり、新静岡駅から静鉄で乗り鉄して新清水駅まで行ってすぐ近くの清水港の河岸の市で魚を買って帰る、など。なかなかの小旅行となってよいのではないかと。 また、バスを使えば登呂遺跡にも、そして徒歩圏内にさわやかもあるとの情報。

学生さんは参加費無料に。会場にて、お会いましょう。

Continue reading »


職場でのGitHubの利用法

Written by bonohu in misc on 土 14 10月 2017.

(このエントリは、Mishima.syk#11のLightning Talkネタ)

職場では、GitHubを日常的に使っている。その実例を紹介する。

  1. 統合データベース講習会AJACSでは講習会資料が基本GitHubで管理している。講師は講習資料をmarkdownで作成し、それを講習会のrepositoryにpull requestを送る。 それを管理者がmerge。講習会配布資料が紙で配られるが、それは整形されたmarkdownのそれをPDFに変換して印刷しているだけで、手間がかからないようになっている。

  2. 最近、data journalのScientific dataに論文の出たRefExは、そこで作成したコードやデータはすべてGitHubのRefExに。データに関しては、公共データアーカイブのfigshareにも。

  3. 現在開発中の公共オミックスデータ目次AOEも。

追伸: Bono本出ました。

追伸その2: 第2回 SPARC Japan セミナー2017 「プレプリントとオープンアクセス」、やります。

Continue reading »


xenomeその後

Written by bonohu in misc on 金 13 10月 2017.

githubに復活したものの、実行が終わらないxenome。他の人も同様な状況らしく。1.0.1に関することとか書かれていたので、ちゃんと見て試そうと思っていたが。そのバージョンでもうまくいかないとのレポートも。もうちょっと待つか…

Continue reading »


研究会ラッシュ

Written by bonohu in misc on 木 12 10月 2017.

気がついたら今年度の後半戦。ちょっとした研究会ラッシュ。これから広報を開始するフェーズの研究会や、旅費の申請が通ってこれから実行に移す、これから企画を申請する、などなど。どれも議論が盛り上がってそれぞれの研究に良い効果を生むといいなぁ。

Continue reading »


代謝ナビゲーション

Written by bonohu in misc on 月 09 10月 2017.

Dr.Bonoの生命科学データ解析と同じ出版社(メディカル・サイエンス・インターナショナル)から同時に出版された本の一つがこの代謝ナビゲーション

日本生化学会の代謝マップを元にKEGGのデータを作成するお手伝いをしていた私には要らないでしょうと言われたが、まったくそんなことはない。それをデータベース化していた90年代からの研究の進捗が加味された教科書は、さらに深く代謝を知る上で大変参考になる。例を挙げると、低酸素誘導因子(HIF)による代謝の調節がそれである。第10章「シグナル伝達と代謝」のp176辺りに「酸素とグルコースによる転写ネットワークの調節」の節で、2000年前後から解明が進んだこの分野の知見が綺麗にまとめられている。

より深く知りたい人のための文献として第3章「解糖系」ではKEGGのGlycolysis/gluconeogenesisのURLが紹介されているのは、感慨深いものがある。URLもこの種の教科書の重要なリファレンスとしてリストされるようになったのだ。

Continue reading »


著者版の正誤表

Written by bonohu in drbonobon on 日 08 10月 2017.

原因不明だが、ブログをホストしている自宅サーバーがおちてて、ブログへのアクセスやアップデートがこの一週間できず。本が書店に並んで一番情報を提供すべき時だったのだが。ちなみにこの本に関するブログエントリは、「Dr. Bono の生命科学データ解析」というカテゴリーでまとめてあるのでご利用いただきたい。

誤字脱字等の情報をいただくが、忘れそうなので、例によってGoogle Documentで書き記している。隠す理由もなく、むしろ積極的に出すべき情報だと思うので、公開してある。新しいものを見つけたら、お知らせいただければ幸いである。見つかり次第、追記していく。

そのうち、出版社のサイトから正式なものも出るかと。

Continue reading »


第2回RDF講習会

Written by bonohu in misc on 金 06 10月 2017.

10月6日はトーロクの日。データを登録し、他の人に使ってもらう機会を増し、データの再利用性を高める機会にすると良い、ということでこの日にDDBJing講習会を(トーゴーの日と連続で)開催することを提案しているのだが、未だ実現せず。

その代わり(?)に、今年は第2回RDF講習会が開催。去年第1回が開催されて好評だったからか、今年も市ヶ谷のJSTにて。去年は日本癌学会学術総会と被っており参加できなかったので、今年初めての参加。参加者は30名ほどで、BioHackathon2017もあってアナウンス期間が短かかった割には多数集まった感じとのこと。

普段月一回のSPARQLthonで進捗を聞いていはいるものの、まとめて通して学び直すのは非常によい知識の整理になることを実感。いろいろと情報が抜けていたり、なぜそれをしているのかなどを知る、とても良い機会であった。もちろん、近日公開予定のtogoDBの新バージョンを使っての話などアップデートも盛り沢山。今回の講習会もすべて録画されていて、後日統合TVから配信される予定なので、参加できなかった方は是非。

Continue reading »


トーゴーの日シンポジウム2017

Written by bonohu in misc on 木 05 10月 2017.

今年も巡ってきた10月5日。ということで、「トーゴーの日」シンポジウム。今年も東京大学弥生講堂にて2日間に渡って開催されたが、ポスター発表数が多く半分は別の建物での発表となった。しかし、会場はとても盛り上がっていた。

副題が「バイオデータベース『作る』から『使う』へ」にあるように、実際にどう使ったかを前面に出してきたが、結果としてはやはり「作る」方がメインの発表が多かったかと。もちろん、データベースを全く使わない研究なんて今やほとんどないだろうから、そういう方々がどんどん発表するようになったら、今年80だったポスター発表もそれよりももっと多くなって運営が大変になるだろうけど。

データベースを作る人たちもせっかくやっているのだから、その対象コンテンツの生物学的なおもしろさも聴衆に語れるようになって欲しい、というのは高望みしすぎだろうか?

Continue reading »


第76回日本癌学会学術総会3日目

Written by bonohu in misc on 土 30 9月 2017.

学会は、視野を広げて話を聞く良い機会であることを昨晩実感したので、それを更に実践。興味はあるものの、普段は聞きに行かないようなシンポジウム系をせめてみるなど。自分の不勉強が明らかになり、大変勉強になった。自分にとって、勉強させてもらいに来る場である、ということで、また来たい。来年は大阪らしいし。

Continue reading »


第76回日本癌学会学術総会2日目

Written by bonohu in misc on 金 29 9月 2017.

癌学会2日目は自分のポスター発表。デバネタで発表するのは今回が初めてだが、あくまでもDB再利用研究の実例として。張り付き義務時間になってポスターの前に行ったらすでに人が来てて、その人達にひたすらやったことを説明していたら気がついたら制限時間一杯。盛りだくさんだし、しょうがないかな。なお、発表したポスターは以下のような発表カテゴリーで。「その他」ではなく。時代は変わった。 Practical use of databases 今年も、新たなる知り合いを増やすべく、とある飲み会に混ぜてもらう。初対面なのに共通の話題があるのはこの世界狭いというか、恐ろしいというか…。非常に楽しませてもらった。

Continue reading »


第76回日本癌学会学術総会1日目

Written by bonohu in misc on 木 28 9月 2017.

2017年9月28日からの3日間、パシフィコ横浜で開催された第76回日本癌学会学術総会に参加。今回のハイライトは、1年前からこの学会に照準を合わせて取り組んできたBono本の出版。

なんとか間に合ってよかった。

Continue reading »


ArrayExpressのmirror復活

Written by bonohu in misc on 火 26 9月 2017.

ArrayExpressがaspera経由でのmirrorできなくなっていた件。-Pでポート番号を指定するだけで復活。セキュリティのため、default以外のポート番号になった?

Continue reading »


Where did I write drbonobon

Written by Hidemasa Bono in drbonobon on 日 24 9月 2017.

Bono本はどこで書いていたか?

Google documentに直接書いていたことは前のエントリで書いたが、実際どこでBono本を書いていたか?その答えはシンプルで、家がほとんど、である。職場で、ではない。その方が仕事とそれ以外という頭のモードが切り替えられて都合が良かった。仕事に役立てるため生命科学データ解析を学ばれる方も多いと思うが、私にとっては仕事はあくまでDBを使いやすくすることであり、本を書くことは仕事ではない。本務専念義務がある特任研究員だからそこはテニュアの先生とは違うところであり、よく認識していただきたいポイントでもある。

章の内部の構成やどんなことを書くかといった構想は、家でウンウン唸っていてもなかなか思いつかないので、温泉インフォマティクス研究会を単独開催して。源泉から温泉が湧いてくるのにあやかって、発想も湧いてくるように。気分転換にもなってとてもよかったし、近場の日帰り温泉を発掘する良い機会ともなった。

Continue reading »


When did I write drbonobon

Written by Hidemasa Bono in drbonobon on 土 23 9月 2017.

いつBono本を書いていたか?

いつBono本書いていたのか?本が出るという話を知ったオフラインにあった方によく訊かれる。社交辞令かもしれないが、マジレスしている。「簡単に言えば仕事時間以外」と。

何かのタイミングで頭に湧いてきたことはmacOSの「メモ」でメモして、実際の作文は後で。3月末に一度督促いただいてからは寝る前の時間に書いていたこともあるが、多くは土日祝にまとめて。ちょうど5月頭の大型連休期間もあってそこを活用して書き上げたと言っても過言ではない。

本の長さは約200ページ、ということだったので、図表含めて1ページ約1,000(1k)文字として、約200k字を目標として。各章ごとに書いた文字数を計測してGoogle keepでメモとして目に触れるようにして自分を鼓舞したり。だいたい書き尽くしたかな、というところで、文字だけで約180kになって脱稿。もちろん、その後もボロボロ加筆があったけど。

Continue reading »


drbonobon for whom

Written by Hidemasa Bono in drbonobon on 金 22 9月 2017.

Bono本の想定読者とは?

Bono本の想定読者であるが、基本的には生命科学分野の大学院生やポスドクを想定している。とくに、出版社の名前を見ても分かる通り、医学系の大学院生をターゲットとして書いた。とはいえ、アッセンブルの話題もあり、医学系でない生命科学の諸分野の研究者の卵に広く読んでいただきたいと思っている。

具体的なソフトウェアの使い方等は書いていないので、プロの方が読んで直接的に役に立たないかもしれない。そういう人には、個別トリビアの塊のような生命科学データ解析に対して、頭の整理に寄与できればと思う。ただ、これまでぼうのブログでも書いてこなかった生命科学データ解析を俯瞰した構成で文書化に挑んだつもりなので。バイオインフォマティクスやゲノム配列解読の歴史を知ったり、自分が教える立場になったときに参考になれば幸いである。

生命科学系のデータ解析に興味があるが、生命科学以外のバックグラウンドの方も読者として想定している。多くの方にたくさんのオープンデータがある生命科学分野で、データ解析に関わってほしいからだ。しかしながら、データがオープンであっても生命科学は専門性が高くてとっつきにくい状況があって、その利用は進んでいるとは言い難い。日本のR界の出版王こと石田基広先生が書かれていらっしゃる本ほどの読みやすさには程遠いが、出来る限り言葉を補って書いたつもりではある。だが、それでもまだ読みづらいかもしれない。その場合は、まずはググって。このぼうのブログに情報があることが多くあるかと。それでもよくわからないことは、是非twitterでハッシュタグ #drbonobon をつけてつぶやいていただきたい。可能な限り、レスポンスしたいと思っている。

image

Continue reading »


How did I write drbonobon

Written by Hidemasa Bono in drbonobon on 木 21 9月 2017.

どうやってBono本を書いたか?

Bono本の著者は私1人であったが、編集者とのやり取りの即時性、ファイルでやり取りした際に原稿に複数のバージョンが生まれてしまうバージョニングの問題を鑑み、DRY解析教本のときのやり方を踏襲してクラウドを活用した原稿のグループ共有を実践した。また、本に使う図に関しても、同様にしてサイズの大きなファイルがメールで送れないなどの問題をクリアーした。

すなわち、Google Documentに直接原稿を書き、それに対してコメントを編集者側から入れてもらう方式である。電子メールでのファイル添付でやりとりすると、複数のファイルに独立に書き込んだりしてファイルのバージョン管理が問題になる。それを避けるために電子メールでのファイルでのやり取りは避け、Google Documentで一本化した。つまり、送るメールにはGoogle DocumentのURLだけを送ってそれを見て相手がレスポンスするという方式である。表はDocument中に作成し、図に関してはGoogle Driveでファイルを共有することで同様に。

もっとも版組する段階になったらそれは無理で電子メールでのやりとりになったが、3回ほど打合せで出版社に直接うかがった他はすべて電子メールでのやりとりで完結し、ついに音声電話を使うことはなかった。その電子メールのやりとりも短いショートメッセージのものが多く、実はslackを導入すればよかったんじゃないか、と後になって思ったほどである。

著者にとっては、書きかけの原稿を送ったりすることがなくて進捗状況をいちいち伝える必要がなく楽であったし、また逆に編集者にとっても著者がどれぐらい書いているかを相手にお伺いをたてることなくチェックできるメリットがある。

著者が複数いたりするとなおさら、というのは前回DRY解析教本のときに実証済みで、その結果お互いが牽制しあい、原稿が早く上がってきたし、なによりお互いの原稿に重複がなくなって非常によかった。次回があれば、またこの方式でやりたい、できればしばらく本を書くことはしたくないが。

Continue reading »


drbonobon chapters

Written by Hidemasa Bono in drbonobon on 水 20 9月 2017.

Bono本の章立て

Twitterでの反応を見ていると、思ったよりも多くの方にBono本を出すというtweetがfavられているようで嬉しい半面、過剰な期待を抱かせていないか心配になってきた。出版社の人の許可を得たので、章立てを紹介しておく。

物凄く単純で以下のような5章構成。

  1. 生命科学データ解析の歴史
  2. 生命科学分野の公共データベース
  3. データの形式とその取り扱い方
  4. 基本データ解析
  5. 実用データ解析

生命科学における、歴史、公共データベース、データ形式とその解析の基本編と実用編。ページ数的には、第1章の歴史が少ない他は、第3章のデータ形式がちょっと長いぐらいで、他はわりと均等なページ数となった。

もっと詳しく知りたい人向けに、もうちょっと詳しい目次を以下に。

1 生命科学データ解析の歴史
1.1 なぜ今、データ解析か?
1.2 バイオテクノロジーとデータ解析の歴史
2 生命科学分野の公共データベース
2.1 公共データベースとは?
2.2 …

Continue reading »


Why drbonobon

Written by Hidemasa Bono in drbonobon on 火 19 9月 2017.

なぜBono本を書いたのか?

生命科学データ解析界隈で本が出ないなあと思っていたが、これは日本だけじゃなくて世界的にもそのようで翻訳すべき本が英語でさえも出ていない状況。生命科学のいろいろな分野の教科書は出版されるのに。

そんななか、東京で月一回のペースで開催されているみんなのPython勉強会に出た時に、Pythonによる機械学習入門をデータサイエンティスト養成読本に書かれた方から紹介してもらい、このシリーズを知った。こういったデータサイエンティスト養成読本の生命科学版があったらいいのに、と思ったことが本を書く原動力となった。

データサイエンティスト養成読本はこの機械学習入門編以外にもシリーズの一番最初に出版されたオリジナルのデータサイエンティスト養成読本の改訂第二版が出ている。

また、2017年になって出版された登竜門編は、データ分析環境構築やRStudioとJupyter Notebook、シェル(コマンドライン)の使い方といった生命科学データ解析にも十分役立つ内容となっている。

Bono本は生命科学系に特化した内容になっており、ここにあるような汎用のデータ分析の内容とは重ならないようにしたつもりなので、上記の本もぜひ参考に。

Continue reading »



what is drbonobon

Written by Hidemasa Bono in drbonobon on 日 17 9月 2017.

Bono本とは

簡単に言えば、ぼうのブログを生命科学データ解析の教科書としてまとめたものが、「Dr. Bono の生命科学データ解析」 こと、Bono本である。

コンテンツ、とくにコラム記事は、ぼうのブログのネタとして登場したものがもちろんある。とはいえ、すべてがこのブログにあるかというとNoである。教科書という形になるように、大幅に加筆した。しかしながらBono本は、ぼうのブログによく出てくるコマンドラインツールのtips的な内容ではなく、かつて翻訳した2005年に出版された「バイオインフォマティクス ゲノム配列から機能解析へ 第2版」の後継の教科書なのである。個人的には、2002年に出版された「初心者でもわかる!バイオインフォマティクス入門―やさしいUNIX操作から遺伝子・タンパク質解析まで」の2010年代版という思いも強く込めてあるつもりである。プロトコル本が必要とされている要請には、2015年に清水厚志さんと監修で出した「次世代シークエンサーDRY解析教本」がこたえてくれていると思う。

実は、今年(2017年)の元旦に書いたブログエントリの最後のパラグラフ、

文章を書くことをさらに習慣づけ、考えていることの情報発信を、twitter以外の手段で行っていきたい。

こそがこのBono本のことだった。その時点では企画としては通っていたものの、細かい章立てを練りつつ、コンテンツを空き時間を見つけては書いていた段階であった。先日出た論文のmajor revisionが重くて、なかなか思うようには進まなかったけれども。年度が変わったころそれも見通しがつき …

Continue reading »


BioHackathon2017 最終日

Written by bonohu in misc on 土 16 9月 2017.

最終日は論文thonということで、今回取り組んだことをまとめて、BioHackathon2017論文のコンテンツをみんなでそれぞれに。参加者の皆さん、一週間おつかれさまでした。

Continue reading »



BioHackathon2017 day4

Written by bonohu in misc on 木 14 9月 2017.

4日目は、温泉インフォマティクス研究会はやはり朝夕の2回開催。修学旅行生が入るという情報もあって夕方早めに。

Continue reading »


BioHackathon2017 day3

Written by bonohu in misc on 水 13 9月 2017.

翌朝になっても計算終わらず。その周りでごちゃごちゃと。 お昼周りを散歩するも、食事できるところは、かつてあったようだが…という状況。結局ホテルのレストランでランチ。 夕方に中間発表1分間で。夜にBanquet。 温泉インフォマティクス研究会は朝と夜の2回開催。

Continue reading »



BioHackathon2017 day1

Written by bonohu in misc on 月 11 9月 2017.

2日に渡るシンポジウムが終わり、ハッカソン開始。 SPARQLthonの時にやってきていたDBCLS SRAとAOEまわりで仕事を進める予定。その前に、まずは温泉インフォマティクス研究会。1日目は、夜に1回の開催。

Continue reading »


BioHackathon2017 symposium

Written by bonohu in misc on 日 10 9月 2017.

今年で10回目のBioHackathon。10回目記念ということもあって、いつもならシンポジウムは1日のところ、今年は2日間でしかも東京開催FAIR Principles (FAIR原則: Findable, Accessible, Interoperable, and Re-usable)で有名なMark Wilkinsonさん曰く、

[The final version of FAIR Principles were crafted by participants of #BioHack15 , led by @micheldumontier. Biohackathons are important!](https://twitter.com/markmoby/status/906494736638164992)

とのことで、BioHackathonでFAIRのそれは醸成されたとのこと。世界に誇る集まりになっているんですよ。東京は市ヶ谷のサイエンスプラザ(JST)でシンポジウムがあったのだから、より多くの人が聞きにくればもっともっと盛り上がったのになあ。もったいない。

一応、自分も以下のようなLightning talkを。

Bono …

Continue reading »



SPARQLthon59 day1

Written by bonohu in misc on 水 30 8月 2017.

今回は理研和光にてSPARQLthon開催。諸事情により、今回は今日だけの参加。 サンプル方向の検索実装はBioHackathonで頑張ることを確認。 今回はArrayExpressのデータ更新をしこめなかったため、インデックス更新できず…。来週頭から仕掛ける予定。DORの進捗を聞いていよいよやらねばという思いの一方、GEODなエントリがあれから増えていないのはちょっと心配であるが。

Continue reading »


RefEx論文

Written by bonohu in misc on 火 29 8月 2017.

NBDC/DBCLSの遺伝子発現のデータベースというかウェブツール、RefExの論文が公表された。 これは2006年に文部科学省統合データベースプロジェクトが始まったときにすでにその原型があったサービスで、さまざまな測定手法による遺伝子発現データを並べてみるというコンセプトでデータを統合する、というものであった。2011年頃から我々で引き継いでやってきており、次世代シークエンサーによるRNA-seqデータも蓄積し、そこに加えてFANTOMプロジェクトによるCAGEデータも出てきて、それらも加えて比較できるよう変更を加えてきた。 FANTOM5で出てきたデータをまとめてScientific DataのData descriptorとして利用可能にしようという話があり(そしてさらに、今回のFANTOM5 collection)、そこにRefExも入れてもらい、今回の論文となった。RefExの論文はData descriptorではなく、Articleというカテゴリーではあるものの、Technical Validationをきっちり書くことや、使ったデータすべてをfigshareにアップ(https://doi.org/10.6084/m9.figshare.c.3812815)することなど、Data descriptorの論文と変わらない要素を求められ、受理までかなりの時間がかかり、大変だった。それでもやはり、論文として出版し引用してもらいやすい形にまとめることはこれだけインターネット全盛の時代になった今でも重要だと身にしみて感じた。 関係者の皆様、おつかれさまでした。そして、これからももっと使われて遺伝子発現データベースの新しい方向性を模索していきたいと思います。

Continue reading »