IT for Biological Data Analysis 1week

Written by Hidemasa Bono in IT4BDA on 土 16 2月 2019.

生命科学データ解析を支える情報技術 発売一週間

2019年2月9日に「生命科学データ解析を支える情報技術」(以下、IT4BDA)が正式に発売され、流通するようになった。

数日前のエントリにも書かせてもらった通り、発売当日に偶然開催されたMishima.syk#13(第13回三島創薬勉強会)にて、「エンジニアのための生命科学入門本ができるまで」と題してLightning Talkさせていただいた。

また、自分は参加できなかったものの、ちょうどこの一週間の水曜日の夜に開催されたみんなのPython勉強会(stapy)#42の冒頭で、 当該勉強会(stapy)がきっかけになって出版されることになった本として紹介していただいたり。詳細は、数日前のエントリに。

これまでの本同様、amazonの「生命科学」や「バイオテクノロジー」カテゴリーでのランキングは時として一位を取ることもあったりと、好調の模様だが。

twitterのハッシュタグ #IT4BDAに寄せられた意見に「体系的に学べる」が目に付くが、果たしてそうだろうか。 体系的にまとめられないから、イントロダクションと環境構築以外はよく使われている要素技術を列挙しただけという構成となっているのだが。 批判的な内容も出てきてもおかしくないと思っているのだが、そういうのは表に出さないというものなのかな…。

Continue reading »


IT for Biological Data Analysis in stapy 42nd

Written by Hidemasa Bono in IT4BDA on 水 13 2月 2019.

みんなのPython勉強会#42で紹介

自分は参加できなかったのだが、「生命科学データ解析を支える情報技術」みんなのPython勉強会(stapy)#42の冒頭で紹介していただきました。 stapyがきっかけになって出版されることになった本、ということで。

紹介なう

会場に行けなくても、YouTube Liveで参加できる素晴らしい会となりました。

それにしても、twitterのハッシュタグは #IT4BDAだが、今までの本同様、私ばっかりが書いている感じ…。

Continue reading »


Mishima.syk 13th

Written by Hidemasa Bono in misc on 日 10 2月 2019.

Mishima.syk#13

8ヶ月ぶりに開催されたMishima.sykは今回13回目。 もうすぐ、三島に来て丸5年ということは、この勉強会も約6年やっているということになる。

今回は、知り合いの研究者が関東から遠征してきて研究紹介をしてくれたり、ハンズオンも密度が濃かったということもあって、あっという間に昼の部が終わってしまった感じであった。

自分は、昨日のエントリでも書いたが、勉強会当日(2019年2月9日)に「生命科学データ解析を支える情報技術」(以下、IT4BDA)が発売開始。 図ったかのようだが、実に偶然の一致。 そういうご縁もあって、「エンジニアのための生命科学入門本ができるまで」と題したLightning Talkとして、紹介させていただいた。 IT4BDAを書いた

  • Why?
  • How?
  • For whom?

が新しい情報として上記リンクから公開してあるGitPitchによるプレゼンにも書かれているので、参考まで。

夜の部は、いつも通り素晴らしくオーガナイズされてて、いろんなネタでお話しができて盛り上がったように思う。 ただ今回は、比較的新規参加者が多かったと思うのだが、あまりお話しできなかったのが残念。

Continue reading »


IT for Biological Data Analysis for sale

Written by Hidemasa Bono in IT4BDA on 土 09 2月 2019.

生命科学データ解析を支える情報技術 発売

本日(2019年2月9日)、「生命科学データ解析を支える情報技術」(以下、IT4BDA)発売。 調べてみたら、ちょうど2018年2月9日にIT4BDAを書くことになった(企画案として出していたのが承認された)らしい。

そしてさらに、今日は三島エリアでやっている有志の勉強会、Mishima.syk#13の開催日。 LTでIT4BDAを紹介させていただいた。 題して、「エンジニアのための生命科学入門本ができるまで」

左が紙媒体、右が電子媒体(Kindle)で、出版社のサイトからはPDF版やEPUB:リフロー版も用意されている。 自分の書いたものがKindle版やEPUB版の書籍となったのはこれが初めてなので、とても嬉しい!

Continue reading »


Plan S

Written by Hidemasa Bono in misc on 金 08 2月 2019.

Plan Sとは

論文を出すことを日常的にしている研究者にとって非常に関わりが深いことなのに、ほとんど知られてないので、ここで取り上げる。 下手な解説を私がするよりも、以下のブログエントリに明快にまとめられているので、そちらを。

解説記事「Plan S:原則と運用」を書きました

ただ、J-STAGEの方は「paywallの中(購読料を払わないと読めない)」。オープンアクセスに関することを書いた総説がオープンアクセスでないという皮肉な状況。 しかしながら、九州大学附属図書館のレポジトリに著者自らが登録されているため、全文読める。本当、ありがとうございます。ありがたくこうやって拡散させていただきます。

図書館情報学系の集まりに顔を出さなかったら、私も知らなかったとは思うものの。 今後イヤでも聞くことになるはずなので、早めに知っておいて損はないかと。

Continue reading »


IT for Biological Data Analysis Kindle version

Written by Hidemasa Bono in IT4BDA on 木 07 2月 2019.

生命科学データ解析を支える情報技術 Kindle版

Kidle版も2019年2月6日に予約発売開始になっていた。PDF版はこれまでも経験あるが、自分の著書がKindle化されたのは実は初めて。うれしい。

出張で受け取れていなかった実物も手元に届き、周りのお世話になった方々への献本を。 それ以外の宅配による献本もTwitterの反応を見るかぎり、順調にいっているようだ。

あとは発売日を待つのみ。

Continue reading »



IT for Biological Data Analysis for pre release

Written by Hidemasa Bono in IT4BDA on 月 04 2月 2019.

生命科学データ解析を支える情報技術 先行発売開始

立春の今日(2/4)、今週末土曜日(2/9)に発売予定の「生命科学データ解析を支える情報技術」(以下、IT4BDA)の先行発売が始まった(模様)。 当該書店さんのtweetを見ただけで、自分では売っているのを見たわけではないのだが。

IT4BDA 先行発売

また、技術評論社のウェブサイトが更新され、「電子化の予定があります」と。

なお、twitterのハッシュタグは #IT4BDAなので、tweetする際には是非ハッシュタグを、よろしく。

Continue reading »


HISAT2 Samtools workflow

Written by Hidemasa Bono in misc on 土 02 2月 2019.

HISAT2→Samtoolsなワークフロー

以前書いたブログエントリなどを現状に合わせて見直して再掲載シリーズ。

HISAT2でreference genomeにmappingして、genomeに対するアラインメントを得る場合。 HISAT2のウェブサイトにすでにindexずみのそれがある場合はしなくていいが、まずはindex作成。 hisat2-buildコマンドにて。 reference genome sequenceがhogenome.fa、作成するindexの名前をhogeとすると、

# HISAT2を使うためのindex作成
% hisat2-build -p 12 hogenome.fa hoge

これはコア数が12あるMacProで動かした例(以下全て同じ)で、そこは環境に合わせて。 そして、実際のmapping。

# HISAT2の実行
% hisat2 -p 12 -x hoge -1 fuga_1.fastq.gz -2 fuga_2.fastq.gz -S fuga.sam

mapしたいpaired-end …

Continue reading »


CIBEX data reloaded to GEA

Written by Hidemasa Bono in misc on 金 01 2月 2019.

かつてCIBEXに登録したデータがGEAで復活

かつてCIBEXという遺伝子発現データベースがあった。 日本での遺伝子発現データベースということで、自分が所属していた研究チームもそこにマイクロアレイによる遺伝子発現データを登録したこともあった(doi:10.1371/journal.pgen.1001019)。

しかしながら、CIBEXは続かなかった。 データ受け付けを停止し、かつてはあったウェブサイトもなくなり、それまで受け付けて来たデータがダウンロードできるだけ、となった。


そして時代は下り、塩基配列解読技術が劇的に進化し、配列解読で遺伝子発現を測定する方法がメジャーとなった。いわゆるRNA-seqである。 塩基配列解読をするため、生データとしてはSequence Read Archive (SRA)に登録すればデータの再現性は担保される。 しかしながら、実際には発現定量したデータも一緒に登録されていなければならない。 そのため、NCBIのGene Expression Omnibus (GEO)やEBIのArrayExpressといった遺伝子発現データベースにそれらの定量データが登録されてきた。

DDBJはDDBJ Sequence Read ArchiveとしてSRAの登録も受け付けているので、配列データを登録した延長上で発現定量データも登録できると便利だということで、2018年にGenomic Expression Archive (GEA)がDDBJの遺伝子発現データのアーカイブとして立ち上がった。

ここで話がCIBEXに戻る。 かつて我々がCIBEXに登録したデータ …

Continue reading »