Lecture on insect physiological chemistry

Written by Hidemasa Bono in misc on 火 11 6月 2019.

大学院講義 昆虫生理化学特論

東京農工大学農学府にて、大学院の集中講義として。

基本的には、Dr.Bonoの生命科学データ解析(Bono本)の内容に沿った内容で。

この内容に沿って自分で講義するのは、出版から1年と9ヶ月あまり経つというのに、実は初めてという不思議な状況。 需要がないのか、供給が足りているからなのか、どっちなのだろうか。

もちろん、それだけでは大学院講義の内容としては最新のコンテンツに欠けるので、その部分も盛り込んで、丸1日。 そういうわけで新ネタで、出来具合が納得のいかないパートもあって、それは今後の課題に。 諸事情あってという部分もあり、それは時間が解決してくれるかと…。

講義資料は、公開するには色々と問題あるものが多く。 そういうわけで、見たい方々はぜひ講義に呼んでくださいw。 半期や年に一回限りの講義であれば、できる限り対応します。

Continue reading »


IT for Biological Data Analysis 4months

Written by Hidemasa Bono in IT4BDA on 日 09 6月 2019.

生命科学データ解析を支える情報技術 発売4ヶ月

2019年2月9日に「生命科学データ解析を支える情報技術」(以下、IT4BDA)が発売されてから早4ヶ月。 amazonのランキング見ているとまあそれなりには売れているような印象。 個人的にはエンジニアさん向けの本もありますよ、と紹介できるようになってとても満足しているところである。

昨年(2018年)から静岡エリアで生命科学データ解析をエンジニアさん向けに知ってもらうとする自主的な勉強会Shizuoka.ngsが開催されている。 去年の第一回目(Shizuoka.ngs#1)に続いて、今年も6月に企画されており、その名もShizuoka.ngs#2

去年は、ちょうどIT4BDAを執筆している真っ最中で、書きかけの内容をチョイだしして皆さんの反応を参考にさせてもらった。 今回は、テキストとして予想される内容の概要がすでに成書として出版されており、どんな会であるかはわかりやすく、参加しやすくなったのではないかと。 その反面、話す方としては同じ内容というわけにもいかず。 もちろん、IT4BDA全部はカバーできないものの、ハードルが高いと思われる第1章のイントロダクションのところを中心によりわかりやすく、そして最新の内容を盛り込んで話したいと思っています。 また、ハンズオンのワークショップも基本的には第2章の最後にあるチュートリアルを基本にやる予定なので、是非参加してみてください。 そこに関しても何かプラスαを仕込んでますので、本を読んでしまった人でも楽しめるように考えていますので。

Continue reading »


JSGEDIT 4th

Written by Hidemasa Bono in misc on 水 05 6月 2019.

日本ゲノム編集学会第4回大会

東京(船堀)開催だったというのもあって、初めて参加。 有用物質生産や育種での応用を調査する目的で。 アウェーだと思って行ったわけだが、割と知っている方もそれなりに居て。

未発表のデータが多く発表されているなどよかった。 つまり、参加しないとわからない情報が数多くあったということ。 それゆえに当然だけど、プレプリントとかはまだ出ていないのがほぼ全てだった。

funding情報を明らかにしてない発表も多かったのがちょっと気になった。 論文出すときに明記するようになってきているように、それも貴重な情報源かと。

また、全体的にゲノム情報ありきで話が進められている印象。 編集する元のゲノム情報をケアした発表がもっとあっても良いかなと。

Continue reading »


May2019

Written by Hidemasa Bono in misc on 金 31 5月 2019.

2019年5月を振り返って

前半は、4月から準備してきた、Cold Spring Harbor Meeting on Biology of the Genomes関係。 AOEの論文をプレプリントとしてbioRxivにアップロードしたり。 おかげで、CSHL meetingの時に大変説明しやすく。 帰国後はメタ解析の方を重点的に。

それ以外は国内出張は少なかったが、2019年5月は宿泊回数9泊。

また、母国語での執筆活動は、月始めに某脱稿して一段落。 それ以外の方もそろそろ出番が出てきそうな感じ。 6月は集中講義もあるし、頑張っていこう。

ぼうのブログの2018年1月以前のコンテンツを現在のサーバーの方に移行したおかげか、アクセス数が増えた。 傾向としては、これまでtwitterからの流入が多かったのが、インターネット検索からと思われるアクセスが増え、 また、PCとモバイルからのアクセスがほぼ半々だったのが、PCからのアクセスが増えた。 最近は、技術的なメモは英語版の方に書くようにしているのでそちらで。

Continue reading »


ikra revisted

Written by Hidemasa Bono in misc on 水 22 5月 2019.

ikra再び

tximportで定量する部分を使わせてもらった、阪大医学部Python会のyyoshiaki氏によるikraであるが、また別プロジェクトで使わせてもらうことに。 Docker以外は特にデータ解析ソフトウェアをインストールしていない環境で手っ取り早くsalmonによる発現定量をしたかったため。 実は、このsalmonで発現定量をやる方法、Dr.Bonoの生命科学データ解析(Bono本)には載っていないのであった。

SRRのIDをリストで渡して配列データ取得からやってくれるSRR modeは確かに便利なんだが、直接FTPで配列取得するのに比べて時間がかかりすぎる気がする感じであった。 そこで、FASTQデータはすでに取得してあることが前提のFASTQ modeで使ってみたが、ちょっとバグがあってyyoshiaki氏とやりとりしたりして。 30サンプルほどのFASTQがほぼ1日半ほどで計算が全て終わった。 ただし、多くはファイルのトリミングとそれに続くQCに多くの時間がかかっていて、実際の定量は各サンプルあたり10分ほど。

もちろん、動かしている内容をきっちりわかっているという条件付きであるが、インストールでハマることなどなく、発現定量値を得ることができた。

ドッカの鯖で、ではなく 自鯖のDockerで、

このようにデータ解析パイプラインを流す時代になっていくのだろうか?

Dockerが入ってないといけないし、メモリ要求性もそれなりに高いし、誰でもすぐに簡単にとはいかないが。

Continue reading »


Direct search links added

Written by Hidemasa Bono in misc on 日 19 5月 2019.

直リンク追加

ここで説明したことがないから気づかれてないかもしれないが。 現在のレイアウトでは右カラムに並んでいるLinksとSocialは、 単にそれぞれのサービスのトップページへのリンクではなく、 実は自分(の名前やID)をqueryにそれぞれのサービスで検索した結果への直リンクとなっている。 例えば、PubMed をクリックすると、PubMedにindexされた自分の論文が表示されるようになっているわけである。 今回、bioRxivとf1000Researchへの直リンクの張り方がわかったので、それらを追加。

それらの中で、オススメはeuroPMCへのリンクである。 これはORCIDのIDをqueryとして実現しているが、bioRxivなどのpreprintを含めた論文数の推移が動的にバーチャートとして描かれる。 ORCID取得するだけでこれが可能となるので、これまで論文を出した方は是非ORCID取得されたし。

Continue reading »


AOE archived in LSDB archive

Written by Hidemasa Bono in misc on 金 17 5月 2019.

AOE、生命科学系データベースアーカイブに

All of gene expression(AOE)のデータ(遺伝子発現データのメタデータのindex)が、生命科学系データベースアーカイブ(LSDBarchive)という公的なデータアーカイブからダウンロードできるようになった。

なぜそうしたかなのだが、一番の原動力は、(一次データベースではないものの)生命科学系のデータベースとして全てをダウンロードできるようにし、再利用性を高めたいということ。 実は、データ全体が欲しいというリクエストは、以前からあった。 これまではAPI使って取ってください、ということで対応していた。 しかしながら、再利用してもらうにはちょっとハードルが高いかなと、思ってはいた。 それが今回、LSDBarchiveに入ったことで全体のダウンロードもクリックしていくだけで簡単に可能となった。 より使ってもらえるようになったのではないか。

また、寄託したデータ自体に以下のようにDigital Object Identifier(DOI)が付き、引用する際のIDとして使えるようになった。

Continue reading »


Always on SSL for AOE

Written by Hidemasa Bono in misc on 木 16 5月 2019.

AOEのHTTPS化

業界の多くのウェブページがHTTPS化する中、取り残されていた。 特に必要性を感じなかったからだが、やはり多くの人にそのサービスを使ってもらうと考えると、HTTPS化は必須だろうと思い立ち。

実際先にそうした同僚にどうやったかを相談して。 そしたらHTTPS化をSEさんに相談してフロントエンド側でなんとかなりそうらしいことがわかり。 結果として、現在のコンテンツに混在していたHTTPとHTTPSのリンクをHTTPSに一元化するだけで、それが実現した。 やってみればなんてことはないのだが、そこはコロンブスの卵

今後はこのhttpsから始まるアドレスを示していきたいと思う。 関係者の皆様、ご協力ありがとうございました。

Continue reading »


Jet Lag in 2019

Written by Hidemasa Bono in misc on 水 15 5月 2019.

時差ボケ

今回は13時間時差のあるところに5日間(4泊)だったのだが、やはり帰ってきても時差ボケに。 いつもなら帰ってきても欠かさずmelatonin投与してそれほどでもなかったのだが、今回はそれをサボっていたせいか、割とキツイ。 なので、帰国後数日経っているが、寝る前にmelatonin服用して合わせるように。

Continue reading »


Apple Watch Theater mode

Written by Hidemasa Bono in misc on 日 12 5月 2019.

Apple Watchのシアターモード

Apple Watchを普段から愛用している。

これまでApple Watchをつけて飛行機に長時間乗るとすぐに電池が消耗し、しかも飛行機によくついているUSBにApple Watch磁気充電ケーブルをさして充電しても全然充電が進まないどころか、むしろ電池が減るという事態に。

それをtweetしたところ、シアターモードにすれば良いかもという助言が。

シアターモードは元々は名前の通り映画館でふとした動作でApple Watchが光ってしまい、周りに迷惑をかけてしまうのを防ぐモードで、画面をタッチするか脇のボタンを押すかしないと画面が表示されなくなる。

そこで帰りの飛行機に実際そうしてみたところ、ちゃんと充電されるようになった。 飛行機の中は振動が多く、普通にしていても画面が光ってしまう。 そのせいで電池が消耗していたのだろう。

さらに、おやすみモードというのもあって、それに設定すると通知がされなくなる。 飛行機の中では、通知されることはおそらくはない状況なので、これも併せて設定しておくと良いだろう。 そうすると電池が長持ちして、現地についてからもすぐにApple Watchを使うことができるだろう。

でも一番最初に出たモデルを使っている私としては、そろそろ新しいのが欲しい時期だが…。

Continue reading »


The Biology of Genomes 2019 day5

Written by Hidemasa Bono in misc on 土 11 5月 2019.

The Biology of Genomes 2019 day5

meeting最終日。 来た日には、5日間もあって長いなあと思っていたが、実際にはあっという間だった。

全体的な雑感としては、順調に女性参加者の割合が増えていたのに、今回で急に下がったらしいが、何があったのだろうか。 久しぶりに参加した私からすると、米国からの参加者の割合が高くなった気がしてならなかった。 そして、かつてより「テクノロジー」の演題が減って、「データ解析」のそれが増えた。 このことはやはり米国参加者が増えているのと関係がある気がする。 それと、やはりヒトが対象の研究が多い。 Biobankのデータを使った研究が特に口頭発表で多く見られた。 他の生物もあるが、基本産業的に重要な穀物や家畜だけのイメージ。

帰りは偏西風に逆行するので、約13時間のフライトと長かった。 「スパイダーマン:スパイダーバース」 を見たら別のを見たくなって、 「アリー、スター誕生」、 「レプリカズ」、 「アクアマン」 と、結果として4種類の映画を見ることができた。

Continue reading »


The Biology of Genomes 2019 day4

Written by Hidemasa Bono in misc on 金 10 5月 2019.

The Biology of Genomes 2019 day4

「なんとかseq」はまだまだ増殖中、というのを再確認。 というか、手法の命名方法として多用されていて、それは塩基配列解読がカップルしているからに他ならない。

Continue reading »


The Biology of Genomes 2019 day3

Written by Hidemasa Bono in misc on 木 09 5月 2019.

The Biology of Genomes 2019 day3

Population Genomicsのセッションを聴いていて、ゲノムデータを使った研究の広がり、を感じた。 その使った研究がもっと増えていかねば。 もちろん、オイラが使われているのを知らないだけかもしれんが。

解析手法開発のためのエコシステムが必要だと痛感。 ただ、解析手法を作ることを目的に開発するだけではそれは難しく、何かgrand(grantかも) aimは別にあって、それを達成するためのナニカでないと今後続けていけないのでは? この先生きのこれない、ってやつ。

Continue reading »


The Biology of Genomes 2019 day2

Written by Hidemasa Bono in misc on 水 08 5月 2019.

The Biology of Genomes 2019 day2

ポスター発表は会期中の2,3,4日目に、毎日日替わりで、発表者のLast Name、アルファベット順。 ということで、Bから始まる私は初日に。

2日目だとバッチリ日周期(circadian rhythm)が残ってて、ポスター発表の午後の時間帯は超絶眠く。 なんとか立ってはいられたものの、積極的に話すのは辛い状態。

それにしても、

  • ほとんどがopt inにtweetableな口頭発表がほとんど
  • bioRxivに論文としてすでにアップロードしてある

ことがとても印象的だ。

Continue reading »


The Biology of Genomes 2019 day1

Written by Hidemasa Bono in misc on 火 07 5月 2019.

The Biology of Genomes 2019 day1

2019/5/7-11まで Cold Spring Harbor Laboratory (CSHL) で開かれている The Biology of Genomes に参加。 ミーティングの名前を変えながらも、この時期に毎年行われているヒトゲノム解読プロジェクト当時からある。 実は、22年前にこのミーティングに出て発表したのが自分の海外学会発表デビューであった。 そもそも当時はJFKについたら怪しいタクシーに乗らないと移動手段がなかったような…。

時代とともに色々変わっていて、最近では事前に要旨集がPDFで送られてくるようになったし、ソーシャルメディアの使用もキッチリとガイドラインがあって推奨されている。 それをiPadでも見れるようにと、iCloud共有してみたが、PDFファイルを開いただけじゃテキスト検索できない。 開いた画面の右上の上向き矢印アイコンで出てくるメニュー「"ブック”で開く」を選んでブックを起動するとテキスト検索が出来るように。 iBooksはブックになっていたようだ、いつの間にか。浦島太郎状態だな…

CSHLに来るのは、2017年秋のGenome Informatics以来1.5年ぶりだが、このGenomeのミーティングにくるのはおそらく理研にいた時以来、17年ぶりぐらいではなかろうか。 今回もガッツリ勉強してきたい。

Continue reading »


Docker setting for genomer

Written by Hidemasa Bono in misc on 月 06 5月 2019.

ゲノム解析者用Docker設定

Docker Desktop for macのおかげで、macOSでもDockerを使ってツールを起動することが簡単になった。 インストールの際にライブラリの依存性に悩まされることもなく、またバージョンの違いによる差異も決まったバージョンで動かせば解消されるはずである。 何よりも(あまりないのだが)macOSで動かないツールを動かすことができるのが魅力である。 ただ、最初に実行するときのイメージがかなり大きく、ネットワーク的に恵まれてないと厳しい上に、実行するためにはnativeに動かすよりも多くのメモリが必要となる。 ゲノム系のツールはもともとメモリをたくさん必要とするものが多く、その辺がさらにネックとなっているのではないかと。 デフォルトで2GiBのメモリがDockerに割り当てられて動いているが、これではすぐに足りなくなるであろう。 足りなくなるとエラーもなく、急に実行が止まってしまうので、何が原因なのか、わかりにくい。

yyoshiakiもikraのページで書いているが、salmonを実行するにもデフォルトの2GiBではメモリが足りなかったようだ。 今後多くの人がハマりそうなポイントなので、ここでも再度書いておく。

Dockerが起動しているときに上に出ているDockerのアイコンメニューからPreferences...を選択する。

メニュー

そして、開く設定画面からAdvancedの項目を選択すると以下のような画面が出てくる。

詳細設定

この画面では、2GiBになっているメモリの割り当てを増やして、12GiBに設定したことになっている。 ただ、つまみを動かしたままではダメで、下部のApply & Restartボタンを押してDockerを再起動する。

これで前はコケていたDockerのプロセスが動くようになることが多いのではないだろうか。

Continue reading »


completion of writing 2019

Written by Hidemasa Bono in misc on 日 05 5月 2019.

脱稿2019

年頭から書いてきたとある書き物を脱稿した。

1
2
#!/bin/bash
wc -m *.md

でカウントした文字数の合計は、212,364となった。

今回はその進捗を#某進捗ハッシュタグで記録してきた。 そのデータを使って、TIBCO Spotfireで可視化してみた。 その前処理は以下の通り。

1
2
3
4
5
#!/bin/bash
grep ^190 shinchoku.txt \
| awk '{ print "20"$1"\t"$2 }' \
| perl -pe 's/現在、文字数合計//' \
> shinchoku2.txt

twitterで表示したデータはshinchoku.txtとし、Spotfireで読み込むタブ区切りテキストファイルがshinchoku2 …

Continue reading »


AOE paper uploaded to BioRxiv

Written by Hidemasa Bono in papers on 土 04 5月 2019.

AOEの論文をBioRxivにアップロード

All of gene expression (AOE)の論文を次週からのCold Spring Harbor Laboratory (CSHL)での学会発表(ポスター発表)を前にBioRxivにアップロードした。

All of gene expression (AOE): integrated index for public gene expression databases Hidemasa Bono bioRxiv 626754; doi: https://doi.org/10.1101/626754

いわゆる「論文」と違う点は、この論文はまだ査読(peer-review)を受けていないということである。 なので、業績などにカウントする「査読付き論文」には入らない。 しかしながら …

Continue reading »


what is tilde

Written by Hidemasa Bono in misc on 金 03 5月 2019.

チルダ

電子メールなどの文書には出てこないがUNIXコマンドラインで出てくる文字として、~がある。 読み方は、「にょろ」ではなく、「チルダ(tilde)」である。

かつてはウェブサイトなどでこの~を含むURLも多かったので、その存在を知っている方も多いかもしれない(ちなみにうちの職場の個人サイトはこの~を含むURLとなっている)。

この~であるが、UNIXコマンドラインでは、これはホームディレクトリという意味がある。 個人のホームディレクトリはアカウントごとにその絶対パスは異なるわけであるが、それをスルーして画一的に記述する際に便利な文字だからだ。 例えば、カレントディレクトリ以下のファイルをすべてホームディレクトリ以下のDocumentsディレクトリにコピーする場合は以下のコマンドだ。

1
2
#!/bin/bash
cp * ~/Documents/

これも一字一句間違えないように打たないと動作しない。 間違いがちなのは、チルダのあとの/を忘れたりすることである。

しかしながら、これは知らなくても多分なんとかなる文字かなと思う。 ホームディレクトリを指定する方法は~を使わなくても何通りでもできるし。 そんな風に何通りにも同じ動作が記述できるのがUNIXのいいところである。

Continue reading »


what is backquote

Written by Hidemasa Bono in misc on 木 02 5月 2019.

バッククオート

クオート(quote)にはシングル(')とタブル(")があるのはよく知られているだろう。 実は、さらに第3のクオートが存在する。 それがバッククオート(`)である。

UNIXコマンドラインにおいては、あるコマンドの結果を別のコマンドの入力として使う際に使われる。 電子メールなどの入力ではおそらく使わないだろうけれども。

1
2
#!/bin/bash
echo "今日は `date +%m月%d日` です"

この例ではdateコマンドの出力を受けて、echoコマンドで処理(表示)している。

あと、クオートで問題になるのが、PDFに出力されたコマンド等を貼り付ける際などに起こる。 それは、シングルクオートが飾り文字に変換されているために、そのままターミナルに貼り付けても見た目はシングルクオートにそっくりでも別の文字で、シングルクオートとして認識されないということである。 そのようなどこからのコピー&ペーストの際にはそういった文字が含まれていないか、気をつけた方がよいだろう。

Continue reading »


how to type backslash

Written by Hidemasa Bono in misc on 水 01 5月 2019.

バックスラッシュを打つ設定

新学期でUNIXコマンドを使い始めた方も多いだろう。 その際によく受ける質問で最近気になっているのは、アルファベットや数字ではない記号がどこにあるのか、というものだ。 特に\(バックスラッシュ)はどこにあるのか、ということは定番中の定番だ。 使っているキーボードの種類にもよるが、最近のアップルの日本語キーボードだと、それは円記号¥のキーで打つことができる。 あまり使わないためにデフォルトの設定では打てないようになっている。

それを打つためには、以下のように設定変更する。 「システム環境設定」→「キーボード」で「入力ソース」タブの下の方、「"¥"キーで入力する文字」を「円記号」から「バックスラッシュ」に変更

バックスラッシュを打つ設定

かつては円記号が表示されていてもバックスラッシュとして解釈してくれるようになっていたが、最近の「ターミナル」ではそれらを区別してしまうようなので注意が必要である。

Continue reading »


Exit Wordpress

Written by Hidemasa Bono in misc on 火 30 4月 2019.

過去のブログコンテンツの統合

休日ともなると余裕ができる。 一年前からの懸案である、WordPressで作りためたコンテンツの統合。 再開当時はWordPressのXMLからmarkdownへの移行ツールが見つけられなかったが、今ならどうかなと再度チャレンジ。

xml2markdown wordpressでググって、exitwpというWordPressのXMLをjekyllのmarkdownに変更してくれるツールを見つけた(こちらで使うのはPython謹製のpelicanなのだが)。 ただ、Python2で書かれたツールで、PyYAMLをpip2 installする必要があったが、ちゃんとWordPressのXMLをmarkdownに変換してくれた!

コンテンツのカテゴリーなど、互換性のない部分もあったが、その辺はコマンドラインで以下のような感じでよしなに処理。

1
2
3
4
#!/bin/sh
for f in 20*; do
 grep -v ^"- 雑感" $f > tmp/$f
done

してからmv tmp/* .して。 また、amazonへのサムネール付きのリンクも、HTMLを手動で追加 …

Continue reading »


April2019

Written by Hidemasa Bono in misc on 火 30 4月 2019.

2019年4月を振り返って

4月は絶望より始まった。 やるべきことをやるしかないという思いで「引きこもって進めた」結果、出張は比較的少なく、宿泊回数3泊。 そして、AOEの外堀を埋めて完成版とした。 次のステップをより再現性よく、またどこでも計算できるように進めるべく、meetupに出てCWL化への意識を高めたつもり。

共同研究に関しても、何回か来てもらうことで議論し、結果として色々進んだ。 今月発表した論文のように、粛々と形にしていこう。

また、母国語での執筆活動に関しても山は越えた感。 こちらも目標の出版期日を目指して、順調に進めていきたい。

Continue reading »


15th Workflow Meetup

Written by Hidemasa Bono in misc on 水 24 4月 2019.

Workflow Meetup@東京日本橋

同僚に教えられ、15th Workflow Meetupに初参加。 東京会場は、COREDO日本橋にある理化学研究所 東京連絡事務所(15階)だったのだが、そこも初という、初めてづくし。 しかしながら、Workflow言語であるCommon Workflow Languageの話は2018年末の松江のBioHackathon2018で教えてもらって興味を持って取り組みつつある技術ということで、そこまでお初でもなく。

牛はらみ肉をランチにいただくなど、腹を割ったさまざまな情報交換のほか、個人的な作業としては、Pitagora Workflows in CWLにあるRNA-seqのワークフローを使いこなすべく、先人たちの業績を紐解いて自分の環境で動かせられるか、に取り組んだ。 会場ではkallisto indexを動かそうとして、一つバグを発見して、最終的には動かす(手元にあったtranscriptome reference配列のkallisto indexを作成する)ことができた。

次の日にkallisto quantも無事動いて、新しいMac miniでconda install kallistoすることなく …

Continue reading »


Shizuoka.ngs#2

Written by Hidemasa Bono in misc on 日 21 4月 2019.

エンジニアのための生命科学データ勉強会@静岡#2

昨年、生命科学ガチ初心でもできる!エンジニアのための生命科学データ解析の勉強会 Shizuoka.ngs#1が2018年6月30日(土)に静岡駅前で行われた。 自分は、「エンジニアのための生命科学入門」と題して小一時間話させていただいた。 実はちょうどその頃、個人的には生命科学データ解析を支える情報技術(以下、IT4BDA)を執筆している最中で、どういった反応がくるかを楽しみにしていたというのは今だから言えること。 懇親会最後まで残った何人かの人と色々と話をさせていただいたことは本を書く糧となったことは言うまでもない。

そして、今年も前回と同じ静岡駅前で2019/06/22(土)に、「エンジニアのための生命科学入門」と題して今回も最初にお話させていただきます。 RNAの発現量を配列カウント数から推定するRNA-seqデータ解析は、生命科学初心者にも取っ付きやすいのではないかということで、IT4BDAにも遺伝子発現データ解析の実際として第2章に取り上げられており、それをハンズオンとしてみんなでやる予定になっています。

生命科学データ解析に触れてみたいエンジニアの皆さん、是非ご参加下さい。 申込みはconnpassのShizuoka.ngs#2のページから。

Continue reading »


Beyond differentially expressed genes

Written by Hidemasa Bono in misc on 金 19 4月 2019.

DEGノムコウ

発現差のあった遺伝子群のことをDifferentially Expressed Genes(DEG)と呼ぶのは、Allie的にもぶっちぎりのトップとなっている今日この頃。 そして、詳細ページを見ると2004年から文献中に登場して、年々この略語の出現数が増えてきていることが(描画までにちょっと時間かかるものの)ヒストグラムからわかる。

DEGノムコウに出口(デグチ)を探す。 日常的にそんなこともやっているわけだが、イソフルランを投与した/してない細胞での発現のようにDEGがほとんどないケースもあれば、その逆もある。 いずれの場合も通りいっぺんのやり方ではなく、生物学的な知識に基づいたデータ解析が必要となる。 そこのプロセスの欠如がいろんなところで問題となっているのではなかろうか?

それにしても、相手が知らないことを知り得るのは、生命科学データ解析本作家的にはまたとない素晴らしい機会である。 実際のデータ解析のゲンバに居るからこそ、可能となることである。 まだしばらくはこちらで頑張りたい。

DEGのむこうには もう次の論文が待っている…

Continue reading »


Hypoxia-inducible factors are not activated by isoflurane

Written by Hidemasa Bono in papers on 火 16 4月 2019.

共同研究論文が PLOS ONE に掲載

関西医科大学 広田 喜一 学長特命教授を中心とした研究グループによる共同研究論文 “Cancerous phenotypes associated with hypoxia-inducible factors are not influenced by the volatile anesthetic isoflurane in renal cell carcinoma” が PLOS ONE に掲載された。 全身麻酔で一般的に広く用いられている揮発性吸入麻酔薬「イソフルラン」が、通常の手術で使われる濃度と使用時間ではヒト腎臓がん由来の細胞株の、包括的ながん細胞としての性質には統計学的に有意な影響を与えないことを示した論文で、広田さんとの共同研究論文は3本目。

前々回の論文前回の論文のときと同様、RNA-seqデータ解析は、次世代シークエンサーDRY解析教本に沿って。

first authorとcorresponding authorの方々が自分でやり方をDRY解析教本で勉強して、Figure7にあるような論文の図を作成するところまでやり遂げていただいた。 Figure8の散布図による発現値の可視化に関しては …

Continue reading »


half time of my research life

Written by Hidemasa Bono in misc on 日 14 4月 2019.

研究人生の中間地点

大学院を出て働き出した2000年から今年2019年で、19年。 そして、65才まで働くとして(これは怪しいが)、あと19年。 今年は、そのちょうど中間地点の年。 その年から初めた遺伝子発現のデータベースを未だに、しかもメインテーマでやっているのだから不思議なものだ。 変に老成することなく、もっともっと攻めていかなければ。

Continue reading »


thanks to jupyter bon

Written by Hidemasa Bono in misc on 土 13 4月 2019.

Jupyter本のサンプルコードのおかげで解決

諸事情あって、可視化をPythonでやろうとして、Jupyter notebookでグラフなどを出そうとしていた週末。 平日にはやらないような写経とかを楽しみながらも、どうやっても本にあるようなグラフがJupyter notebookで出なくて。 まずは、Jupyterのインストールがおかしいんじゃないかと、condaでいれてあったのを全て消してpip経由のインストールに替えたり。 matplotlib周りのおまじないのせいかと思って色々と試してみたが、それでも解決せず。 やっぱりグラフがインラインで表示されなくて、なんでだろうと色々もがいた挙句に。 公開していただいていたJupyter本のサンプルコードをみて気がついた。

そう、自分のコードはJupyter notebookのコードセルに1行ごとに実行していて、このサンプルコードにあるようにカタマリでコードセルに突っ込んでない、ということを。 それで全てが解決してうまく動くようになった。 ありがとう、Jupyter本のサンプルコードウェブサイト!

Continue reading »


AOE layer the 3rd

Written by Hidemasa Bono in misc on 金 12 4月 2019.

AOEの外堀

SRAにRNA-seqとして登録されているものの、NCBI Gene Expression Omnibus(GEO)やEBI ArrayExpress(AE)といったいわゆる遺伝子発現データベースに登録されていないデータを抽出してAOEに突っ込んだ。 DDBJ Genomic Expression Archive(GEA)は先月末の作業で取り込まれるようにしたが、今回さらに懸案だったのを対処した形。 お堀に例えるなら、AEとGEA分が内堀、GEOで中堀ときて、SRAにあるRNA-Seqデータを取り込んで、外堀を埋めた感じである

全く僅かな数ではなく、Seriesカウントで約一万ちょいある。 これらのデータは一体なんなのか。 実はdbGaPやEGAに入っているエントリでメタデータだけあるだけなののか、それとも…。 個別のエントリをガッツリみていかないとわからないが、取りこぼしはこれでないい言うレベルまできた感。

裁きの日は近い。

Continue reading »