tophatのインストール

Written by bonohu in misc on 火 09 12月 2014.

Macosxの場合のtophatのインストールコマンド。もちろん、tophatのサイトからバイナリファイルを取ってきてそれを使うのでもいいのですが、tophatから呼び出される依存関係のあるプログラムも同時にインストールしてくれる点でhomebrewが便利なので、こちらを推奨します。

[shell] brew tap homebrew/science -v brew install -v tophat [/shell]

sratoolkitは、tophatとは依存関係がないものの、公共NGSデータベースのSRA(Sequence Read Archive)からダウンロードしてきたデータからfastqファイルを生成する際に必要なので入れておくことを推奨します。

[shell] brew install -v sratoolkit [/shell]

mappingする対象のreference genomeは、検索可能になるよう、あらかじめインデックスを作成しておく必要があります。Reference genomeがhogenome.faというファイルで、hogeという名前でインデックスを作成する場合は以下のようにコマンドを実行します。

[shell] bowtie2-build -f hogenome.fa hoge [/shell]

Continue reading »


bamの切った貼った

Written by bonohu in misc on 月 08 12月 2014.

Reference genome配列に対するmappingの結果ファイル、bam。そこから特定の染色体などの場所を絞り込んだデータだけを作成する場合に以下のsamtoolsのオプションが大変有効です。 複数のbamファイル(1.bam 2.bam 3.bam)をmerge(結合)して、all.bamというファイルにしたい場合は以下のコマンドで。

[shell] samtools merge all.bam 1.bam 2.bam 3.bam [/shell]

all.bamファイルをsortして、それを上書きする場合。

[shell] samtools sort all.bam all [/shell]

IGVで閲覧するなどindexが必要な場合に。indexファイルとして.baiな拡張子のファイルが作成されます。

[shell] samtools index all.bam [/shell]

逆に切り出し。実はこれをやるためにもindexファイルが必要なようでした。all …

Continue reading »


統合データベース講習会AJACS岩手

Written by bonohu in misc on 日 07 12月 2014.

今シーズン初めの雪が積もりだした岩手医科大学矢巾キャンパスにて講習会。師走の忙しい時期ということもあってか、若干集まりも悪く、人数も少なめでした。しかしながら、内容としては濃いものでした。

今回の講習会の内容は、ホスト先の先生のご希望もあり、いつもとは違うラインナップで、とくに自分は「RおよびBioconductorを使ったバイオデータ解析」と題した講習を担当しました。これまで出してきた論文の中でRにお世話になった部分は少なからずあり、それを解説して実習をやるという形式で2時間弱。予想したボトルネックである「Rのインストール」は、事前にしてきてもらうことをお願いして回避。そして、前回9月の講習でハマった「講習で使うデータの受け渡し」(ネットでダウンロードしてもらうと、ブラウザ環境がヘテロなためにどこにダウンロードしたかがわからず、個別対応で時間が取られる)もUSBメモリで会場配布することで、受講者がファイルの置いた場所を意識でき、乗り切れました。ところが、です。Rを実行する際にそのデータをどこに置いたかに個人差があり、現在作業しているディレクトリにデータファイルがおいてあることが前提で進めてあるサンプルスクリプトそのままでは動かず、setwd()を個別対応する必要がありました。ファイルが置かれている場所が日本語入り(マルチバイト文字列)だったりして(ムニャムニャ)。その辺も揃えて実行できるような講習内容にしないとダメですね。そういうこともあってなかなかコードの中身の説明が十分にできなかった気もしますが、ゼロからそういうスクリプトが書ける必要はない話等して納得いただけたのではないかと。コマンド一発でグラフの画像ファイルが生成されたときのみなさんの感激にはハッとされました。その感激を忘れずに、新規なツールと格闘していきましょう、お互いに。

実は、北東北(きたとうほく)で初の開催でした。まだ開催していない地方は山陰地方ぐらいとなりました。日本全国でDB利用講習会を …

Continue reading »


NO DATABASE, NO RESEARCH. DBCLS

Written by bonohu in misc on 木 27 11月 2014.

「種を超えて保存された生理代謝機構の解明に向けて:データベースによるアプローチ」と題して、第37回日本分子生物学会年会にてフォーラムという枠をいただいた。そもそもワークショップ採択を目指して応募したものの落とされ、その後フォーラムがやれるかどうかという連絡もなく放置され、ポスター発表等すべてが決まってからフォーラムをやっていいということになったので演者のセレクションに大変困ったため、最終的には同じ職場から同じくワークショップに出していてフォーラムに回されたところとの事実上の共同開催となった。Scientific Dataに関してNatureのなかのひとに話してもらった部分がそれで、他の演題との関連性が厳しいかなあと当初は思っていたものの。 実際やってみるとすべての演題における課題が「データベース」という、必然的に共通の課題がハイライトされて、結果としてうまくまとまったというのが本音。「種を超えて保存された」という部分に関しては来年以降の課題ということで、また次回以降もやっていきたいなと。 例によって私のイントロは去年出したPLOS One論文をネタにしたものでしたが、オチとしてはこのブログエントリのタイトルにある

NO DATABASE, NO RESEARCH. DBCLS

というスライドにしてみました。実際、こういう状況が多くの研究分野において起こっているのではないかと推測しておりましたが、学会で多くの人と 話してみてその「憶測」は「実測」へと変わりました。もっともっと我々DBを普及するものが頑張っていかないといけない研究社会になっているようです。がんばろう、DBCLS!

141126forum.001

Continue reading »


目訴本

Written by bonohu in misc on 月 24 11月 2014.

amazonにも目訴本のエントリが。Ensembl, Jalview, InterPro, GEO/ArrayExpressの項のほか、第1部の「ウェットな研究にデータベースやウェブツールを役立てるための秘訣」という雑文を寄稿しました。現時点でよく使われる各DBやウェブツールについての情報や我々の考えが紙媒体として出る久しぶりの機会でした。皆さんの参考になれば幸いです。 [amazon template=thumbnail&asin=4758103437] 私個人としては、普段から慣れ親しんだDBやウェブツールの紹介でしたから、前者のEnsembl, Jalview, InterPro, GEO/ArrayExpressの項はさらっと、とくにInterProのそれは依頼があってから1日で書いてしまうぐらいでした。 ところが、です。「秘訣」の方はかなり苦労しました。2014年夏休みの宿題として、この夏ずっと抱え込んで悩んだ結果です。実は結論ありきで、その主張に関して普段から生命科学研究者に伝えたいトピックで肉付けしていくという工法で。皆さんのご意見、ご批判を期待しています。

Continue reading »


Biohackathon2014終了

Written by bonohu in misc on 日 16 11月 2014.

宮城県松島で開催されたBiohackathon2014に参加してきました。目標にあげた、複数のマシンに分かれてやっているAOEのデータ更新の仕組みの統合化とgithubでの公開は達成しました。そして、データ更新も開発者がいる前で実際に実行し、一部不具合があったのをその場で対応してもらいました。実際のデータ取得のためのスクリプト生成部分が一部手動のため全自動にはなっていないのですが、更新の手間が大分減ったかと。別手段でのメタデータ取得を検討するのが今後の課題かと。表示データの検討(シークエンサ情報をどこまで載せるかとか)と検索精度の向上(アレイの型番の検索対応とか)が今後の課題ですね。次回はちゃんと前で発表できるよう、一番最初から参加せねば…。

Continue reading »


自家製BLAST用DBから必要な配列エントリバッチ取得

Written by bonohu in misc on 金 14 11月 2014.

自家製BLAST用DBから必要な配列エントリ取得の続き。 配列セットを作成したいときは2,3本でなく、数十本から数百本といったことが多いようです。

[shell] blastdbcmd -db oreno.aa -entry 'gi|5524211|gb|AAD44166.1|' [/shell]

といったコマンドを繰り返せばもちろん取得できますが、IDだけが書かれたファイルから一気にバッチ取得したい時がほとんどです。それ用のオプションも…ありました!

[shell] blastdbcmd -db oreno.aa -entry_batch 1.txt [/shell]

1.txtは1行ごとにIDが書かれた(改行コードがdelimiterとなっている)ファイル。こちらのほうがはるかに高速です。

Continue reading »



fastQC

Written by bonohu in misc on 金 31 10月 2014.

シークエンスのクオリティチェックによく使われるのがfastQC。その詳しい説明はこちらに譲る。SRAにアーカイブされているデータに関してはあらかじめ計算したものがDBCLS SRAから利用可能だが(例: Illumina bodymap2 transcriptomeの1ファイル)、公開前のデータは自ら計算する必要がもちろんある。

homebrewなら以下のコマンドでfastQCがインストールできる。 [shell] brew install -v fastqc [/shell] エラーが出た場合はhomebrew/scienceをtapしていない可能性が。 [shell] brew tap homebrew/science [/shell] してから上のコマンドを実行。

JDKが入っていないと入れろというメッセージが出るので、そのインストールを忘れずに。

[shell] fastqc ERR030893.fastq -o fastqc_out [/shell] のようにして使う。fastqc_outは結果のファイル(HTML形式)が出力されるディレクトリ。また、fastqファイルが圧縮されている場合でも [shell] fastqc ERR030893.fastq.gz …

Continue reading »


Mishima.syk#4

Written by bonohu in misc on 日 26 10月 2014.

次回に引き続き、今回も発表させていただく。ただ前回のようにいつもの話じゃなくて、新ネタ披露の場としてみなさんに被験者となってもらって。 結果としてほぼ全員MacOSXという幸運に恵まれたものの、反省点の多いハンズオンとなってしまいました。 思っていたよりもコマンドを動かすには必要なファイルが多く、そして大きく、USBメモリでの受け渡しの限界を感じた。あらかじめその種のファイルをダウンロードしてもらって、というのが良さそう。 手を動かしてもらうところをもっと多くすべきでした。準備不足で申し訳ありませんでした。

Continue reading »


Japan Spotfire User Group Meeting 2014

Written by bonohu in misc on 土 11 10月 2014.

割と欠かさず参加してきたJapan Spotfire User Group Meeting(JASPUGM)。今回は久しぶりに話す機会を頂きました。内容的には普段から各地で話している講演の再構成版ですが、次世代DNAシーケンサーと統合データベース活動の2つをテーマに、それぞれ基調講演と分科会講演ということで。現時点では、SRAにDNA塩基配列情報が約3Pbases登録されており、その容量が約2Pbyteだったということが聴衆には衝撃的だった模様。ちなみに、P(ペタ)はT(テラ)の1000倍の単位です。それを伝えたスライドはまだslideshareにもアップしていなかったので、今回の講演記録としてここに掲載しておきます。

SRA(Sequence Read Archive)

GUIで手軽にjoinできる機能がやはり便利!というのは今も変わっていないということを再確認。そういう意味では統合TVにアップされているSpotfireの使い方もまだまだ現役かなと。だいぶ長い間更新していないので、アップデートが必要なんですけど…。作り手おりませんかねぇ。

Continue reading »


justRMAその後

Written by bonohu in misc on 火 09 9月 2014.

処理したい生データ(CEL.gzのファイル)だけを実行するdirectoryに集めて、justRMAを実行するのであるが、これらはとくにgzip圧縮を解凍する必要はなく、圧縮されたままでも実行されるようである。同じ生データを何回も別のデータセットとして使うことになると思うが、cpコマンドでその都度複製を作るのではなく、lnコマンドでリンクにしたほうがディスクスペースの削減になる。

[shell] ln ../140909/GSM1217731.CEL.gz . [/shell]

という具合に。この例では、今の作業directoryの親directoryにまた別の作業directory(名前は140909)があって、その中のGSM1217731.CEL.gzを再度使うのであるが、単にコピーするのでなく、リンクを張っている。

R/Bioconductorを入れてjustRMAを実行する部分は過去のエントリを参照。

生成されたファイル(RMA.txt)のヘッダ行(一番先頭の行)には各実験のラベルとしてファイル名が使われていて、例えばGSM1217731.CEL.gzなどと書かれている。情報として欲しいのはGSMのID('GSM1217731'だけ)のみで、残りの.CEL.gzは余分で、スペースを取り、むしろ邪魔である。それを抹殺するのに以下のperlワンライナーが有効である。

[shell …

Continue reading »


GEOにあるCELファイル名を扱いやすくするには?

Written by bonohu in misc on 火 09 9月 2014.

GEOは遺伝子発現データのアーカイブで、再利用できるデータの宝庫である。だがしかし、多くのユーザがデータをdepositしてきているためファイル名などに一貫性がなく、コンピュータでの一括処理に困ることもたびたびある。

例えば、GSE50378に含まれている4つのマイクロアレイのraw dataのうち、GSM1217731のファイルは、GSM1217731_110720_03_dmso24H.CEL.gzってな具合に実験条件までファイルに書かれていて(それはそれで何の実験であるかのラベルとして便利なのだが)、他のシリーズのデータと一括してRMA正規化などを行う際にはファイル名に一貫性がなく、却って不便である。このGSMのIDのみがファイル名になっている(もちろん、ファイル拡張子がそれ以外に付くが…)のが、一括処理には向くわけである。 実際のデータファイルの名前を見たところ、この種のデータはGEOにおいてGSM数字_任意の文字列.CEL.gzというルールで付けられているようなので、中にある「任意の文字列」を削って、GSM数字.CEL.gzとなるように変換するscriptで対応することにする。

[perl] while(<>) { chomp; $f1 = $_; $f2 = $1.".CEL.gz" if(/^(GSMd+)/); system("mv -i $f1 $f2"); } [/perl]

これをrename.prlという名前で保存し、変更したいCEL …

Continue reading »


バイオインフォマティクス人材育成カリキュラム(次世代シークエンサ)速習コース

Written by bonohu in misc on 月 08 9月 2014.

9/5に表題の講習会の講師を務めてきました。普段、日本各所で行っている統合データベースの普及利用促進のための1-2日開催の統合データベース講習会AJACSとは異なり、NGSの速習コース(とはいえ、2週間がっつり)ということで気合の入った受講生たちでした。私のパートは「配列解析基礎」ということで、配列解析の歴史や配列、ゲノムデータ記述のフォーマット、基礎的な配列比較解析の原理と実習を3時間ほど。NGS速習コースということでメインではなく、NGS解析に関係する歴史的な背景やデータフォーマットに重点を置いたので、もっとガッツリ配列解析を勉強したかった人には不満足な内容だったかもしれませんがそういう人は独習でカバーして下さい。何でも教えてもらいたいという姿勢が垣間見られ、「主体的に学ぶ」姿勢をもっと着けてほしいな、と思ったのは私だけではないのではないかと。もちろん、ほとんどの人はそう実践していて、ほんの一部の人の傾向だけかもしれませんが。

[slideshare id=37668088&w;=597&h;=486&fb;=0&mw;=0&mh;=0&style;=border: 1px solid #CCC; border-width: 1px; margin-bottom: 5px; max-width: 100%;≻=no]

Basic Sequence Analysis from Hidemasa Bono

サンプル配列をあらかじめ …

Continue reading »


mtr

Written by bonohu in misc on 木 21 8月 2014.

あるホストから別のホストまでのネットワーク経路をリスト表示するコマンドtracerouteの今風版のmtrなのだが、homebrewで [shell] brew install mtr [/shell] で簡単にインストールできてしまうが、そのままではエラーが出て実行できない。しかし、以下のようにsudoをつけてroot権限で実行すると [shell] sudo mtr bonohu.jp [/shell] うまくネットワーク経路が表示される。しかし毎回、sudoしたくないので、setuidする。それには [shell] sudo chown root /usr/local/sbin/mtr sudo chmod u+s /usr/local/sbin/mtr [/shell] してmtrコマンドをroot権限で実行できるように。 homebrewは一般ユーザーでなんでもできるようになっているが、こういうところで注意が必要。回避する手段がhomebrewにあるかもしれんが…。

Continue reading »


difffのチカラ

Written by bonohu in misc on 火 19 8月 2014.

論文reviseの際などには、某論文のコピペの可能性を示唆したあのツールがもちろん役に立つ。しかしながら、以下の様な行番号が付いた文書データしか手元になく、それと新しい版を比較せねばならないことがある。

1 High-throughput sequencing technology, also called next-generation sequencing (NGS), 2 has the potential to revolutionize the whole process of genome sequencing, 3 transcriptomics, and epigenetics. Sequencing data is captured in a public primary 4 data archive, the Sequence Read Archive (SRA).

直接コピーして貼り付けると、内容は同じでも行番号が邪魔して異なっていると判断されてしまう …

Continue reading »


ゲノムマッピング結果をwigで表示

Written by bonohu in misc on 土 09 8月 2014.

Bowtieなどで単にゲノムマッピングした結果(sam/bam形式)を各位置ごとに数値で表現してみたいというときに。マシンパワーと出力されるデータ量の制限で10塩基刻みでwigに変換するには [shell] samtools mpileup hoge_sorted.bam | perl -ne 'BEGIN{print "track type=wiggle_0 name=fileName description=fileNamen"};($c, $start, undef, $depth) = split; if ($c ne $lastC) { print "variableStep chrom=$cn"; };$lastC=$c;next unless $. % 10 ==0;print "$startt$depthn" unless $depth<3;' > hoge.wig [/shell] ってなかんじで …

Continue reading »


自家製BLAST用DBから必要な配列エントリ取得

Written by bonohu in misc on 金 08 8月 2014.

BLASTでヒットがあったエントリの配列データを切り出してきたい時はままあるかと。公共データベースのエントリならtogowsのRESTで取得するなり、ググるなりNCBIで検索するなりで配列データにありつけるかと思います。ところが、自分で作成したDBに対してBLASTした場合にはそうもいかないことがあるわけで。その場合どうするか、なのですが、とくに新規のコマンドをインストールしなくてもできるいい方法があります。

それにはまず、BLASTのDBを作成するコマンドmakeblastdbを実行するときに-parse_seqidsというオプションも足して実行します。例えば、自分の手持ちのDBがoreno.aaというFASTA形式のファイルだとすると

1
2
3
#!/bin/sh

makeblastdb -in oreno.aa -dbtype prot -hash_index -parse_seqids

な感じで。 そして、BLASTヒットがorenogene1だったとすると

1
2
3
#!/bin/sh

blastdbcmd -db oreno.aa -entry orenogene1

とすればFASTA形式でそのエントリの配列が取得できます。ただ、FASTAのヘッダ行のラベルが|(パイプ)などで長くなっていると、行頭からスペースが現れるまでの文字列を指定する必要があるようです。例えば …

Continue reading »


github再入門

Written by bonohu in misc on 水 06 8月 2014.

某所の講習会でファイルの共有を(バックアップで)やっておく必要が出てきたので、新しいレポジトリを作成する必要が。完全に忘れたので、一番最初から。 [shell] git config --global user.name "Your name" git config --global user.email "Your email address" git config --global core.autocrlf input git config --global core.sefecrlf true [/shell] そして、レポジトリに入れたいファイル群をadd&commit。 [shell] git init git add . git commit -m "first commit" [/shell] そして …

Continue reading »


配列解析基礎の講習準備

Written by bonohu in misc on 火 05 8月 2014.

バイオインフォマティクス人材育成カリキュラム(次世代シークエンサ)速習コースの講師で「配列解析基礎」を担当。その講習会資料をここ数日作成。 振り返ってみると自分が大学院に入った頃からすでに20年ぐらい経っていて、すでに歴史の中にいる自分に気づくなど…。 昔に翻訳した「バイオインフォマティクス」や自分で書いた「バイオインフォマティクス」(若葉本)も見返したり、紙媒体で持っている資料も多く掘り返しての労作となりました。その過程でこれらのコンテンツがかなり古くなっていることに気づくなど。 (狭義の)大学教員でなく、講義をしないからかつてはそういう物書きを進んでしていたのだが、最近もそういう機会もなく、また実際のデータ解析の現場にもいないので遠ざかっていたり。 機会があればアップデートしたいとは思っているのですが、書籍を出す話もなく、このブログ止まりなところが現状。うまいやり方ないかな。 [amazon asin=489706290X&template=thumbnail] [amazon asin=4895924262&template=thumbnail]

Continue reading »


IGVはじめました

Written by bonohu in misc on 金 01 8月 2014.

IGV(Integrative Genomics Viewer)をいじってみた。まずは、統合TVの基本編の方を見て。ダウンロードするときに所属機関の記入が必須の模様。'IGV 使い方'でググって出てきたウェブサイトも参考にしながら、データを準備して以下の読み込むところまで。 今回の対象が予め用意されたgenomeにない非モデル生物種だったので、bamファイルを作成する際に使ったFASTAファイルを読み込むところから始める、裏口入学でw。メニューバーの「Genomes」→「Load genome from File…」からFASTA形式のゲノム配列を読み込んで。

ただ幸いなことに、すでにsamからbamに変換されたファイルをもらっていて

[shell] samtools view -bS hoge.sam > hoge.bam [/shell]

のsam-bam変換は必要なかったので、以下のsort & indexを作るところから。

[shell] samtools sort hoge.bam hoge_sorted samtools index hoge_sorted.bam [/shell …

Continue reading »


スパコンユーザー会

Written by bonohu in misc on 木 31 7月 2014.

他の方々の使い方を垣間見れて参考になった。公共データベースを利用して、という使い方はそれほどメジャーではなかったものの、そういう要望も出てきているようで。私も計算をする前の調査ばかりじゃなくて、そろそろメインの計算始めないと。

Continue reading »


Soylatte事始め

Written by bonohu in misc on 水 30 7月 2014.

DBCLS SRA Metadata Search の結果をJSONで取ってくるのを教えてもらったので、備忘録的に。

まずは出力されるJSONを処理するコマンドとして、jqをインストールしておく。

[shell] brew install -v jq [/shell]

で。SRAデータの中で、Study typeが'Transcriptome'、キーワードとして'heat shock'を含むものを取ってくるときには

http://sra.dbcls.jp/search/data/search?species=&type=Transcriptome&instrument=&query=heat%20shock'

のようなURLを叩けば結果がJSONで返ってくるようになっているようで、そこからStudy IDだけを取ってきたいときにはcurlと上記のjqとあわせて、

[shell] curl 'http://sra.dbcls.jp/search/data/search?species=&type=Transcriptome …

Continue reading »


Python Imaging Library

Written by bonohu in misc on 日 27 7月 2014.
[http://www.pythonware.com/products/pil/](http://www.pythonware.com/products/pil/)

から入手できるとのことで、 Python Imaging Library 1.1.7 Source Kit (all platforms) (November 15, 2009) をダウンロード。5年近くアップデートされていないようで、libjpegもfreetypeもすでに入れていたのだが [shell] python setup.py install [/shell] ではすんなりとはインストールできず。出てきたエラーメッセージをググって出てきたページを見るにヘッダファイルのディクレクトリ関係らしく、 [shell] ln -s /usr/local/include/freetype2 /usr/local/include/freetype [/shell] するとうまくセットアップできた模様 …

Continue reading »


実践コンピュータビジョン

Written by bonohu in misc on 土 26 7月 2014.

「実践コンピュータビジョン」(原著: Programming Computer Vision with Python)を本屋で手にとってみてから購入。次の展開にむけた体力づくりのため、勉強^2。

[amazon asin=4873116074&template=thumbnail]

来月末にあるこの本の勉強会にも参加登録して自分からやる気を絞り出して。それにしても本屋で本を買うのは久しぶりの出来事でしたw。

Continue reading »


続・Selenium+PhantomJSで縦長のスクリーンショットを撮る

Written by bonohu in misc on 木 24 7月 2014.

前のエントリのSeleniumとPhantomJSを使ってブラウザを起動しないでスクリーンショットを撮るスクリプトの汎用化をpythonの勉強がてら。

[shell] python scsho.py "http://sra.dbcls.jp/" [/shell]

以下のスクリプトをscsho.pyとして、コマンドライン引数としてURLを入れることでそのページのスクリーンショットがscshoXXXXX.pngというファイル名で保存されるようにした。XXXXXはそのスクリプトを実行した時のpid(プロセスID)。

[python] import sys import os argvs = sys.argv pid = os.getpid() png = "scsho" + str(pid) + ".png" from selenium import webdriver driver = webdriver.PhantomJS() driver.get(argvs[1]) driver.save_screenshot(png) driver.quit() [/python]

キャストしないといけないとか懐かしかったり …

Continue reading »


Selenium+PhantomJSで縦長のスクリーンショットを撮る

Written by bonohu in misc on 土 19 7月 2014.

ウェブブラウザのスクリーンショットは画面の大きさしか撮れないのだが(当たり前)、ポスター発表の際に縦長のそれを作成して説明に使いたい時がある。それを実現するのに良いツールに思わぬ所で出くわしたので、それをφ(..)メモメモ。諸般の事情によりpythonで。

まずは、Selenium WebDriverに対するpythonのbindingパッケージを入れます。

[shell] pip install selenium [/shell]

などとして。

次にPhantomJSを。こちらはhomebrewで。

[shell] brew install -v phantomjs [/shell]

そして、スクリーンショットを撮るコード。ウェブブラウザを起動することなく撮ることができます。 [python] from selenium import webdriver import time driver = webdriver.PhantomJS() driver.get("http://sra.dbcls.jp/") driver.save_screenshot("DBCLSSRA_top.png") driver.quit() [/python …

Continue reading »


第13回スポットファイアーワークショップ(創薬研究領域)

Written by bonohu in misc on 土 19 7月 2014.

昨日7月18日(金)に、東京有楽町東京国際フォーラムにて。今回のテーマは「創薬研究初期におけるデータの活用」。ライフサイエンスデータの流通業を本業としている我々にとって、「データの活用」のためにこそ「流通業」をやっているわけだし、密接に関わる大事なテーマということで。

最初にPEの人となったSpotfireの中の人々から新規機能紹介。すでに自分の使っているバージョンだったため、何気に参考になりました。データの可視化にSpotfireが使われているのは以前と変わらないのですが、内部データや購入したデータ(ベース)以外に公共データの活用に取り組まれている実例を聞いて、再利用性の高いデータベースを作成、維持管理いかねばならない思いを新たに。創薬研究業界と分子生物学な我々の界隈とで「公共データ」といったときの温度差も再認識。分かってはいたつもりでしたが、実際にやっている人たちの話を聞いて大事な「軌道修正」となったかと。日本人標準ゲノム配列や遺伝子発現あたりが折り合いポイントですかね。そういう意味でも大変参考になりました。

それにしてもMishima.syk関係者の多いこと^2。自分たちが三島に移転したから意識するようになっただけかもしれないのですが。三島勢、元気ですという印象は与えた模様。どんどん盛り上げていきましょう!

実は去年は大阪で参加したのを、これを書いていてふと思い出しました。研究テーマも人のつながりも継続してこそだと、これまた再認識する良い機会でした。

継続は力なり

Continue reading »


ウェブサイト統合

Written by bonohu in misc on 月 14 7月 2014.

研究者としての情報は、大学院時代から研究室で自ら立てたウェブサーバで発信してきました。ソフト的には、最初はNCSAなhttpdで始め、ほどなくApacheを使うようになってそれ以来ずっとApache。ハードとしては、最初はSunOSじゃないからという理由で研究室でのけもの扱いだった DEC 3000 を使っていたが、大学院を出て常時接続が普通になってからは自作 PC Linux を使って自宅鯖(サーバ)として趣味的に。その後、より少音で省電力な Mac mini を使うようになり現在に至っています。 これまでそのサーバ上で、dokuwikiを使って管理してきたコンテンツには、研究者として公開すべき情報や講演資料、バイオインフォマティクスという研究分野関係の日本語コンテンツや私の考えなどでした。 そのうち一番最初の情報はresearchmapとして成果報告に適した定型のものが一般的に使われるようになってきています。 また、講演資料に関してもスライドを共有できるslideshareや、講演動画そのものを共有している統合TVやYouTubeといったサービスを介して発信できるようになってきました。 日本語コンテンツに関しても「統合データベースプロジェクト」以前は置き場がなく自宅鯖に置いたりしてきたが、統合データベース講習会が行われるようになってそれの講習会資料としてMotDBから発信するものでほぼ事足りており、それの補遺的な存在として自宅鯖でのブログエントリを書いたり。 こう書くと役目を終えてきた感満載なのですが、一番最後の私の考えだけが自宅鯖で発信していくべき情報としてまだ残されているかな〜ということでdokuwikiに書いてきたことを全面的に見直し、コンテンツを整理することにしました。researchmapにあるべき内容はそちらで今後更新、自宅鯖にあるべき内容はこのブログで発信というかたちで。

Continue reading »


Mishima.syk#3

Written by bonohu in misc on 土 12 7月 2014.

Mishima.sykというライフサイエンス業界な勉強会に参加してきました。その名の通り、2014年4月からの職場である三島近辺のその業界の勇士^H^H有志たちの勉強会です。職場が引っ越す前に開かれた、前回の第2回目に参加させてもらって本業との意外な接点を認識し(もちろん、以前から知ってはいたものの…)、積極的にかかわっていこうと今回は職務地移動のことなどを中心にライフサイエンス分野の公共データベースに関わる現職場関係の発表もさせていただきました。勉強会の詳細は勉強会の名前とかでググってもらって見つけてもらうとして、参加しての雑感だけをつらつらと。

皆さん、プレゼンがうまい。OBKなフレーズの再利用など、時事ネタが満載(これは発表タイトルを見ただけでもわかるかと)。データにしてもプログラムにしてもpublicなものを再利用するという観点は、ともすると自らが新しいデータを出してのみ研究という考えを持つアカデミアとは違うなあと。つまるところ、我々が作ってきたものをうまく活用してくれているということです。公共データベースの利用はもっとこっち系に(も)広めていったほうが更なる展開があるのではないかと。

参加者に関して。関東からのリピーターも居たり、また関東から三島に通ってきている人も居たりで、ローカルな勉強会なのにローカルさがなかったり。新幹線で時間的に近いからでしょうかね。

そして、懇親会での横のツナガリが素晴らしい。前回もそこで知り合った縁でランチスポットのバリエーションを豊かにしたり、ワインバーを知るきっかけを作ったり、講演会のお話までいただいたりしましたが、今後もっと大きな協力関係につながっていくのではないかとさえ思ったり。

最後に。私にとって一番刺激的だったこのセリフ。

「コーディングはお金のかからない趣味」

調整的な役割の仕事が増えてコマンドラインワークから遠ざかりつつあった自分に対する「アドレナリン」となったようです。単純な自分はこれに刺激されて、久しぶりに「捨てコード」を書いてデータ解析仕事に戻ってみたり、と一番の収穫だったように思います。

NIG Retreat 2014 …

Continue reading »