ikra revisted

ikra再び

tximportで定量する部分を使わせてもらった、阪大医学部Python会のyyoshiaki氏によるikraであるが、また別プロジェクトで使わせてもらうことに。 Docker以外は特にデータ解析ソフトウェアをインストールしていない環境で手っ取り早くsalmonによる発現定量をしたかったため。 実は、このsalmonで発現定量をやる方法、Dr.Bonoの生命科学データ解析(Bono本)には載っていないのであった。

SRRのIDをリストで渡して配列データ取得からやってくれるSRR modeは確かに便利なんだが、直接FTPで配列取得するのに比べて時間がかかりすぎる気がする感じであった。 そこで、FASTQデータはすでに取得してあることが前提のFASTQ modeで使ってみたが、ちょっとバグがあってyyoshiaki氏とやりとりしたりして。 30サンプルほどのFASTQがほぼ1日半ほどで計算が全て終わった。 ただし、多くはファイルのトリミングとそれに続くQCに多くの時間がかかっていて、実際の定量は各サンプルあたり10分ほど。

もちろん、動かしている内容をきっちりわかっているという条件付きであるが、インストールでハマることなどなく、発現定量値を得ることができた。

ドッカの鯖で、ではなく 自鯖のDockerで、

このようにデータ解析パイプラインを流す時代になっていくのだろうか?

Dockerが入ってないといけないし、メモリ要求性もそれなりに高いし、誰でもすぐに簡単にとはいかないが。


Written by Hidemasa Bono in misc on 水 22 5月 2019.