samtools sort の並列化

samtoolsのsortは結構時間がかかります。新しいバージョン(1.2で確認)だと、-@というオプションを付ければ並列化されます。

[shell] samtools sort -@ 4 -T /tmp/hoge -o hoge_sorted.bam hoge.bam [/shell]

としたときに実行結果が以下のように。

976.00s user 17.04s system 273% cpu 6:03.68 total

273%ということは1cpuで実行した時に比して約2.7倍早くなったかと。

また逆にsamtoolsを内部から呼び出しているツールにおいて、このオプションが指定されているのだが、インストールされている(or PATHが通っている)samtoolsがこの並列処理オプションに対応していない古いバージョンのもの(例えば0.1とか)の場合、-@なんてオプションは知らないといってエラーで落ちるので要注意。


Written by bonohu in misc on 日 15 3月 2015.