BAMからCRAMへの変換、そしてその逆

BAMからCRAMへの変換を試してみた。samtoolsを使えば良いだけの模様。 [shell] samtools view -@ 4 -T hogenome.fa -C -o hoge.cram hoge.bam [/shell] 3,091,833,154byteあったファイルサイズが、2,325,565,061byteに。約75%になったとは、すごい!CPU時間的には

263.48s user 45.58s system 205% cpu 2:30.72 total

複数CPUを指定効果もあったようだ。これぐらいの時間なら普段はCRAMにしておいて使うときだけBAMというのが実現可能か?

また、逆にCRAMからBAMへの変換もsamtoolsで。 [shell] samtools view -@ 4 -T hogenome.fa -b fuga.bam fuga.cram [/shell]

723.15s user 33.29s system 187% cpu 6:44.06 total

戻す方が時間がかかり、しかも元よりは少し大きくなった模様で、3,101,761,103byteに。 だが、CRAMで置いておくことは今後ディスクスペースの節約になりそう。

IGVもbeta(version3)だとCRAMに対応しているようだが、CRAMのindexが必要。しかしながら、このindexの作成が劇的に遅く、上述のように一度BAMに戻して利用したほうが良さそう。上記のCRAMのindex作成は結局、実時間で約3時間かかった…。


Written by bonohu in misc on 火 18 4月 2017.