BAMからCRAMへのバッチ変換

ファイル変換weekになってしまったので、BAMからCRAMへのバッチスクリプトも紹介しておく。 SAMBAM変換とは異なり、リファレンスゲノム配列が必要で、それは各環境で違う場所にあると思うので、それは自分の環境のそれを指定しないといけないことに注意。

1
2
3
4
5
6
7
8
#!/bin/sh
p=4
gpath="/somewhere/reference_genome.fa"
for f in *.bam;
        do g="${f%.*}"
        echo $g
        time samtools view -@ $p -T $gpath -C -o $g.cram $g.bam
done

上記のスクリプト(bam2cram.shとする)を、BAMファイルの置いてあるディレクトリに移動してから、実行する。 [shell] sh bam2cram.sh [/shell] CRAMに対応したアプリケーションも少ない上に、CRAMができてもCRAMのindex作成に物凄く時間がかかり(BAMとは比較にならないほど時間がかかる)、ディスク容量の問題ぐらいしかメリットなさそうだが、現状。IGVもbetaのversion3だと対応しているものの、やはりindexが必要である。なので、もし使う場合は必要な時にBAMに変換して使う、そういう用途になるのでしょうか。


Written by bonohu in misc on 金 28 4月 2017.