Spliced Transcripts Alignment to a Reference (STAR)
また別のtranscript alignerのSpliced Transcripts Alignment to a Reference (STAR)によるgenome mappingを試してみた。まずは、STAR用のReference genomeのindex作成から。 [shell] time STAR --runThreadN 12 --runMode genomeGenerate --genomeDir genome4star --genomeFastaFiles hogenome.fa [/shell] メモリが足りないといわれたら、--limitGenomeGenerateRAM=3200000000のようなオプションを追加して。パラメータの渡し方が他とは違って=で指定しないといけないらしい。 そして、mapping本体は以下のように。 [shell] time STAR --runThreadN 24 --genomeDir genome4star --readFilesCommand pigz -dc --outFileNamePrefix hogenome --readFilesIn fuga_1.fq.gz fuga_2.fq.gz [/shell] のような感じで実行。read fileがgzip圧縮だったため、--readFilesCommandに並列版gzipのpigz -dcを指定して。効率よく並列化がなされているようで、体感としてTopHat4時間だったのが、STARで4分、という印象。 数多くのオプションが利用可能なようで、詳しくはマニュアル参照。