Trinity実行時のFASTQヘッダ問題

Trinityを実行する際にFASTQのヘッダが問題となる事例。以前から同様の事が起きており、その場合は、 [shell] bzcat file.fq.bz2 | awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' | awk '{if(NR%4==1) $0=sprintf("'"@${index}%d"'",(1+i++)); print;}' | bzip2 -c > file2.fq.bz2 [/shell] のようなコマンドでヘッダを書き換えしのいでいたが、これが今回効かず。

ちゃんとSRAからダウンロードしてきたFASTQファイルなのに、Trinityでエラーが出て先に進めないなんて、と思ってエラーメッセージを眺めていたら、

If your data come from SRA, be sure to dump the fastq file like so: SRA_TOOLKIT/fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-files file.sra

とあったので、ダウンロードしてきたFASTQは諦め、sraファイルの方を再度ダウンロードし、fastq-dumpによって生成してみた。 [shell] fastq-dump –defline-seq ‘@$sn[_$rn]/$ri’ –split-files file.sra [/shell] 生成されたFASTQファイルを指定してTrinityを実行すると、バッチリうまく実行できた。


Written by bonohu in misc on 月 10 4月 2017.