Trinityがコケる

single end readsのTrinityの実行がこけて、hoge.fq.readcountファイルに以下のような記述が。

Error, cannot convert fastq file to fasta since cannot recognize read orientation as /1 or /2 (instead: F)

このエラーメッセージでググると同じ目にあった人のQAが。どうも、FASTQファイルのヘッダに問題があるようで、それを書き換えてしまえば問題ない模様。このQAにはこの書き換えスクリプトまで書かれていた。 [shell] awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' hoge.fq | awk '{if(NR%4==1) $0=sprintf("'"@${index}%d"'",(1+i++)); print;}' > hoge2.fq [/shell] アクセスできなくなると困るので、転記させていただく。hoge.fqが入力のFASTQファイル、出力されるFASTQファイルがhoge2.fq。

蛇足だが、Trinityは実行の途中でコケると中間ファイルが残って、次回の実行の際に影響することがあるので、上述のhoge.fq.readcountや実行結果などが出力されるtrinity_out_dirディレクトリは確実に消去すべし。

(追記)これはsingle end readによらず、pair endのときにも起きることがいろいろ計算していて判明。


Written by bonohu in misc on 月 29 8月 2016.