歴史は繰り返す

約20年前、大学院生だったころと全く同じ手順を、対象配列セットを換え、ツールを換え、やっていることにふと気づく。かつてはFTPサイトからダウンロードしてきた予測アミノ酸配列セットに対して、今はTrinity→Transdecoder実行して作成した配列セットに対して。

  1. インデックス作成して

  2. 必要な配列だけ抽出して

  3. 多重配列アラインメント実行

[shell] makeblastdb -in Trinity.fasta.transdecoder.pep -dbtype prot -hash_index -parse_seqids blastdbcmd -db Trinity.fasta.transdecoder.pep -entry_batch id_list.txt > orenoaa.txt clustalo -i orenoaa.txt -o orenoaa.fa [/shell]

最後に、配列アラインメントを可視化して分子系統樹を書いてみるところは、Jalviewを使っているのは変わらず。Jalview凄い。

かつては、自作のスクリプトや、某環境特異的なソレを使ったりして一連の作業を実現していたが、現在はすべて誰でも使えるソフトウェアを組み合わせでできる。オプション指定がよくあるUNIXのコマンドらしくなくて複雑だったclustalwも現在ではclustalo(clustalω)に代替わりしていて、上記コマンド指定を見ての通り、素直なツールになっている。素晴らしい世の中になったものだ。


Written by bonohu in misc on 火 07 2月 2017.