曖昧配列パターン検索

配列パターン検索はUNIX的にはgrepでできるが、バイオな配列に対してだと、パターン中に改行が入った場合やヘッダ行中の「誤爆」を防ぎたい。さらには、いくつかのミスマッチも許容するには、EMBOSSパッケージのfuzznuc(塩基配列)やfuzzpro(タンパク質配列)を使えばよい。例えば、1塩基のミスマッチまで許して、AGGTCAというパターンをFASTA形式のファイルhoge.faに探す際には以下のようにする。 [shell] fuzznuc -sequence hoge.fa -pattern AGGTCA -pmismatch 1 -outfile hoge.fuzznuc [/shell] -pmismatchというオプションがキモ。


Written by bonohu in misc on 金 05 5月 2017.