月別アーカイブ: 2016年4月

圧縮したファイルで処理する

NGSデータ解析の出発点は、シーケンサーやSRA (Sequence Read Archive)から取得したFASTQ形式のファイルなのは同じだろうが、これを圧縮しない(ファイル拡張子が.fqや.fastqのことが多いが … 続きを読む

カテゴリー: 2010年代のバイオインフォマティクス, データベース生物学, 趣味のプログラミング | 圧縮したファイルで処理する はコメントを受け付けていません。

行番号を付ける

バイオの業界ではとくに、IDが重複していることがある。Rでの処理の場合、それでは入力が受け付けてもらえず実行できないことがよくある。そんな時には行番号を付け、それをuniqueなIDにしてしまうという解決策がある。その処 … 続きを読む

カテゴリー: 2010年代のバイオインフォマティクス, 趣味のプログラミング | 行番号を付ける はコメントを受け付けていません。

joinコマンドの出力をタブ区切りに

joinというUNIXコマンドは、2つのファイルの同じ値のある行をjoinして、一行にまとめてくれるコマンド。 でタブ区切りテキストのfile1とfile2の一番左側のカラムの値が同じ行が結合されて出力される。 このコマ … 続きを読む

カテゴリー: 趣味のプログラミング | joinコマンドの出力をタブ区切りに はコメントを受け付けていません。