IDなきデータ

Written by bonohu in misc on 月 10 7月 2017.

IDがない場合にどう関連づけるか。生命科学系の遺伝子のデータの場合はそれを塩基配列の類似性検索でなんとかなるが、そうでない場合にそれを …

Continue reading »




rsem-tbam2gbam

Written by bonohu in misc on 金 07 7月 2017.

RSEMの計算、TPMやFPKMなどしか見ないだろうと思っていたが、やっぱりgenomeに対するアラインメントを見る必要が出てきて。もちろん、--output-genome-bam をつけて再計算すればそれで良いのだが、それはそれでまた時間がかかる。長い計算の時 …

Continue reading »



Good news

Written by bonohu in misc on 火 04 7月 2017.

長年の懸案だったGeneChipのソレとRNA-seqのソレをついにjoinできた。これでさらに精度良く、目的の遺伝子群が抽出できるはず。 また、それ以外にもいい知らせが。2017年後半戦、ま …

Continue reading »


横方向のcat

Written by bonohu in misc on 月 03 7月 2017.

RSEMの結果ファイルからFPKM値で複数のサンプルの結果を抜き出したいとき。current directoryすべての結果ファイルに対してそれをしたい場合、以下のようなシェルスクリプトで。実行する前にFPKMというdirectoryを作成して、そこに処理したファイル群が書き込まれるようにする。

#!/bin …

Continue reading »




Differential Expression Analysis using EBSeq

Written by bonohu in misc on 木 29 6月 2017.

RSEMによるRNA-seqの続き。RSEMデータ解析チュートリアルにある発現差解析方法。 rsem-run-ebseqとrsem-control-fdrはmake installしても/usr/local/bin以下にインストールされないので、注意。hoge1とhoge2の2つのサンプルの発現差を解析する場合、以下のように。 [shell] rsem-generate-data-matrix hoge1.genes.results hoge2.genes.results > hogeMat.txt ~/Documents/src/RSEM-1.3.0/rsem-run-ebseq hogeMat.txt 1,1 hogeMat.results ~/Documents/src/RSEM-1.3.0/rsem-control-fdr hogeMat.results 0.05 hogeMat.de …

Continue reading »


真夜中のaccept

Written by bonohu in misc on 水 28 6月 2017.

前日に投げてたrevisionへのrevisionが日本時間の夜に。共同研究者に取り急ぎ連絡しておくとすぐに返事が来て、re-resubmitできる状態になったので、思い切ってすぐに。そうしたら、これま …

Continue reading »




意図しないプリンター出力

Written by bonohu in misc on 土 24 6月 2017.

出張先でプリンターから出力する必要があり、プラインター設定をちゃらっとして出力したものの。A4に打ち出したはずなのに90度回転したレイアウトで打ち出される。レイアウト設 …

Continue reading »


SPARQLthon57 day2

Written by bonohu in misc on 金 23 6月 2017.

2日目は開発しているserviceの検索インターフェースいろいろ打ち合わせをいくつか。この会では有識者がいて、そういった話を脇で聞いてくてて、「車輪の再発明」をせずにすむようなツッコミをいただ …

Continue reading »


SPARQLthon57 day1

Written by bonohu in misc on 木 22 6月 2017.

AOEでの検索結果から取得すべきSRAのRUNのIDを探し当ててSRAファイルを取得し、それらを並列にFASTQに変換して、トリミング後、発現定量して、発現差データ作成するのを並行に進めつつ、pfastq-dumpのバグ出しから。

Continue reading »





道具の研磨

Written by bonohu in misc on 日 18 6月 2017.

日頃よく使う「道具」のメンテナンス。システム標準のだと効率が悪かったりするので。 このブログでも何回か出てきた …

Continue reading »


rsem-calculate-expression for human

Written by bonohu in misc on 金 16 6月 2017.

ようやく、RSEMの実行。bowtie2でだが、以下のコマンドで。 [shell] time rsem-calculate-expression -p 12 --paired-end --bowtie2 --bowtie2-path /usr/local/bin --estimate-rspd --append-names --output-genome-bam hoge_1.fq hoge_2.fq rsem-bowtie2/human rsem_out/hoge [/shell] -pに12設定したが意外に時間がかかった。

real    333m27.062s
user    1795m57.676s
sys     98m26.410s

実時間 …

Continue reading »


rsem-prepare-reference for human

Written by bonohu in misc on 木 15 6月 2017.

リファンレンスゲノムとGTFの両方Ensemblから調達。実行時点で最新のEnsembl89を使って検索用のリファレンス作成。 [shell] time rsem-prepare-reference --gtf Homo_sapiens.GRCh38.89.chr.gtf --bowtie2 --bowtie-path /usr/local/bin Homo_sapiens.GRCh38.dna.toplevel.fa rsem-bowtie2/human [/shell] 実行時間はわり …

Continue reading »


GFF2GTF

Written by bonohu in misc on 水 14 6月 2017.

RSEMを実行する際には、リファレンスを作成する必要がある。それをやるrsem-prepare-referenceコマンドは、GFF(version3)はダメで、GTFしか受け付けない模様。しかもこのGTFのチェックが厳しく、大文字小文字も区別するようだ …

Continue reading »


RSEM with bowtie2

Written by bonohu in misc on 火 13 6月 2017.

RSEM (RNA-Seq by Expectation-Maximization)は、内部からaligner programを呼び出して使うタイプの発現定量プログラム。 しっかりしたチュートリアルが用意されていて、それに従って実行。 まずはRSEMで使うリファレンスを準備。

#!/bin/sh

rsem-prepare-reference --gtf ref/hogenome …

Continue reading »


MacPro不具合

Written by bonohu in misc on 月 12 6月 2017.

週末火を落として十分に冷却して見たものの、やはり起動が途中で止まる。そして、shiftを押しながら起動のセーフモードなら立ち上がるのだが、普通に立ち上がらないという状 …

Continue reading »



transdecoderがコケる

Written by bonohu in misc on 木 08 6月 2017.

しばらくぶりにtransdecoderを実行したところ、TransDecoder.Predictコマンドでコケた。 エラーメッセージ曰く、

% TransDecoder.Predict -t Trinity.fasta
CMD: /usr/local/Cellar/transdecoder/3.0.1/libexec/util/get_top_longest_fasta_entries.pl Trinity.fasta.transdecoder_dir/longest_orfs.cds 5000 > Trinity.fasta.transdecoder_dir/longest_orfs.cds.top_longest_5000
CMD …

Continue reading »







PAG ASIA 2017 3rd day

Written by bonohu in misc on 水 31 5月 2017.

最終日。やはり、来たら来ただけ、学ぶことがあった。PAG終了後同じホテルで開催された 2017 PacBio APAC User Group Meetingもフライトの時間の関係で最初だけしか出れなかったものの、いろいろと学ぶことだらけ。

学而時習之 不亦説乎

Continue reading »


PAG ASIA 2017 2nd day

Written by bonohu in misc on 火 30 5月 2017.

海外なのに時差が全くないのは素晴らしい。シャワートイレだし、メシマズじゃないし。信号もそっくりだが、右側通行 …

Continue reading »







SAMファイルをmerge?

Written by bonohu in misc on 水 24 5月 2017.

SAMファイルをmergeしてからBAMファイルに変換してsortしようとしたが。一度、BAMに変換してからsortするしかないのか? まず1ファイルづつ、SAM->BAM変換。 [shell] for f in .sam; do g="${f%.}" time samtools view -@ 4 -bS $f > $g.bam done [/shell] それらをmergeして、そのままsort。 [shell] time samtools merge -@ 4 - *.bam | time samtools sort -@ 4 -o merged.bam …

Continue reading »


StringTie

Written by bonohu in misc on 火 23 5月 2017.

RNA-seqのためのtranscript assemblyとquantificationのプログラムStringTie。またオプションが変わっているかもしれんが、前に動かした時のそれ。 [shell] stringtie fuga.bam -p 4 -o fuga.gtf -G hogenome.gff -A fuga_abd.txt [/shell] -Gで指定しているhogenome …

Continue reading »


hisat2

Written by bonohu in misc on 月 22 5月 2017.

hisat2でreference genomeにmappingする場合。hisat2のウェブサイトにすでにindexずみのそれがある場合はしなくていいが、まずはindex作成。hisat2-buildコマンドにて。 [shell] hisat2-build -p 4 hogenome.fa hoge [/shell] そして、実際のmapping。 [shell] hisat2 -p 4 -x hoge -1 fuga_1.fastq -2 fuga_2.fastq -S fuga.sam [/shell] 出力はSAM形式であることに注意。

Continue reading »


pip update

Written by bonohu in misc on 金 19 5月 2017.

pip updateコマンドはないので、pipで入れたパッケージのアップデートは以下のようにする。 [shell] pip3 list --outdated | awk '{print $1}' | xargs pip3 install -U [/shell] そろそろ、python3をデフォルトのpythonにして、version3系のpipをpip3と打たないで済むようにしたいところ。

Continue reading »




SPARQLthon56 day1

Written by bonohu in misc on 月 15 5月 2017.

AOEの追加機能の計算をpythonでやろうとするが、データがでかすぎて思うようにできず。できる手段を探しつつ、データをまとめて減らすことも検討。 メタデータの …

Continue reading »