統合データベース講習会AJACSa4つくば
Written by bonohu in misc on 木 10 8月 2017.
これまで、三島の国立遺伝学研究所で開催して来た中上級向けの講習会、統合データベース講習会AJACSadvancedを、初めて外部(つく …
これまで、三島の国立遺伝学研究所で開催して来た中上級向けの講習会、統合データベース講習会AJACSadvancedを、初めて外部(つく …
xenome続き。indexの作成だが、以下のように。 [shell] xenome index -v -T 6 -P fuga_in_hoge -H hoge.fa -G fuga.fa [/shell] 最初この実行が終わらず、プログラムが暴走しているのかと思 …
xenograft サンプルを分類するツールのxenomeだが、一時期ダウンロードできない状態が続いていたが、githubで復活した模様。 git cloneして、ドキュメ …
Cufflinksパッケージに入っているコマンドgffreadは、以下のオプションでGFF3形式からGTFに変換してくれる。 [shell] gffread hoge.gff -T -o hoge.gtf [/shell] これまで知らなかったが、便利な局面がありそう、ということで。
これまた信じられない訃報。直接一緒に働いたことはないものの、間接的にいろいろお世話になってきたこの分野の …
どちらかというと、こちらが教える立場であったはずだが、自分的にもいろいろ刺激を受けてきた。それを実現する方 …
まず、昨晩飛び込んで来たproofの対処。 ArrayExpressにデータとして明に含まれなくなったINSTRUMENT_MODEL(Sequencerの情報)をSRAのmetadataから抜き出してくる実装をして、githubへpush。コードの整理しなきゃな…。
三島にてSPARQLthon。まずは、AOEの拡張で発現データmatrixと格闘。
分子系統樹の描画といえば、これまでJalviewで満足してきた。しかしながら、bootstrap値の計算など系統樹描画に限界を感じ、食わず嫌いはいかんと思い立ち、MEGA (Molecular Evolutionary Genetics Analysis …
今年からはこれでいく。土用の牛の日は、牛肉(うし)を食べる。
[caption id="attachment_3888" align="aligncenter" width="640"] 160gランチステーキ&190g極みがんこコンビ[/caption]
オミックスデータ目次となりつつあるAOEでシークエンサー情報の詳細が更新されなくなっている。いろいろ調べた …
統合TVを始めてから10年の月日が経った(「統合TVの歴史」参照)。その間、1,263件の動画を公開した。そのうち、554が講演動画、311が実習の動画。それ以外の約400がスクリーンキャプチャーによるチュートリアル動画ということに。
当初は、チュートリ …
統合TVで使い方チュートリアルを作成し、統合TVから公開したツールf-treeの論文が公開された。
f-treeGC: a questionnaire-based family tree-creation software for genetic counseling and genome cohort studies Tomoharu Tokutomi, Akimune Fukushima, Kayono Yamamoto, Yasushi Bansho, Tsuyoshi Hachiya and Atsushi Shimizu BMC Medical Genetics 20171 8:71 DOI: [10.1186/s12881-017-0433-4](http://doi …
かなりしばらくぶり(といっても約半年ぶり)に、いくつかの講習会の講師に指名された。そこで、またテキストを作るわ …
PerkinElmer Japan ヘルスケアITセミナー「病院に於ける医療ビッグデータの活用とその最新事例」に参加。結果として、異分野殴り込み。話題と …
標記の報告書が公開され、NBDCの事業推進に関する報告書等に追加された。 それに対する「ライフサイエンスデータベース …
DDBJ30周年を期に静岡新聞に毎週連載されていた「遺伝子バンク30年」という連載が完結した模様。 大学院生時代に所属していた京都大 …
IDがない場合にどう関連づけるか。生命科学系の遺伝子のデータの場合はそれを塩基配列の類似性検索でなんとかなるが、そうでない場合にそれを …
今回は沼津駅北口プラザヴェルデにて開催された Mishima.syk #10 に参加。 まずは、勉強会のページのお昼ガイドにあった沼津 …
(このエントリは、Mishima.syk #10のライトニングトークのネタです)
Biocondaとは、
Bioconda is a channel for the conda package manager specializing in bioinformatics software.
とのことで、Bioinformaticsソフトウェアに特化したconda package mangerのチャンネル(bioconda.github.io …
RSEMの計算、TPMやFPKMなどしか見ないだろうと思っていたが、やっぱりgenomeに対するアラインメントを見る必要が出てきて。もちろん、--output-genome-bam をつけて再計算すればそれで良いのだが、それはそれでまた時間がかかる。長い計算の時 …
IGVをいじっていたら、右クリックメニューにSashimi plotなるものを発見。'sashimi plot'でPubmed検索しても1件しかでてこなかったが、'sashimi plots'にすると3件出て来て、その一つ(Quantitative visualization of alternative exon expression from RNA-seq data)によると、
a quantitative visualization of aligned RNA-Seq reads that enables …
長年の懸案だったGeneChipのソレとRNA-seqのソレをついにjoinできた。これでさらに精度良く、目的の遺伝子群が抽出できるはず。 また、それ以外にもいい知らせが。2017年後半戦、ま …
RSEMの結果ファイルからFPKM値で複数のサンプルの結果を抜き出したいとき。current directoryすべての結果ファイルに対してそれをしたい場合、以下のようなシェルスクリプトで。実行する前にFPKMというdirectoryを作成して、そこに処理したファイル群が書き込まれるようにする。
#!/bin …
本日2017年7月1日で、ついにライフサイエンス統合データベースセンター(DBCLS)に来て丸10年が経った。あの日、まだプレハブの仮住まいだったDBCLSから歩いて本郷三丁目駅に向かい丸ノ内線に乗って東京駅に …
去年のこの日にも書いた振り返りエントリ。 2017年前半を振り返って。出張による外泊は、28泊と昨年前半の43泊より減少。出張を抑制、データ解析や物書きに取り組もうと …
RSEMによるRNA-seqの続き。RSEMデータ解析チュートリアルにある発現差解析方法。 rsem-run-ebseqとrsem-control-fdrはmake installしても/usr/local/bin以下にインストールされないので、注意。hoge1とhoge2の2つのサンプルの発現差を解析する場合、以下のように。 [shell] rsem-generate-data-matrix hoge1.genes.results hoge2.genes.results > hogeMat.txt ~/Documents/src/RSEM-1.3.0/rsem-run-ebseq hogeMat.txt 1,1 hogeMat.results ~/Documents/src/RSEM-1.3.0/rsem-control-fdr hogeMat.results 0.05 hogeMat.de …
前日に投げてたrevisionへのrevisionが日本時間の夜に。共同研究者に取り急ぎ連絡しておくとすぐに返事が来て、re-resubmitできる状態になったので、思い切ってすぐに。そうしたら、これま …
先日参加した学会の参加者リストが公開されていた。ナンバリングされていたため、最後の行を見る限り255で、255名の参加者がいたらしいことがわかるものの、その内 …
標題のシンポジウムに参加して来た。研究データ利活用協議会(Research Data Utilization Forum(RDUF、読み方不明))とは、わが国における研究デー …
出張先でプリンターから出力する必要があり、プラインター設定をちゃらっとして出力したものの。A4に打ち出したはずなのに90度回転したレイアウトで打ち出される。レイアウト設 …
2日目は開発しているserviceの検索インターフェースいろいろ打ち合わせをいくつか。この会では有識者がいて、そういった話を脇で聞いてくてて、「車輪の再発明」をせずにすむようなツッコミをいただ …
AOEでの検索結果から取得すべきSRAのRUNのIDを探し当ててSRAファイルを取得し、それらを並列にFASTQに変換して、トリミング後、発現定量して、発現差データ作成するのを並行に進めつつ、pfastq-dumpのバグ出しから。
今年度(2017年度)も引き続き、国際学術情報流通基盤整備事業(SPARC Japan)のセミナー企画ワーキンググループのメンバーとして。そ …
探したらやはりあった、並列版のfastq-dump。これはpythonによる実装でインストールがちょっと…。さらに探したら、身近にbashでのimplementationを公開している方がいたw。こちらのほうがイ …
confers resistance to lidocaine-induced cell death wordpress_id: 3660 categories:
2006年3月にがんとハイポキシア研究会に初めて出てからすでに10年以上経ったが、ようやくこの研究会つながりの共同 …
日頃よく使う「道具」のメンテナンス。システム標準のだと効率が悪かったりするので。 このブログでも何回か出てきた …
ようやく、RSEMの実行。bowtie2でだが、以下のコマンドで。 [shell] time rsem-calculate-expression -p 12 --paired-end --bowtie2 --bowtie2-path /usr/local/bin --estimate-rspd --append-names --output-genome-bam hoge_1.fq hoge_2.fq rsem-bowtie2/human rsem_out/hoge [/shell] -pに12設定したが意外に時間がかかった。
real 333m27.062s
user 1795m57.676s
sys 98m26.410s
実時間 …
リファンレンスゲノムとGTFの両方Ensemblから調達。実行時点で最新のEnsembl89を使って検索用のリファレンス作成。 [shell] time rsem-prepare-reference --gtf Homo_sapiens.GRCh38.89.chr.gtf --bowtie2 --bowtie-path /usr/local/bin Homo_sapiens.GRCh38.dna.toplevel.fa rsem-bowtie2/human [/shell] 実行時間はわり …
RSEMを実行する際には、リファレンスを作成する必要がある。それをやるrsem-prepare-referenceコマンドは、GFF(version3)はダメで、GTFしか受け付けない模様。しかもこのGTFのチェックが厳しく、大文字小文字も区別するようだ …
RSEM (RNA-Seq by Expectation-Maximization)は、内部からaligner programを呼び出して使うタイプの発現定量プログラム。 しっかりしたチュートリアルが用意されていて、それに従って実行。 まずはRSEMで使うリファレンスを準備。
#!/bin/sh
rsem-prepare-reference --gtf ref/hogenome …
週末火を落として十分に冷却して見たものの、やはり起動が途中で止まる。そして、shiftを押しながら起動のセーフモードなら立ち上がるのだが、普通に立ち上がらないという状 …
計算途中に急に再起動がかかる。そして、再起動せず…。一回休みorz
しばらくぶりにtransdecoderを実行したところ、TransDecoder.Predictコマンドでコケた。 エラーメッセージ曰く、
% TransDecoder.Predict -t Trinity.fasta
CMD: /usr/local/Cellar/transdecoder/3.0.1/libexec/util/get_top_longest_fasta_entries.pl Trinity.fasta.transdecoder_dir/longest_orfs.cds 5000 > Trinity.fasta.transdecoder_dir/longest_orfs.cds.top_longest_5000
CMD …
解読されたゲノムデータのDBとしては、Genome OnLine Database (GOLD)が有名だが、この種のデータの本家NCBIのそれもかなり充実しているのを先日の学会参加で知った。 Genome Listがそれ。Organism/Name以外に、Kingdom, Group, Subgroupのほか、(Genome) Size, Chr(染色体数 …
ちょっと前の話題になるが。GATKのバージョン4がGATKのブログで紹介された。それと同時に、GATK4 is completely open sourceというブログエントリもポストされ、GATKのラインセンスが変更となるようである …
リトリートに参加してちょっと引っかかったことがあった。データベース(DB)を作るということに関する認識の違い …
引き続き。研究支援としてやっている事業に対して、事あるごとに説明して理解を深めてもらういいチャンスだった …
帰国して次の朝から遺伝研リトリートへ。 情報発信していることは思っている以上に見られていることが判明(この …
最終日。やはり、来たら来ただけ、学ぶことがあった。PAG終了後同じホテルで開催された 2017 PacBio APAC User Group Meetingもフライトの時間の関係で最初だけしか出れなかったものの、いろいろと学ぶことだらけ。
学而時習之 不亦説乎