BioHackathon2017 day3
Written by bonohu in misc on 水 13 9月 2017.
翌朝になっても計算終わらず。その周りでごちゃごちゃと。 お昼周りを散歩するも、食事できるところは、かつてあった …
翌朝になっても計算終わらず。その周りでごちゃごちゃと。 お昼周りを散歩するも、食事できるところは、かつてあった …
温泉インフォマティクス研究会は、朝と夜の2回開催。AOE3にあたるプロジェクトを粛々と進めるも、計算終わらず。
2日に渡るシンポジウムが終わり、ハッカソン開始。 SPARQLthonの時にやってきていたDBCLS SRAとAOEまわりで仕事を進める予定。その前に、まずは温泉インフォマティクス研究会。1日目は、夜に1回の開催。
今年で10回目のBioHackathon。10回目記念ということもあって、いつもならシンポジウムは1日のところ、今年は2日間でしかも東京開催。FAIR Principles (FAIR原則: Findable, Accessible, Interoperable, and Re-usable)で有名なMark Wilkinsonさん曰く、
[The final version of FAIR Principles were crafted by participants of #BioHack15 , led by …
RefEx論文発表のその後の顛末。 論文に関するプレスリリースが、職場(DBCLS)と共同研究先の研究機関(遺伝研)から出され、マイナビや医学関係のニュー …
今回は理研和光にてSPARQLthon開催。諸事情により、今回は今日だけの参加。 サンプル方向の検索実装はBioHackathonで頑張ることを確認。 今回はArrayExpressのデータ更新をしこめなかったため、インデックス更 …
NBDC/DBCLSの遺伝子発現のデータベースというかウェブツール、RefExの論文が公表された。 これは2006年に文部科学省統合データベースプロジェクトが始まったときにすでにその原型があったサービスで、さまざまな測定手法による遺伝子発現データを並べてみるというコンセプトでデー …
2017年8月24日に大阪府枚方市の関西医科大学で統合データベース講習会AJACS河内に講師やTeaching Assistant (TA)として参加。講師としては、「遺伝子発現DBを含む公共オミックスDBの使い方」を担当。1日のみの講習で開始時間も朝早くからで(しかも学長から挨拶 …
生化学若い研究者の会九州支部夏のセミナーの講師に呼ばれたので話しに。5年前に同じく生化学若い研究者の会の夏の学校で話ししたときのものを現時点版にアップデートしてお話し …
xenome続き。indexができたので、それを使って分類。 [shell] xenome classify -T 12 -M 48 -P fuga_in_hoge -i fuga_RNAseq1.fq [/shell] FASTQファイルであるが、どうもbz2圧縮のままでは実行できない模様で、展開してから。
これまで、三島の国立遺伝学研究所で開催して来た中上級向けの講習会、統合データベース講習会AJACSadvancedを、初めて外部(つく …
xenome続き。indexの作成だが、以下のように。 [shell] xenome index -v -T 6 -P fuga_in_hoge -H hoge.fa -G fuga.fa [/shell] 最初この実行が終わらず、プログラムが暴走しているのかと思 …
xenograft サンプルを分類するツールのxenomeだが、一時期ダウンロードできない状態が続いていたが、githubで復活した模様。 git cloneして、ドキュメ …
Cufflinksパッケージに入っているコマンドgffreadは、以下のオプションでGFF3形式からGTFに変換してくれる。 [shell] gffread hoge.gff -T -o hoge.gtf [/shell] これまで知らなかったが、便利な局面がありそう、ということで。
これまた信じられない訃報。直接一緒に働いたことはないものの、間接的にいろいろお世話になってきたこの分野の …
どちらかというと、こちらが教える立場であったはずだが、自分的にもいろいろ刺激を受けてきた。それを実現する方 …
まず、昨晩飛び込んで来たproofの対処。 ArrayExpressにデータとして明に含まれなくなったINSTRUMENT_MODEL(Sequencerの情報)をSRAのmetadataから抜き出してくる実装をして、githubへpush。コードの整理しなきゃな…。
三島にてSPARQLthon。まずは、AOEの拡張で発現データmatrixと格闘。
分子系統樹の描画といえば、これまでJalviewで満足してきた。しかしながら、bootstrap値の計算など系統樹描画に限界を感じ、食わず嫌いはいかんと思い立ち、MEGA (Molecular Evolutionary Genetics Analysis …
今年からはこれでいく。土用の牛の日は、牛肉(うし)を食べる。
[caption id="attachment_3888" align="aligncenter" width="640"] 160gランチステーキ&190g極みがんこコンビ[/caption]
オミックスデータ目次となりつつあるAOEでシークエンサー情報の詳細が更新されなくなっている。いろいろ調べた …
統合TVを始めてから10年の月日が経った(「統合TVの歴史」参照)。その間、1,263件の動画を公開した。そのうち、554が講演動画、311が実習の動画。それ以外の約400がスクリーンキャプチャーによるチュートリアル動画ということに。
当初は、チュートリ …
統合TVで使い方チュートリアルを作成し、統合TVから公開したツールf-treeの論文が公開された。
f-treeGC: a questionnaire-based family tree-creation software for genetic counseling and genome cohort studies Tomoharu Tokutomi, Akimune Fukushima, Kayono Yamamoto, Yasushi Bansho, Tsuyoshi Hachiya and Atsushi Shimizu BMC Medical Genetics 20171 8:71 DOI: [10.1186/s12881-017-0433-4](http://doi …
かなりしばらくぶり(といっても約半年ぶり)に、いくつかの講習会の講師に指名された。そこで、またテキストを作るわ …
PerkinElmer Japan ヘルスケアITセミナー「病院に於ける医療ビッグデータの活用とその最新事例」に参加。結果として、異分野殴り込み。話題と …
標記の報告書が公開され、NBDCの事業推進に関する報告書等に追加された。 それに対する「ライフサイエンスデータベース …
DDBJ30周年を期に静岡新聞に毎週連載されていた「遺伝子バンク30年」という連載が完結した模様。 大学院生時代に所属していた京都大 …
IDがない場合にどう関連づけるか。生命科学系の遺伝子のデータの場合はそれを塩基配列の類似性検索でなんとかなるが、そうでない場合にそれを …
今回は沼津駅北口プラザヴェルデにて開催された Mishima.syk #10 に参加。 まずは、勉強会のページのお昼ガイドにあった沼津 …
(このエントリは、Mishima.syk #10のライトニングトークのネタです)
Biocondaとは、
Bioconda is a channel for the conda package manager specializing in bioinformatics software.
とのことで、Bioinformaticsソフトウェアに特化したconda package mangerのチャンネル(bioconda.github.io …
RSEMの計算、TPMやFPKMなどしか見ないだろうと思っていたが、やっぱりgenomeに対するアラインメントを見る必要が出てきて。もちろん、--output-genome-bam をつけて再計算すればそれで良いのだが、それはそれでまた時間がかかる。長い計算の時 …
IGVをいじっていたら、右クリックメニューにSashimi plotなるものを発見。'sashimi plot'でPubmed検索しても1件しかでてこなかったが、'sashimi plots'にすると3件出て来て、その一つ(Quantitative visualization of alternative exon expression from RNA-seq data)によると、
a quantitative visualization of aligned RNA-Seq reads that enables …
長年の懸案だったGeneChipのソレとRNA-seqのソレをついにjoinできた。これでさらに精度良く、目的の遺伝子群が抽出できるはず。 また、それ以外にもいい知らせが。2017年後半戦、ま …
RSEMの結果ファイルからFPKM値で複数のサンプルの結果を抜き出したいとき。current directoryすべての結果ファイルに対してそれをしたい場合、以下のようなシェルスクリプトで。実行する前にFPKMというdirectoryを作成して、そこに処理したファイル群が書き込まれるようにする。
#!/bin …
本日2017年7月1日で、ついにライフサイエンス統合データベースセンター(DBCLS)に来て丸10年が経った。あの日、まだプレハブの仮住まいだったDBCLSから歩いて本郷三丁目駅に向かい丸ノ内線に乗って東京駅に …
去年のこの日にも書いた振り返りエントリ。 2017年前半を振り返って。出張による外泊は、28泊と昨年前半の43泊より減少。出張を抑制、データ解析や物書きに取り組もうと …
RSEMによるRNA-seqの続き。RSEMデータ解析チュートリアルにある発現差解析方法。 rsem-run-ebseqとrsem-control-fdrはmake installしても/usr/local/bin以下にインストールされないので、注意。hoge1とhoge2の2つのサンプルの発現差を解析する場合、以下のように。 [shell] rsem-generate-data-matrix hoge1.genes.results hoge2.genes.results > hogeMat.txt ~/Documents/src/RSEM-1.3.0/rsem-run-ebseq hogeMat.txt 1,1 hogeMat.results ~/Documents/src/RSEM-1.3.0/rsem-control-fdr hogeMat.results 0.05 hogeMat.de …
前日に投げてたrevisionへのrevisionが日本時間の夜に。共同研究者に取り急ぎ連絡しておくとすぐに返事が来て、re-resubmitできる状態になったので、思い切ってすぐに。そうしたら、これま …
先日参加した学会の参加者リストが公開されていた。ナンバリングされていたため、最後の行を見る限り255で、255名の参加者がいたらしいことがわかるものの、その内 …
標題のシンポジウムに参加して来た。研究データ利活用協議会(Research Data Utilization Forum(RDUF、読み方不明))とは、わが国における研究デー …
出張先でプリンターから出力する必要があり、プラインター設定をちゃらっとして出力したものの。A4に打ち出したはずなのに90度回転したレイアウトで打ち出される。レイアウト設 …
2日目は開発しているserviceの検索インターフェースいろいろ打ち合わせをいくつか。この会では有識者がいて、そういった話を脇で聞いてくてて、「車輪の再発明」をせずにすむようなツッコミをいただ …
AOEでの検索結果から取得すべきSRAのRUNのIDを探し当ててSRAファイルを取得し、それらを並列にFASTQに変換して、トリミング後、発現定量して、発現差データ作成するのを並行に進めつつ、pfastq-dumpのバグ出しから。
今年度(2017年度)も引き続き、国際学術情報流通基盤整備事業(SPARC Japan)のセミナー企画ワーキンググループのメンバーとして。そ …
探したらやはりあった、並列版のfastq-dump。これはpythonによる実装でインストールがちょっと…。さらに探したら、身近にbashでのimplementationを公開している方がいたw。こちらのほうがイ …
confers resistance to lidocaine-induced cell death wordpress_id: 3660 categories:
2006年3月にがんとハイポキシア研究会に初めて出てからすでに10年以上経ったが、ようやくこの研究会つながりの共同 …
日頃よく使う「道具」のメンテナンス。システム標準のだと効率が悪かったりするので。 このブログでも何回か出てきた …
ようやく、RSEMの実行。bowtie2でだが、以下のコマンドで。 [shell] time rsem-calculate-expression -p 12 --paired-end --bowtie2 --bowtie2-path /usr/local/bin --estimate-rspd --append-names --output-genome-bam hoge_1.fq hoge_2.fq rsem-bowtie2/human rsem_out/hoge [/shell] -pに12設定したが意外に時間がかかった。
real 333m27.062s
user 1795m57.676s
sys 98m26.410s
実時間 …
リファンレンスゲノムとGTFの両方Ensemblから調達。実行時点で最新のEnsembl89を使って検索用のリファレンス作成。 [shell] time rsem-prepare-reference --gtf Homo_sapiens.GRCh38.89.chr.gtf --bowtie2 --bowtie-path /usr/local/bin Homo_sapiens.GRCh38.dna.toplevel.fa rsem-bowtie2/human [/shell] 実行時間はわり …
RSEMを実行する際には、リファレンスを作成する必要がある。それをやるrsem-prepare-referenceコマンドは、GFF(version3)はダメで、GTFしか受け付けない模様。しかもこのGTFのチェックが厳しく、大文字小文字も区別するようだ …