Category: misc

2017年の計

Written by bonohu in misc on 日 01 1月 2017.

年末に書いた2016年を振り返って、につづいて、年頭恒例にしているその年の計を。

2017年は、大学院に入って研究を本格的に始めてからの年数がついに産まれてきてからの年数の半分を越える年ということで、ある意味節目の年。ここ数年の懸案で継続して取り組んでいるメインの仕事、公共DBの全レコードを対象としたデータ解析研究にさらに力を注ぎ、まとめたい。

節目の年、という意味では、2017年でDBCLSに移って丸10年ともなる。今後の方向性を議論しているが、その中で自分のやるべきことをしっかり方向付け、実行に移していきたい。

ここ数年単調増加している出張外泊数は抑えめに、その時間を本務の研究活動に回したい。

文章を書くことをさらに習慣づけ、考えていることの情報発信を、twitter以外の手段で行っていきたい。

Continue reading »


2016年を振り返って

Written by bonohu in misc on 水 28 12月 2016.

2016年を振り返って。

職場であるDBCLSの一部が三島に移って3年目。「連携していない」とお叱りを受けてきたDDBJとの連携に重点を置いた。5月にINSDCのミーティングに参加して、その際に同時に行ったDDBJとEBI ArrayExpressチームとのcollaborationにも。手始めとして、ArrayExpressデータのミラーリング実務を担当。その結果、DDBJにネットワーク的に近い人達にArrayExpressのデータ取得が楽に短くなったわけだが、DBCLS的にもAOEの更新が無駄なく実行できるように。結果として連携強化されただけでなく、オマケ付き。

DDBJ以外の遺伝研の研究者との連携も、これまで種を撒いてきいるが、その中で「双葉」が出てきたものがあった。なんらかの形で「実」を結んでくれるといいな。

オープンアクセス、オープンサイエンスに関連して、前年(2015年)から文科省の担当官からヒアリング等を受けるようになっていたが、それに関連したSciREXにも関わるように。その季刊誌、SciREX Quarterly にリレーエッセイを書かせてもらった。それとは別だが、似たメンバーの集まる国立情報学研究所の国際学術情報流通基盤整備事業(SPARC …

Continue reading »


2016年出張外泊数

Written by bonohu in misc on 火 27 12月 2016.

一昨年から数えだしている「仕事で外泊」した日数。明日(12月28日)で2016年仕事納め、というわけで、2016年の日数確定。 なんと77泊。 1年は365日なので、単純に計算しても5日に1日は外泊している。2014年50泊、2015年65泊だったので、年々増加している。 もうちょっとやるべきことの「選択と集中」すべきだな。

Continue reading »


Trim Galore! のインストール

Written by bonohu in misc on 月 26 12月 2016.

Trim Galore! (trim_galore)を使うためにはfastqcとcutadaptのインストールが必要となる。cutadaptはpipでインストールできるのだが、そのpipはデフォルトでは入っていない。 pipのインストールには、いくつかのやり方があるが、ここではhomebrewでpython3を入れて、その際に入るpip3を利用する方法をとる。ここでpython3,pip3と末尾に3が付いているのは、pythonのバージョン3のそれ、ということで、デフォルトで入っているバージョン2のそれらと区別するためにそうなっている。

brew install -v python3

homebrewでのインストールを推奨しているのは、通常使う(rootでない)ユーザーでのインストールができるからで、permissionの問題で後に困る可能性を軽減するため、である。

余談だが、ここで使っているシェル(bashとか)によってはrehashを実行しないと、以下のコマンドを続けて入力した時に

command not found: pip3

と言われるので、忘れずに実行する。シェルを再度起動し直す場合には不要である。

そして、いよいよpip3を使ってcutadaptをインストールする。

pip3 install cutadapt

trim_galoreは、zipをダウンロードしてきて展開、/usr/local/bin/にコピーしてインストールする(以下)。

curl …

Continue reading »


倉廩実ちて礼節を知る

Written by bonohu in misc on 日 25 12月 2016.

今月(2016年12月)は、AJACSadvanced講習会や共同研究関係で、次世代シークエンサーから得られたデータを自ら直接解析することに関わる事が多く。1サンプルあたり数Gb-数十Gbの大きな配列データを直接データ解析する際に強く思ったこと。 解析環境がきちんとしていれば、UNIX経験者でなくたってちゃんと出来るという動かぬ事実。多くの困難は、それを実行する環境(メモリとストレージのケースが多い)に起因している。ある程度良い解析環境があれば、多くの人が漠然と持っている「困難」は軽減され、乗り越えられるものなのだ。 次世代シークエンサーDRY解析教本の最初にも書かせてもらったことだが、メモリはケチってはいけない。ストレージはUSB3経由であとから足せるが、こればっかりは後から変更するのは困難である。CPUクロック数は時間を待てば解決できるが、メモリがないのはどうしようもない。「安物買いの銭失い」にならぬように。

Continue reading »


bashのバッチスクリプト

Written by bonohu in misc on 金 23 12月 2016.

ワイルドカードによるファイル指定でそのコマンドに一括で引数で指定できず、数多くのファイルに対して同じ処理を繰り返したい時。もしくはそのファイルの数が数万とか多く、引数指定するには数が多くなりすぎて無理な時。シェルスクリプトでバッチ処理が有効。ファイル一つづつに対して、シーケンシャル(sequential)にバッチ処理したい時にbashのシェルスクリプトで対処する場合には、

1
2
3
4
#!/bin/sh
for f in *.bz2 ; do
     bunzip2 $f  #command to execute here.
done

てな具合にfor f in * ; do ... done定型句を使う。

ただ、この場合、 [shell] bunzip2 *.bz2 [/shell] でも可だが。そうはできないような処理の場合に役立つ場合も。

Continue reading »


バックアップツールとしてのrsync

Written by bonohu in misc on 金 23 12月 2016.

卒論、修論、追い込みの方も多い今日このごろ、バックアップは重要。大事なデータほどきっちりとバックアップを。もちろん、簡便にフォルダのコピーだけでもよいのだが、何回もコピー続けていると何回も同じファイルを重複してコピーすることになって煩雑になるかと。そこで、rsyncコマンド。rsyncを使うと差分コピーが可能に。

その解説は、次世代シークエンサーDRY解析教本p35に。ここでは同一のコンピュータ上でrsyncコマンドでコピーする方法が説明されている。つまり

rsync -av --exclude '/' /Users/bono/Documents/ /Volumes/USBHDD

のようにすると、/Users/bono/Documents以下のファイルとフォルダ(ディレクトリ)を/Volumes/USBHDD以下にコピーすることになる。1回目はフルバックアップなので時間がかかるが、2回目以降は同じファイルはコピーされず、差分のファイルだけがコピーされるため、ファイル転送が高速化される。定期的なミーティング終了後に実行するなど、週1回や月1回など習慣づけて行うことをお勧めする。

実はこのコマンド、ネットワーク越しのコンピュータに対しても実行可能である。受け側のコンピュータにsshでアクセスできるように設定されていればだが、以下のようなコマンドで。

rsync -av -e ssh --exclude '/' /var/www/html …

Continue reading »


Pfamから得たプロファイルHMMでhmmsearch

Written by bonohu in misc on 木 22 12月 2016.

カイコ(Bombyx mori)のEnolaseに関する論文がacceptになりました。研究成果としてすでに公開されている配列情報データベースから候補をドライ解析(in silico)で探し出してきて、それらをウェットベンチで精査し、実際に確認したところに新規性がある研究です。この論文で使用した候補の探し方を紹介します。

まずはhmmerをインストールします。

brew install -v hmmer

で簡単に入ります。

そして、タンパク質ファミリーのデータベースPfamから利用するタンパク質ファミリーを検索します。今回の場合はEnolase_CとEnolase_Nがそれで、どれが利用すべきエントリかを選ぶところで生物学的な知識が発揮されます。Curation & model タブ中のHMM informationにあるdownloadからタンパク質配列のプロファイル(profile HMM)をダウンロード、ダウンロードしたファイルをEnolase_N.hmmと名前を変更し、以下のようにhmmsearchを実行します。

hmmsearch Enolase_N.hmm Bombyx_mori.GCA_000151625.1.30.pep.all.fa

Enolase_C.hmmに関しても同様に実行し、ヒットしてきた=このドメインを含むとみなされる候補のcDNA(or 予測遺伝子 …

Continue reading »


PGXユーザー勉強会#1

Written by bonohu in misc on 火 20 12月 2016.

Oracle Labs PGX(Parallel Graph Analytics) というグラフに対するクエリや分析のためのフレームワークのユーザー勉強会にお誘いいただいたので、参加。かつては専用のプログラムを書いてKEGGの代謝経路の最短経路とかを計算していたものだが、これを使うとそういうのだけでなく、グラフ構造に基づく解析がいろいろとできる模様。やってみたいことが簡単にできそうなので、今後もちょっといじってみたい。

Continue reading »


Trinityの結果をtransdecoderでアミノ酸配列に翻訳する

Written by bonohu in misc on 月 19 12月 2016.

先日のAJACSadvanced講習会で、Trinityで得た結果をアミノ酸配列に翻訳するプログラムをここで言及していないのに気がついたので。Trinityで得られるのは塩基配列レベルの情報で、それをアミノ酸配列に翻訳してくれるのがこのtransdecoder

brew install -v transdecoder でインストールされる。

1
2
3
#!/bin/sh
TransDecoder.LongOrfs -t Trinity.fasta
TransDecoder.Predict -t Trinity.fasta

のように実行する。 実行したディレクトリにTrinity.fasta.transdecoder.pepというファイルができて、それにアミノ酸配列がFASTA形式で記録されている。詳しくはtransdecoderの本家ウェブサイト参照

Continue reading »


遺伝研研究会+DDBJing+AJACSadvanced講習会

Written by bonohu in misc on 土 17 12月 2016.

今回の遺伝研研究会では、初の試みとして講習会を連続開催してみた。つまり、研究会をやる前(1日目午前)と後(2日目午後)に講習会を実施した。それぞれのパートだけの参加者ももちろん居たが、研究会のついでに参加という効果もあったかと。それぞれ独立に企画するよりも準備コストもそれぞれ小さく、相乗効果も見込める。このかたちは今後も続けていくべきだろう。

自分が企画した講習会は、AJACSadvanced三島3と題して、DBCLS主催。中上級向けの内容として

  1. 仮想環境版のpitagora-galaxy

  2. homebrewを使ってMacOSXでTrinity

をやってみた。

今回は、遺伝研での講習会ということでSRA(DRA)からのデータダウンロードにもかなり有利な環境であったものの、トラブルはやはり多く。以前にインストールされていたソフトウェアが新しく入れたソフトウェアの邪魔をしたり、homebrewが入っていても長い間brew update && brew upgradeしておらずそれが原因でみたこともないエラーが出たり、そもそもXcodeが最新でなくて再インストールが必要だったり、空きディスク容量や搭載メモリが足りなかったり。一番致命的なのは最後のポイントで、やはりある程度のデータ解析をするにはコンピュータのスペックとディスク容量がそれなりに要る。

今回の講習会をやってみて、実行すべきコマンドそのものより、そこに至るまでの環境構築に難がある状況を感じた。前者はググればまあ見つかるものの、自分の環境に特異的な状況はなかなか自ら解決しづらいのではないかと。そういった部分を今後ケアできるように講習会の内容を考えたい。

Continue reading »


次世代モデル生物におけるゲノム情報利用ワークショップ

Written by bonohu in misc on 金 16 12月 2016.

遺伝研研究会として「次世代モデル生物におけるゲノム情報利用ワークショップ」を2016年12月15,16日にオーガナイズさせていただいた。「ゲノム情報利用ワークショップ」は、当時かずさDNA研究所にいらっしゃった中村保一さんが中心となって約10数年前ぐらいに行われていたワークショップで、主にバイオインフォマティクスな人がデータ解析手法やその実例などを紹介するのがメインだった。

そして、2016年。DBCLSの一部が遺伝研に来て2年半あまり経ち、これまでDBCLSとDDBJの橋渡し的なテーマで遺伝研研究会を実施してきたが、今年度はかつての「ゲノム情報利用ワークショップ」を復活させようという考えで企画した。対象を、次世代シークエンサーの登場でゲノム情報の恩恵にあずかろうとしている非モデル生物、もとい「次世代モデル生物」にして。 そういった分野で活躍されている方にコンタクトして、それぞれのゲノム情報利用を語ってもらった。10年前よりもずっとBiologyな、そして興味深い発表ばかりで。やっぱりやってよかったなあと。

話していただいた研究者の皆様、お忙しい中にもかかわらず三島くんだりまでご足労頂き、ありがとうございました。

Continue reading »



BH16.12 1日目

Written by bonohu in misc on 月 12 12月 2016.

今日2016年12月12日から、国内版Biohackathon(BH16.12)、山口県湯田温泉にて。「公共遺伝子発現データ目次AOEを使ったデータ解析事例作成」というテーマで取り組む予定。遺伝子発現データ解析で、機能アノテーションを公共DBから引っ張ってくる際にRDF化したソレが便利に使えるはずなので、それが利用できるようにするための流れと実例を作りたい。

それを始めるために統合TVのとあるエントリを見ているとバグを発見したり、AOEのためのデータ作成しようと思ったら(以下同文)。全体としては良くなっている方向と。「すみなすものは心なりけり」ということで。

Continue reading »


'Mishima.syk #9'

Written by bonohu in misc on 土 10 12月 2016.

今回が9回目のMishima.syk(ミシマ・エス・ワイ・ケー、三島創薬勉強会)。今回は仮想環境の上のLinuxでTensorFlow(てんさーふろー、と読むらしい)とkerasのハンズオン講習会。1runで数千万リード出るようなご時世の塩基配列データ解析では直接的に使う部分は思いつかないが、必要になったときに役に立ちそう。やった内容は、githubのmishima-syk/9に上がっている。 時間が余ったので仮想環境つながりでpitagora-galaxyの紹介がてら、来週(2016/12/15-16)の遺伝研研究会の宣伝活動もしたり。新しい参加者も増えて、知的にも人的ネットワーク的にも満足。もっと勉強しなきゃな…。

treeという、置かれているファイルやディレクトリをCUIで可視化する便利なコマンドを教えてもらったのに、忘れていたのを半月後の仕事納めの直前に思い出した。MacだとHomebrewで入れられた。 [shell] brew install -v tree [/shell]

Continue reading »


知のめぐりは果たして良くなったのか?

Written by bonohu in misc on 日 04 12月 2016.

第39回日本分子生物学会年会にて、「いかにして使えるデータベースを維持し続けるか?」というフォーラムをオーガナイズした。本来ワークショップ(今年の場合はシンポジウム)企画として提案したものの、落とされてフォーラムになったわけだが。そんなにDB、重要でないですか、このデータがものをいう研究をされている人たちばかりの学会で?そういえば2年前もワークショップ落とされて、さらにプログラム集にも載せてもらえないというひどい扱いであった。なんか、嫌われているらしい。

参加者は50人ほど。私自身はデータ流通業代表として、「DBの流通業10年目の今ー知のめぐりは果たして良くなったのか?」と題して、統合データベースプロジェクトとして始めてからちょうど10年の今にして思うことをつらつらと。

という具合にこの10年間で日本語のコンテンツは着実に増やしてきた。にもかかわらず、その本務では評価されているとは言い難い現実を語らせていただいた。「評価されていない」というのは競争的資金を取るときなどにやってきたことがプラスになっていないということで、この状況を予言するかのように6年前の2010年トーゴーの日に伊藤啓さんが「ショウジョウバエ脳の神経画像データベースFlybrain: 15年の蓄積と将来への課題」と題したご講演の中で指摘されていたことである。私にしたって、DBCLSとしてやった統合DBの仕事でなく、昆虫やハダカデバネズミでの個人研究で …

Continue reading »


ArrayExpressデータのFTPミラーサイト構築

Written by bonohu in misc on 月 28 11月 2016.

要するに、ArrayExpressのデータをコピった。やった事自体、簡単そうだが、転送量が数十TByteもあると、そう簡単にいかなかった。2016年5月に英国Cambridge郊外のHinxtonにあるEuropean Bioinformatics Institute(EBI)に行って打ち合わせしてきて、8月中頃に正式に自分がやることとなり。結果として、この11月末になんとか形になり、年越さずに済んでよかっただけでなく、週末からの学会年会(分生)に間に合った。

最初は、普通にrsyncでやっていて、そのペースだと2年以上かかることがわかり、絶望に打ちしがれつつも作業を継続した。それを先方に伝え、asperaのサーバーを用意してもらい。その後も何回もやりとりして、なんとか超高速にデータ転送することが可能となった。すると今度はディスク容量が逼迫して、disk full直前で一旦止めて、とか波瀾万丈だった。

DDBJのニュースにまでしていただいたが、言われてみればDDBJとDBCLSの協力関係の賜物。一昔前なら不可能だった。

私にとっては小さな一歩だが、センターにとっては偉大な一歩だ

データベースは維持してナンボのもの。今後の継続的なactionに乞うご期待。

Continue reading »


SPARQLthon50 day2

Written by bonohu in misc on 火 22 11月 2016.

地震で飛び起きたSPARQLthon50の2日目。結局、ArrayExpressのmirrorは終わらず。来月のSPARQLthonへと持ち越し。それ以外のデータ収集手段についてupdateしていただき、より簡単に高速にデータを取得できる目処がついた。

Continue reading »


SPARQLthon50 day1

Written by bonohu in misc on 月 21 11月 2016.

久しぶりの参加。ArrayExpressのmirrorに関しても目処がついて、次期開発に向けてのちょうど良いタイミング。RDFやSPARQLの利用実例として実用的なものに発展させていければいいな。 50回目のキリ番SPARQLthonのためか、参加者が多く、annexの柏での作業スペースでの参加。仲間と議論するのは楽しいが、それだけではなく、使われるシステムとしてどう舵を取っていくかももっと議論していければと思う。

Continue reading »



Aspera ascp

Written by bonohu in misc on 水 16 11月 2016.

普通のftpやrsyncでコピーするとしたら、数ヶ月単位かかるような数十Tbyteのデータを転送する必要があり、先方にAsperaを設定してもらい。ascpというコマンドラインのプログラムをネット上からググって探してダウンロードインストールして、以下のようなコマンドで実行。 [shell] ascp -p -k 1 -QT -l 1G --overwrite=diff+older hoge@xxxx:hoged/ . [/shell] タイムスタンプ保持の-pオプションと上書きルールのオプション(--overwrite=diff+older)は今回のタスク的に大事だった。

Continue reading »


第14回がんとハイポキシア研究会2日目

Written by bonohu in misc on 土 05 11月 2016.

今年(2016年)の3月に急逝したLorenz Poellinger氏の追悼シンポジウム(Professor Lorenz Poellinger Memorial Symposium)で縁の深かった方々によるプレゼンテーションは、泣きそうになる一方、彼らの研究の遍歴がうかがい知れて勉強になった。

またそれに続いて行われた、普段からお世話になっている関西医大の広田さんによる「2016年アルバート・ラスカー基礎医学賞を記念してOxygen, Hypoxia and Beyond」というプレゼンテーションはこの業界の歴史がよくわかって、知らなかった知識が補完されていって大変勉強になった。しかもそのプレゼンのスライドはfigshareで共有していただいているという…。オープンにしていただいて、ありがとうございます。

Hirota, Kiichi (2016): Oxygen, Hypoxia and Beyond. figshare. https://dx.doi.org/10.6084/m9.figshare.4142166.v1 Retrieved: 11 20, Nov 05, 2016 (GMT)

Continue reading »


第14回がんとハイポキシア研究会1日目

Written by bonohu in misc on 金 04 11月 2016.

去年は三島でお世話させていただいた、がんとハイポキシア研究会。今年は岐阜で。実は、2年続けての東海地方開催。今年は運営に関わる部分がない分、しっかりと勉強させていただこうと。

会場のホテルは、なんと岐阜城を長良川越しに南に臨む素晴らしい立地。しかも、温泉。さらに、酸素の研究会にはもってこいの、鉄分が多い泉質という最高のお膳立て。

自分のポスタープレゼンテーションであるが、来ていただいた人たちと話してみて、これまでに増してメタ解析の需要があるらしいことを感じた。この研究会でこれまで共同研究ベースでシェアしてきたデータを論文化して、外に出すことを決心した。ついに機が熟したようだ…。

時は今 雨が下しる 五月哉

Continue reading »


遺伝研研究会「次世代モデル生物におけるゲノム情報利用ワークショップ」

Written by bonohu in misc on 水 02 11月 2016.

今年度(2016年度)採択していただいた国立遺伝学研究所研究会「次世代モデル生物におけるゲノム情報利用ワークショップ」を2016年12月15,16日に開催します。非モデル生物と呼ばれてきた、次世代モデル生物を使った研究でゲノム情報を利用している、もしくはそれに役立つ研究をされている方々を呼んで、ゲノム情報を始めとした生命科学分野のデータベースを利活用した研究を盛り上げ、支援しようという会にしたいと目論んでいます。

アナウンスには明示的に書いていませんが、11年前にかずさDNA研究所で開催されました、ゲノム情報ワークショップ2005ー実戦系バイオインフォマティクス@かずさ、の現代版になっております。実は11年前にも、2日目の午後には講習会があったのですが、今回は1日目の午前と2日目の午後の両方に講習会を配置し、さまざまなリテラシレベルに対応する体制で臨んでおります。それらの講習会とは、以下のとおり。

とくに、NIG SuperComputerの利用方法って、これまで講習はなかったかと思います。それぞれ参加登録を忘れずに、奮ってご参加ください。

Continue reading »


'Update of the FANTOM web resource: high resolution transcriptome of diverse

Written by bonohu in misc on 土 29 10月 2016.

cell types in mammals' wordpress_id: 2863 categories:


READFANTOMDB論文以来、なんと15年ぶりにNucleic Acids Research (NAR) Database issueに名前が入った標記の論文が掲載。

Nucl. Acids Res. (2016) doi: 10.1093/nar/gkw995 First published online: October 27, 2016

Advance accessなのでページ数は付いてないが、DOIのcitationは変わらないので、こちらで是非。 「データベースセンター」に約10年勤務していてどういうことだとお叱りを受けるかもしれません。言い訳しておきますと、日本の中のDBを使った「知のめぐり」の向上を目標として活動しており、DBの利用普及活動や日本語のコンテンツを増やすのがメインで、英語の論文出版は二の次でした。また、ここのところはNARにはWeb server issueでの論文でお世話になることが続いており(2008年のgendoo2012年のGGRNA …

Continue reading »


Japan Spotfire User Group Meeting 2016

Written by bonohu in misc on 金 28 10月 2016.

去年は参加できなかったJASPUGMだが、今年は参加。今回はとくに発表とかなく。実質アカデミックフリーになって、公式にユーザーに返り咲いてからは初めてのユーザーミーティングだった。しかしながら、そこに居る必要は、もはやない印象を今までになく受けた。いつまでも惰性で参加していてはいけない。そう感じた。製薬業界の人たちの意見交流の場として、ますます発展していって欲しい。

Continue reading »


'第2回 SPARC Japan セミナー2016「研究データオープン化推進に向けて : インセンティブとデータマネジメント」'

Written by bonohu in misc on 水 26 10月 2016.

今週はオープンアクセスウィーク。ということで、連動企画として、2016年のSPARC Japanセミナー2回目はこのタイミングで。

今回もセミナー担当のワーキングメンバーとしてなかのひと。前回は自分自身が話したが、今回はtsudaり係ということで、ひたすらtwitter。ただし、研究会のアカウントで。ハッシュタグ#sparcjp201602でそれが見れるが、有志の方がtogetterにまとめてくれました。ありがとうございました。

Continue reading »


第1回オモロイ生き物研究会

Written by bonohu in misc on 日 23 10月 2016.

札幌の定山渓にて、10/22-23の一泊二日で。研究会のお題目の通り、オモロイ生き物でさまざまな生命現象を解明しようと取り組んでいる人たちの集まりで、かなりハイレベルな議論が。 ライフワークとなりつつある遺伝子機能アノテーションの話をして、これまでモデルとされておらずDBリソースが不足している生物種ならではの話をした。研究会の最後の方だったため、それを踏まえた議論があまりできなかった印象。今後の共同研究につながるといいな。

Continue reading »


ファイルの捜し物

Written by bonohu in misc on 日 16 10月 2016.

MacOSXだとSpotlight検索が中身まで検索対象になっていて便利だが、ファイル名でのみ検索したいときがある。しかもコマンドラインで。そういう時に使っているのがlocateコマンド。 [shell] locate hoge [/shell] でhogeを(絶対)ファイルパスに含むファイルをリストしてくれる。 それでも見つからないときはfindコマンド。 [shell] find . -name index.html -print [/shell] とかやるとindex.htmlというファイルをcurrent directory以下から探してくれる。 [shell] cd / find . -name 'hoge*' -print [/shell] とするとroot directoryに移動してから、hogeからはじまるファイルがリストされる、という具合に。

Continue reading »


第75回日本癌学会学術総会@横浜

Written by bonohu in misc on 土 08 10月 2016.

今年はトーゴーの日シンポジウム(10/5-6)と1日被り、大会2日目からの参加。企業展示ならびにポスター会場がスカスカでびっくりする。別の学会と被ったから、らしいが。clinical sequenceに移行していくなか、ますますアウェー感が増した印象。公共DBの再利用よりも自分のところで出した大量のデータをいかに解析するか、そっちの方が喫緊の課題であるような。その一方で大型機器は予算の制約で買えず、某社のデータ解析サービスが赤字に耐えかねて有償化という状況。果たしてどうなっていくのやら。

Continue reading »


トーゴーの日シンポジウム2016

Written by bonohu in misc on 水 05 10月 2016.

今年も、10月5日ということで、「トーゴーの日」シンポジウム。今では、この1年の進捗を発表する機会となっているが、統合データベースプロジェクトが始まって早10年。論文で測ることのできない成果が出てきているとは思うが、データの大量化に伴う個人持ちのデータの解析に悩む人はむしろ増えているのではないかと。そこを改善する解決策を提案していければよいのだが。

Continue reading »


XXV International Congress of Entomology (ICE2016) 参加

Written by bonohu in misc on 土 01 10月 2016.

Entomology(昆虫学)の国際学会に参加。初参加でアウェーの学会だったが、来てみると全く問題なかった。自分は、いわば系統樹を書くときのアウトグループのような存在かと思っていたが、わりとそうでもなく。

種が多い昆虫ならではなのだろうか、比較生物学がごく当たり前に行われていて、また研究の分業化がされていてRNA-seq解析などもごく普通にやられているのも本邦との温度差を感じた。やはり身近にそういうデータ解析ができて相談(もしくは共同研究)できる人がいるようにならないと。

Keynote lectureが事情により録画で流されたり、学会に来れなかった人がskypeで遠隔からプレゼンしたり、新しいタイプの発表にも衝撃を受けた。学生のプレゼンでもちゃんとgrantを明らかにしているのは、当たり前だがきっちりしている。こういうところは見倣わねば。

周りの人に自分が何者かを話していると、専門がバイオインフォマティクスの遺伝研に居るが遺伝研所属じゃないデータベース流通業という、自分の中で少々曖昧になっていた自分の立ち位置を再認識できた良い機会となった。良い刺激を受けることができたのではないかと。

Continue reading »


日本生物工学会誌連載1回目「ウェブ上に散在する情報を生命科学研究にどう役立てるか」掲載

Written by bonohu in misc on 日 25 9月 2016.

日本生物工学会誌に「バイオインフォマティクスを使い尽くす秘訣教えます!」という連載が開始。2ヶ月に1回、全7回の予定。2016年1月に鹿児島大学医学部で行われた統合データベース講習会: AJACS薩摩でその会誌の編集委員の方が受講されていて、講習の合間に話したのがきっかけとなって連載する話に。引き受けたのは、掲載後すぐネット上で公開され、会員でなくても誰でも読める、というところが決め手だった。その後、先方が遺伝研にいらした際に詳細を話し合って連載の構成を決め、第1回は私による「ウェブ上に散在する情報を生命科学研究にどう役立てるか」ということで。シリーズの今後の内容に乞うご期待。

Continue reading »


1 month past rsyncing ArrayExpress data

Written by bonohu in misc on 月 12 9月 2016.

ArrayExpressのdataをrsync開始してから今日でちょうど一ヶ月。前回と変わらず、experimentディレクトリのミラーが終わらない。データ転送量的には、合計1.5Tbyteほど。もう1thread増やしてやっているものの。約44Tbyteと書かれている全体のデータを信じれば、あと2年半。対策を考えねば。

Continue reading »


考えていることの体系化に向けて

Written by bonohu in misc on 日 11 9月 2016.

いろいろ書き散らす。2016年の計として元旦に誓ったことでもあるし。まさかこういう形で転ぶとは思っていなかったが。このやり方のほうが怠惰な自分が奮起してやり遂げるのではないかと。もちろん、本務優先ではあるが、長い目で見るとこれこそがやるべきことになるのかもしれないね。

Continue reading »


Trailblazer

Written by bonohu in misc on 土 10 9月 2016.

昨日のセミナーで知った言葉だが、どうも気にかかると思ったら、やはり自分たちが果たしてきた役割をいう言葉だった。折しもそのセミナー中に、この夏にずっと待っていた研究費の結果がやってきて、次のTrailbalzerを果たすべきターゲットがまた1つ増えた。個人的には、比較的大きな山だった昨日のセミナーが終わり、達成感とともに空虚感に見舞われていたところで、ちょうどいい。次なるTrailblazerとして頑張っていこう。

Continue reading »


第1回 SPARC Japan セミナー2016「オープンアクセスへの道」

Written by bonohu in misc on 金 09 9月 2016.

前にも書いたとおり、今年度(2016年度)から国際学術情報流通基盤整備事業(SPARC Japan)のセミナー企画ワーキンググループのメンバーとして、セミナー企画に携わっている。2016年度には3回セミナーを開催することを企画しているのだが、自分はそのうちの2つを担当する、ということで第1回 SPARC Japan セミナー2016「オープンアクセスへの道」が2016年9月9日に一ツ橋の国立情報学研究所にて開催。

ということで、演者の選定から関わった。生命科学研究者の立場からOpen Access(OA)に関して話してくれる人を探せばよかったのだが、演者決定まで時間もなく、そして何よりも話してくれそうな人が思い浮かばず、結局自分で話しをすることに。実は自分も適任者の一人だったのかもとスライドを作っていて思ったり。

参加申し込みがはじまってから1週間経たないうちに満席になるなど、今回のセミナーのテーマは現在関心の高いものだったらしく。多数の方が話を聴きたいのに会場の都合で入れないという事態になり、YouTube liveで動画配信されることに。セミナー企画メンバーの担当者がtwitterでもつぶやく、という情報発信を行ったので、ハッシュタグ(#SPARCJP201601)をみてもらうと感じがわかるのではないかと。とりいそぎ、自分の発表スライドはfigshareにアップしておいた。

Bono, Hidemasa (2016): 生命科学分野における研究者の投稿先雑誌選択趣向とOAへの意味づけ. figshare.
https://dx.doi.org …

Continue reading »


3 weeks past rsyncing ArrayExpress data

Written by bonohu in misc on 金 02 9月 2016.

ArrayExpressのdataをrsync開始してから3週間。だが、experimentディレクトリのミラーが終わらない。データ転送量的には、合計0.9Tbyteほどで、約44Tbyteと書かれている全体のデータからするとやはりまだまだ。thread数を増やしてみましたが、果たして。

Continue reading »


遺伝研研究会「次世代モデル生物におけるゲノム情報利用ワークショップ」やります

Written by bonohu in misc on 水 31 8月 2016.

今年度、申請して遺伝研研究会としての開催が決まっている「次世代モデル生物におけるゲノム情報利用ワークショップ」。それを2016年12月15-16日に遺伝研宿泊施設の会議室で開かせていただくことに決めました。ちょうど同じ日程で企画されているSPARQLthonの裏になりますが。よろしくお願いします。

Continue reading »


Trinityがコケる

Written by bonohu in misc on 月 29 8月 2016.

single end readsのTrinityの実行がこけて、hoge.fq.readcountファイルに以下のような記述が。

Error, cannot convert fastq file to fasta since cannot recognize read orientation as /1 or /2 (instead: F)

このエラーメッセージでググると同じ目にあった人のQAが。どうも、FASTQファイルのヘッダに問題があるようで、それを書き換えてしまえば問題ない模様。このQAにはこの書き換えスクリプトまで書かれていた。 [shell] awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' hoge.fq | awk '{if(NR%4 …

Continue reading »


NBDCヒトデータベースとJGAに感謝

Written by bonohu in misc on 金 26 8月 2016.

かつて関わった厚生労働科学研究費補助金(2009年度〜2011年度)による高齢者のがん研究のデータがNBDCヒトデータベースより公開されたと連絡をいただく。当初は生命科学系データベースアーカイブに、と提案したのが2年前。その後、一緒にやってきた担当者が亡くなるなど紆余曲折あったものの、データ公開の日を迎えて感無量です。

ヒトデータということで、データベースアーカイブに収めるのではなく、NBDCヒトデータベースでの制限公開という形になった。それでもメタデータはいつでも誰にでも見え、公共データベースの登録番号も付いた(hum0064)。NGSデータでなく、前世代な配列解析やマイクロアレイデータが主体のデータだったが、JGA(Japanese Genotype-phenotype Archive)にもきっちり入った模様(JGAS00000000061)。

データ公開を独自にするのではなく、NBDCヒトデータベースというしっかりした仕組みを使うことが出来て、本当助かった。何かあったら連絡下さい、と先方の引き継いだ担当者に言っておいたが、結局私は一度も手を下すことなく、データを持っている先方とNBDCとのやりとりだけでデータのアーカイブが実現された。こんなところでも、統合DBの取り組みのご利益が出てきている。関係者の皆様、ありがとうございました。

Continue reading »


trim_galoreでトリミングとQC

Written by bonohu in misc on 火 23 8月 2016.

トリミングしたうえでfastqcをかけてくれるソフトがこのtrim_galore。CutadaptとFastQCがすでにインストールされていることが必須(以下の使い方だと)。 singleの場合

[shell] trim_galore --fastqc --trim1 hoge.fq [/shell]

ペアエンドの場合

[shell] trim_galore --fastqc --trim1 --paired hoge_1.fq hoge_2.fq [/shell]

Continue reading »


1 week past rsyncing ArrayExpress data

Written by bonohu in misc on 金 19 8月 2016.

ArrayExpressのdataをrsync開始してから1週間。atlasディレクトリは終わったものの、残りの2つ、arrayとexperimentは終わらない。データ転送量的には、合計0.4Tbyteほどで、約44Tbyteと書かれている全体のデータからすると1/100ほど。ただ、全部ミラーしたらこの容量になるのかどうかも今のところわからず。続行する。

Continue reading »


Say good bye to our deer twitterer

Written by bonohu in misc on 日 14 8月 2016.

初めての山の日(8/11)、急逝した研究者仲間のtwittererの初盆に名古屋へ。同じ分野の研究者というわけでもなく、オフラインには学会オフ会に近くだからというので集まったぐらいの仲だが、twitter上では日常を見られている人たち。それも今は「研究者仲間」と呼んでいいのではないかな、と自己紹介する際に思った。

一緒に行った、やはり研究者仲間が終わってから曰く、

[楽しくなってよかった、と言い切りましょう。彼もまた楽しんでくれているだろう。これでいいのだ。](https://twitter.com/kun32xu/status/763746145390567426)

人はいつ死ぬかわからない。だからこそ、今を楽しくおもしろく生きていきたいね。結局この日は、ここまで遅くなることは無いだろう、と思いつつも取っておいた新幹線終電に。研究者twittererとの話は、本当尽きない。今年はオフ会企画に積極的にcommitしよう。

また、数日後にこんな風にも。

[先日の初盆で、きしめんさんのお父さんから健康に充分気をつけけて、とお言葉を頂きました。話を聞いて少しでも体に異変を感じたら忙しくてもすぐに病院に行く、家族や親戚の大病についてより多く把握して弱点を知っておく、大丈夫やろ的自己判断しない、などが大切だと思いました。生きましょうね。](https://twitter.com/kun32xu/status/764456136892293123)

個人的にはポケモンの聖地 …

Continue reading »


inodeの枯渇

Written by bonohu in misc on 土 13 8月 2016.

ストレージの容量は多くの場合ファイルサイズで問題になることが多いが、たくさんファイルを作るようなプログラムやデータベースを扱っているとファイルのinode数が問題になることがまれにある。その場合には、 [shell] df -i [/shell] とやってinode数をチェックする。普通 [shell] df -h [/shell] などでストレージの容量をチェックするのであるが、それと違うオプション指定でわかる。 もしストレージにまだ容量があるのに、ファイルシステムに新たにファイルが作れなくなっている場合、ひょっとしたらこれが原因かもしれません。

Continue reading »



「新米探偵、データ分析に挑む」を読んで

Written by bonohu in misc on 水 10 8月 2016.

[amazon template=thumbnail&asin=4797382309]

新米探偵本、ようやく通読。出てきたことが一度だけでなく、俵太のまとめと天羽社長の統計学指南で波状に複数回出てきて、大変わかり易い。コードの解説もまとめられてて、復習に便利。データがあらかじめダウンロード可能なようになっていて、再現も簡単だった。Rを使った統計解析入門本としてよいかと。

Continue reading »


TIBCO Spotfire アカデミックフリー化

Written by bonohu in misc on 火 09 8月 2016.

先日の沼津でのワークショップで伺った、嬉しいニュース。

アカデミアの方々などに無料でご利用頂けるようになりました。 TIBCO started free of charge Spotfire License. http://spotfire.tibco.com/better-world-donation-program/

本当かと思って、上記URLで出てくるフォームを埋めて送っていたが、返事なく。送ってから2週間以上経ち、さすがに忘れられたかと思い、もう一度送ってみると今度は一晩で返って来た。 「普通にtrialを申し込んで下さい、そしたら1年間にその期間を伸ばします」とのこと。 これでtrialで使うのではなく、正規にライセンスがいただけるように。 いきなりここから登録しなくても、まずは試してみてはいかがかと。ただMac版はないので、Parallels Desktop内で。なんといっても可視化が素晴らしい。

Continue reading »


bam2wig

Written by bonohu in misc on 木 28 7月 2016.

bam形式なリファレンスゲノムへのアラインメントの情報をwig形式のcoverageファイルへ変換。 実は昔もやったことがあり、ググって出てくるawkのワインライナーでなんとか凌いでいたが、今ネット検索するとbam2wigというコマンド化されたPerlスクリプトをgithubに発見。今回はこれを使ってみた。

[shell] git clone https://github.com/MikeAxtell/bam2wig [/shell]

でgithubからダウンロードしてきて、

[shell] ./bam2wig/bam2wig hoge.bam [/shell]

でhoge_bam2wigというディレクトリが作成され、その中にhoge.wigというファイル名でwigファイルが作成される模様。 ただ、何もオプションを付けないとゲノム全体を対象に計算がなされるので、時間がそれなりにかかる。そこで、限定した領域だけ計算する場合には-cオプションをつかって

[shell] ./bam2wig/bam2wig -c chr1:1-10000 hoge.bam [/shell]

のように実行すればよい模様。

コードを見る限り、前にもこのブログでも言及したsamtoolsがインストールされ、コマンドサーチパスにないと動かない模様。

wigに変換したデータはUCSC Genome BrowserやEnsembl Genome …

Continue reading »


'jPOST Workshop 2016 : プロテオームデータと生命科学データベース'

Written by bonohu in misc on 水 27 7月 2016.

東京白金台の北里大学薬学部にて、「ゲノムと遺伝子発現DBの現状ートランスオミクスのための基礎知識」というタイトルで、30分ほど話した。ワークショップの前座。

そのうち統合TVにアップされると思うが、とりいそぎfigshareからプレゼンを公開

Bono, Hidemasa (2016): ゲノムと遺伝子発現DBの現状ートランスオミクスのための基礎知識. figshare. https://dx.doi.org/10.6084/m9.figshare.3506273.v1 Retrieved: 06 47, Aug 01, 2016 (GMT)

Continue reading »