Category: misc

代謝ナビゲーション

Written by bonohu in misc on 月 09 10月 2017.

Dr.Bonoの生命科学データ解析と同じ出版社(メディカル・サイエンス・インターナショナル)から同時に出版された本の一つがこの代謝ナビゲーション

日本生化学会の代謝マップを元にKEGGのデータを作成するお手伝いをしていた私には要らないでしょうと言われたが、まったくそんなことはない。それをデータベース化していた90年代からの研究の進捗が加味された教科書は、さらに深く代謝を知る上で大変参考になる。例を挙げると、低酸素誘導因子(HIF)による代謝の調節がそれである。第10章「シグナル伝達と代謝」のp176辺りに「酸素とグルコースによる転写ネットワークの調節」の節で、2000年前後から解明が進んだこの分野の知見が綺麗にまとめられている。

より深く知りたい人のための文献として第3章「解糖系」ではKEGGのGlycolysis/gluconeogenesisのURLが紹介されているのは、感慨深いものがある。URLもこの種の教科書の重要なリファレンスとしてリストされるようになったのだ。

Continue reading »


第2回RDF講習会

Written by bonohu in misc on 金 06 10月 2017.

10月6日はトーロクの日。データを登録し、他の人に使ってもらう機会を増し、データの再利用性を高める機会にすると良い、ということでこの日にDDBJing講習会を(トーゴーの日と連続で)開催することを提案しているのだが、未だ実現せず。

その代わり(?)に、今年は第2回RDF講習会が開催。去年第1回が開催されて好評だったからか、今年も市ヶ谷のJSTにて。去年は日本癌学会学術総会と被っており参加できなかったので、今年初めての参加。参加者は30名ほどで、BioHackathon2017もあってアナウンス期間が短かかった割には多数集まった感じとのこと。

普段月一回のSPARQLthonで進捗を聞いていはいるものの、まとめて通して学び直すのは非常によい知識の整理になることを実感。いろいろと情報が抜けていたり、なぜそれをしているのかなどを知る、とても良い機会であった。もちろん、近日公開予定のtogoDBの新バージョンを使っての話などアップデートも盛り沢山。今回の講習会もすべて録画されていて、後日統合TVから配信される予定なので、参加できなかった方は是非。

Continue reading »


トーゴーの日シンポジウム2017

Written by bonohu in misc on 木 05 10月 2017.

今年も巡ってきた10月5日。ということで、「トーゴーの日」シンポジウム。今年も東京大学弥生講堂にて2日間に渡って開催されたが、ポスター発表数が多く半分は別の建物での発表となった。しかし、会場はとても盛り上がっていた。

副題が「バイオデータベース『作る』から『使う』へ」にあるように、実際にどう使ったかを前面に出してきたが、結果としてはやはり「作る」方がメインの発表が多かったかと。もちろん、データベースを全く使わない研究なんて今やほとんどないだろうから、そういう方々がどんどん発表するようになったら、今年80だったポスター発表もそれよりももっと多くなって運営が大変になるだろうけど。

データベースを作る人たちもせっかくやっているのだから、その対象コンテンツの生物学的なおもしろさも聴衆に語れるようになって欲しい、というのは高望みしすぎだろうか?

Continue reading »


第76回日本癌学会学術総会3日目

Written by bonohu in misc on 土 30 9月 2017.

学会は、視野を広げて話を聞く良い機会であることを昨晩実感したので、それを更に実践。興味はあるものの、普段は聞きに行かないようなシンポジウム系をせめてみるなど。自分の不勉強が明らかになり、大変勉強になった。自分にとって、勉強させてもらいに来る場である、ということで、また来たい。来年は大阪らしいし。

Continue reading »


第76回日本癌学会学術総会2日目

Written by bonohu in misc on 金 29 9月 2017.

癌学会2日目は自分のポスター発表。デバネタで発表するのは今回が初めてだが、あくまでもDB再利用研究の実例として。張り付き義務時間になってポスターの前に行ったらすでに人が来てて、その人達にひたすらやったことを説明していたら気がついたら制限時間一杯。盛りだくさんだし、しょうがないかな。なお、発表したポスターは以下のような発表カテゴリーで。「その他」ではなく。時代は変わった。 Practical use of databases 今年も、新たなる知り合いを増やすべく、とある飲み会に混ぜてもらう。初対面なのに共通の話題があるのはこの世界狭いというか、恐ろしいというか…。非常に楽しませてもらった。

Continue reading »


第76回日本癌学会学術総会1日目

Written by bonohu in misc on 木 28 9月 2017.

2017年9月28日からの3日間、パシフィコ横浜で開催された第76回日本癌学会学術総会に参加。今回のハイライトは、1年前からこの学会に照準を合わせて取り組んできたBono本の出版。

なんとか間に合ってよかった。

Continue reading »


ArrayExpressのmirror復活

Written by bonohu in misc on 火 26 9月 2017.

ArrayExpressがaspera経由でのmirrorできなくなっていた件。-Pでポート番号を指定するだけで復活。セキュリティのため、default以外のポート番号になった?

Continue reading »


BioHackathon2017 最終日

Written by bonohu in misc on 土 16 9月 2017.

最終日は論文thonということで、今回取り組んだことをまとめて、BioHackathon2017論文のコンテンツをみんなでそれぞれに。参加者の皆さん、一週間おつかれさまでした。

Continue reading »


BioHackathon2017 day4

Written by bonohu in misc on 木 14 9月 2017.

4日目は、温泉インフォマティクス研究会はやはり朝夕の2回開催。修学旅行生が入るという情報もあって夕方早めに。

Continue reading »


BioHackathon2017 day3

Written by bonohu in misc on 水 13 9月 2017.

翌朝になっても計算終わらず。その周りでごちゃごちゃと。 お昼周りを散歩するも、食事できるところは、かつてあったようだが…という状況。結局ホテルのレストランでランチ。 夕方に中間発表1分間で。夜にBanquet。 温泉インフォマティクス研究会は朝と夜の2回開催。

Continue reading »



BioHackathon2017 day1

Written by bonohu in misc on 月 11 9月 2017.

2日に渡るシンポジウムが終わり、ハッカソン開始。 SPARQLthonの時にやってきていたDBCLS SRAとAOEまわりで仕事を進める予定。その前に、まずは温泉インフォマティクス研究会。1日目は、夜に1回の開催。

Continue reading »


BioHackathon2017 symposium

Written by bonohu in misc on 日 10 9月 2017.

今年で10回目のBioHackathon。10回目記念ということもあって、いつもならシンポジウムは1日のところ、今年は2日間でしかも東京開催FAIR Principles (FAIR原則: Findable, Accessible, Interoperable, and Re-usable)で有名なMark Wilkinsonさん曰く、

[The final version of FAIR Principles were crafted by participants of #BioHack15 , led by @micheldumontier. Biohackathons are important!](https://twitter.com/markmoby/status/906494736638164992)

とのことで、BioHackathonでFAIRのそれは醸成されたとのこと。世界に誇る集まりになっているんですよ。東京は市ヶ谷のサイエンスプラザ(JST)でシンポジウムがあったのだから、より多くの人が聞きにくればもっともっと盛り上がったのになあ。もったいない。

一応、自分も以下のようなLightning talkを。

Bono …

Continue reading »



SPARQLthon59 day1

Written by bonohu in misc on 水 30 8月 2017.

今回は理研和光にてSPARQLthon開催。諸事情により、今回は今日だけの参加。 サンプル方向の検索実装はBioHackathonで頑張ることを確認。 今回はArrayExpressのデータ更新をしこめなかったため、インデックス更新できず…。来週頭から仕掛ける予定。DORの進捗を聞いていよいよやらねばという思いの一方、GEODなエントリがあれから増えていないのはちょっと心配であるが。

Continue reading »


RefEx論文

Written by bonohu in misc on 火 29 8月 2017.

NBDC/DBCLSの遺伝子発現のデータベースというかウェブツール、RefExの論文が公表された。 これは2006年に文部科学省統合データベースプロジェクトが始まったときにすでにその原型があったサービスで、さまざまな測定手法による遺伝子発現データを並べてみるというコンセプトでデータを統合する、というものであった。2011年頃から我々で引き継いでやってきており、次世代シークエンサーによるRNA-seqデータも蓄積し、そこに加えてFANTOMプロジェクトによるCAGEデータも出てきて、それらも加えて比較できるよう変更を加えてきた。 FANTOM5で出てきたデータをまとめてScientific DataのData descriptorとして利用可能にしようという話があり(そしてさらに、今回のFANTOM5 collection)、そこにRefExも入れてもらい、今回の論文となった。RefExの論文はData descriptorではなく、Articleというカテゴリーではあるものの、Technical Validationをきっちり書くことや、使ったデータすべてをfigshareにアップ(https://doi.org/10.6084/m9.figshare.c.3812815)することなど、Data descriptorの論文と変わらない要素を求められ、受理までかなりの時間がかかり、大変だった。それでもやはり、論文として出版し引用してもらいやすい形にまとめることはこれだけインターネット全盛の時代になった今でも重要だと身にしみて感じた。 関係者の皆様、おつかれさまでした。そして、これからももっと使われて遺伝子発現データベースの新しい方向性を模索していきたいと思います。

Continue reading »


統合データベース講習会AJACS河内

Written by bonohu in misc on 木 24 8月 2017.

2017年8月24日に大阪府枚方市の関西医科大学で統合データベース講習会AJACS河内に講師やTeaching Assistant (TA)として参加。講師としては、「遺伝子発現DBを含む公共オミックスDBの使い方」を担当。1日のみの講習で開始時間も朝早くからで(しかも学長から挨拶いただけるという…)、またこの季節台風の影響などで動けなくなったりするとまずいと考え前日入りしたものの。その前日に落雷で電車がストップして、一部のメンバーが会場までたどり着けないトラブル発生。備えあれば憂いなし。

お決まりの統合TVを知っているかの挙手アンケートで約9割、新着論文レビューは約8.5割。昨年(2016年)秋に一度講演しに来た影響だろうか、非常に高く。自分のパートは、利用するツールをいくつかアップデート(DAVID→metascape)した以外はほぼいつも通りだったが、今回の聴衆は非常に真面目に講習を逐次同じサイトにアクセスしてやっていただいていたようで、他の講習でも発生した一時的なアクセス集中は自分のものでも発生した。とくにAOEをAWS化してからは初めての講習会で、みんなでアクセスしたらつながらなく。今後は講習会で使うときはインスタンスを変更するなど対策をした方がよさそう。

当日参加11名含め57名の参加で、各講義間で出入りも少なく、また学内受講者以外の割合も高く。関心の高さがここでもうかがい知れる結果に。今回講習会を開催するということに対してプレスリリースまで出していただけるなど、先方に全面的な厚い支援をいただいた。今回の開催にあたり、共同研究者でもある関西医科大学の広田喜一先生にはとくにお世話になりました。ありがとうございました …

Continue reading »


木を見て森を見ず

Written by bonohu in misc on 土 19 8月 2017.

生化学若い研究者の会九州支部夏のセミナーの講師に呼ばれたので話しに。5年前に同じく生化学若い研究者の会の夏の学校で話ししたときのものを現時点版にアップデートしてお話しした。その後も、懇談会や意見交流会などをご一緒させていただき、彼らの研究スタイルを垣間見させてもらった。

私からしてみると、彼ら(大学院生)はインターネット上から驚くほど必要な情報を集めて来ており、その情報catch-up能力には舌を巻いた。しかしながら、枝葉末節の事柄にこだわりすぎてる感(例えば既存のツールの比較など)を受けた。検索しても出てこない、自分でコンテンツを作らないといけないところまで来ていることをもっと意識して欲しい。また、「研究の流れ」の中で今どこにいるのか、ともすると迷子になっているのではないかという印象も。言う通りにやってほしいボスの催眠術にハマってない? もちろん、核心に迫る部分はいくら仲間でも話ができないという状況もあろう。自分の研究の流れをよく考え、研究のを通し、学術研究としての推進する方向への射影が大きくなるよう突っ走って欲しいと思った次第。

おもしろいことをやろーぜ。

Continue reading »


xenomeでclassify

Written by bonohu in misc on 月 14 8月 2017.

xenome続き。indexができたので、それを使って分類。 [shell] xenome classify -T 12 -M 48 -P fuga_in_hoge -i fuga_RNAseq1.fq [/shell] FASTQファイルであるが、どうもbz2圧縮のままでは実行できない模様で、展開してから。

Continue reading »


統合データベース講習会AJACSa4つくば

Written by bonohu in misc on 木 10 8月 2017.

これまで、三島の国立遺伝学研究所で開催して来た中上級向けの講習会、統合データベース講習会AJACSadvancedを、初めて外部(つくばの農研機構)でAJACSa4つくばとして開催。中上級向けとはいえ、全く統合DBの活動を紹介しないのもということで午前は講演として作って来たサービスを中心に紹介した。 かつての「使ってもらう」から、「引用してもらう」を強調したつもり。いつものことであるが、あまりreactionはなく、残念。参加者のうち、統合TV知っていた人半分ぐらい、新着論文レビューは3/4ほど。認知度は上がって来ているものの、さらに研究成果発表の際に引用してもらえるよう広めていかねば。 偶然ではあるが、9年半前まだ統合DBの活動を始めて間なしの頃に講演に呼んでくれて、一番初期のころの統合DBの話を聴いてくれた知り合いの研究者も居たり。その時の講演は、今となっては貴重な初期の統合TVコンテンツ。

  1. 【統合TV】 使い倒し系バイオインフォマティクス入門ーその1

  2. 【統合TV】 使い倒し系バイオインフォマティクス入門ーその2

  3. 【統合TV】 使い倒し系バイオインフォマティクス入門ーその3

思えば遠くへ来たもんだ。

Continue reading »


xenomeのindex作成

Written by bonohu in misc on 水 09 8月 2017.

xenome続き。indexの作成だが、以下のように。 [shell] xenome index -v -T 6 -P fuga_in_hoge -H hoge.fa -G fuga.fa [/shell] 最初この実行が終わらず、プログラムが暴走しているのかと思って-Tオプション(thread数)をいじったり、-vオプション(verbose:ログがたくさん出るようになる)を追加したり。その結果、単に実行に時間がかかっているだけ、ということが放置しておいた結果から判明。 6CPU指定で、今回の哺乳類クラスのゲノムサイズの例だと、約15時間半かかったり。macOSでの実行だからだろうか?

Continue reading »


xenomeのインストール

Written by bonohu in misc on 火 08 8月 2017.

xenograft サンプルを分類するツールのxenomeだが、一時期ダウンロードできない状態が続いていたが、githubで復活した模様。 git cloneして、ドキュメントにある通りインストール。 [shell] git clone https://github.com/data61/gossamer cd gossamer mkdir build cd build cmake .. make make test make install [/shell] makeこけたら必要なパッケージが入っていないということなので、ドキュメントにあるパッケージをbrew installする。

Continue reading »


gffread

Written by bonohu in misc on 月 07 8月 2017.

Cufflinksパッケージに入っているコマンドgffreadは、以下のオプションでGFF3形式からGTFに変換してくれる。 [shell] gffread hoge.gff -T -o hoge.gtf [/shell] これまで知らなかったが、便利な局面がありそう、ということで。

Continue reading »


訃報

Written by bonohu in misc on 日 06 8月 2017.

これまた信じられない訃報。直接一緒に働いたことはないものの、間接的にいろいろお世話になってきたこの分野の働き盛りの研究者の方。講習会にも参加いただいたり、我々の活動を評価いただいたり。これからもご活躍していただくべき方であったのは間違いないのに。お悔やみ申し上げます。

Continue reading »


北大出張

Written by bonohu in misc on 木 03 8月 2017.

どちらかというと、こちらが教える立場であったはずだが、自分的にもいろいろ刺激を受けてきた。それを実現する方向に動いていきたい。 なんでもpositiveな自分だが、生命科学DB業界のsustainabilityを訊かれたら楽観視は出来ないとしか答えられない現状。現状をきっちり把握した意識改革が必要。切に。

Continue reading »


SPARQLthon58 day2

Written by bonohu in misc on 金 28 7月 2017.

まず、昨晩飛び込んで来たproofの対処。 ArrayExpressにデータとして明に含まれなくなったINSTRUMENT_MODEL(Sequencerの情報)をSRAのmetadataから抜き出してくる実装をして、githubへpush。コードの整理しなきゃな…。

Continue reading »



MEGA début

Written by bonohu in misc on 水 26 7月 2017.

分子系統樹の描画といえば、これまでJalviewで満足してきた。しかしながら、bootstrap値の計算など系統樹描画に限界を感じ、食わず嫌いはいかんと思い立ち、MEGA (Molecular Evolutionary Genetics Analysis)をいじってみた。 近頃では、大体のソフトウェアはいろいろいじっていると実現できてしまうことが多いのだが、このMEGAは難解だった。そこで、ググって作者の首都大学東京の田村先生による授業用(?)のPDFを見つけてそれに沿って進めてみた。 まずWindows版がメインっぽいことがわかり、version7をParallels Desktop上のWindowsに入れようとするも、MEGA7は64bit版しかなくて動かず。しょうがないので、MEGA6をインストールしてやってみたら、とりあえずできたので、macOS版に戻ってversion7を試した。どうやら最初、自分がやろうとしたデータセットがでかすぎてよろしくなかったらしい。メガって名前なのに…

[caption id="attachment_3893" align="aligncenter" width="406"]MEGA7 MEGA7で描いたhif1aの分子系統樹[/caption]

だが結果として、無根系統樹であるとか、bootstrapを手軽に計算して、などができる手段ができた!あとは、メガなデータを食わせられるか、だが。

Continue reading »


土用の牛の日

Written by bonohu in misc on 火 25 7月 2017.

今年からはこれでいく。土用の牛の日は、牛肉(うし)を食べる。

[caption id="attachment_3888" align="aligncenter" width="640"]土用の牛の日 160gランチステーキ&190g極みがんこコンビ[/caption]

Continue reading »


metadataと格闘

Written by bonohu in misc on 月 24 7月 2017.

オミックスデータ目次となりつつあるAOEでシークエンサー情報の詳細が更新されなくなっている。いろいろ調べた結果、その原因はmetadataの記述の仕方が変わり、ArrayExpress自体にはその情報が記述されなくなったことと判明。 そこで、SRAのメタ情報と格闘。この種の仕事が捗るのは、そのインフラを普段からきっちり整備してくれており、いわば「高速道路」を作ってくれているおかげ。感謝して使わせてもらう。ありがとう!

Continue reading »


統合TV10年

Written by bonohu in misc on 木 20 7月 2017.

統合TVを始めてから10年の月日が経った(「統合TVの歴史」参照)。その間、1,263件の動画を公開した。そのうち、554が講演動画、311が実習の動画。それ以外の約400がスクリーンキャプチャーによるチュートリアル動画ということに。

当初は、チュートリアル動画を作成するために、Research Assistantという形で大学院生アルバイト(大学生も)を大量に雇った。その組織は後に統合牧場と呼ばれていたが、我々の職場が三島に移転するにあたり、事実上解散となった。その後は、cloudfarmとしてテレワークで動画作成してもらっている。

それ以外にも生物アイコンとして独立に作られていた画像コンテンツと、統合牧場活動から生まれたTogo Picture Galleryの画像コンテンツが統合TVのウェブサイトに統合され、「自由に使える画像を探す」からたどり着けるように。

当初狙いとした、ググったら使い方の動画が出てくる、はある程度達成されたように思う。それを維持していくことが今後の課題であることはいうまでもない。はじめは動画作成、そして今は統合TVのEditor in chiefとして活躍しているhono氏の尽力があって可能となったことに間違いはない。この機会に感謝の気持ちを新たにしたい。

Continue reading »


統合TV動画チュートリアルのある論文公開

Written by bonohu in misc on 土 15 7月 2017.

統合TVで使い方チュートリアルを作成し、統合TVから公開したツールf-treeの論文が公開された。

f-treeGC: a questionnaire-based family tree-creation software for genetic counseling and genome cohort studies Tomoharu Tokutomi, Akimune Fukushima, Kayono Yamamoto, Yasushi Bansho, Tsuyoshi Hachiya and Atsushi Shimizu BMC Medical Genetics 20171 8:71 DOI: [10.1186/s12881-017-0433-4](http://doi.org/10.1186/s12881-017-0433-4)

統合TVを今もやっている2人の名前をAcknowledgementにまで入れていただいて大変恐縮。次回があるなら是非、すべての統合TVにDOIが(過去に公開した分も遡って)付くようになった …

Continue reading »


markdownを何で書くか?

Written by bonohu in misc on 金 14 7月 2017.

かなりしばらくぶり(といっても約半年ぶり)に、いくつかの講習会の講師に指名された。そこで、またテキストを作るわけだが、最近の統合データベース講習会AJACSは基本markdownで書いてGitHubにアップする形がデフォルト。これまではkobitoを使ってプレビューで見ながらmarkdownを準備して、最終的にプルリク送ってマージしてもらっていた。しばらく使っていなくてトレンドが変わっているかも、と思って後輩に聞いたところやはり変わっていた。

前から一応インストールはしていたATOMで書いて、その中でmarkdownのプレビューもできるというのだ。それにはプラグインなるものをインストールして…という世界ができているらしい。ググってみると、それらしいqiitaの記事(「Atom をMarkdownエディタとして整備」)確かにもある。

そこでそれに従って、markdown-writerやmarkdown-scroll-syncなどのいくつかのプラグインをインストールして編集環境を作り、実際に使ってみた。うん、確かに以前より快適だ。おかげで、ざっくりとした骨組みはさらっと作成できた。来週以降、本格的に講習テキスト準備モードになる前に訊いておいてよかった。

Continue reading »


異分野のセミナー参加

Written by bonohu in misc on 木 13 7月 2017.

PerkinElmer Japan ヘルスケアITセミナー「病院に於ける医療ビッグデータの活用とその最新事例」に参加。結果として、異分野殴り込み。話題となっているツールは同じなのだが。どストライクじゃない分野のセミナーに出てみるのもいいもんだ。

Continue reading »


ライフサイエンスデータベース統合推進事業 事業報告書

Written by bonohu in misc on 水 12 7月 2017.

標記の報告書が公開され、NBDCの事業推進に関する報告書等に追加された。 それに対する「ライフサイエンスデータベース統合推進事業(平成23年度~平成28年度)事業評価報告書」も同時に公開され、その中で

今後の事業継続にあたって、強化・改善すべき点についての意見 (1) 医科学、医療、創薬の分野に加え、食、環境、バイオマスエネルギー(グリーンバイオ)などの分野におけるデータベース整備も重要

とあった。こちら方向の取り組みも頑張っていきたい。 また、「バイオサイエンスデータベースセンターの今後のあり方について(提言)」も公開されており、今後の参考にしたい。

Continue reading »


静岡新聞のDDBJ連載

Written by bonohu in misc on 火 11 7月 2017.

DDBJ30周年を期に静岡新聞に毎週連載されていた「遺伝子バンク30年」という連載が完結した模様。 大学院生時代に所属していた京都大学化学研究所の研究室の名誉教授がDDBJを始めた大井龍夫先生であった関係上、DDBJに関しては先生から話を伺う機会があり、人一倍知っているつもりであったが、この連載で知ることが多かった。というか、知らないことだらけだった。 特に最終回の高木先生への取材を元にした「適切な整理・活用が課題」は、データベース統合化に取り組んできた経緯がうかがい知れる。一読の価値はあるかと。新聞記事のウェブ版ゆえ、いつまで読めるかわからないので、お早めに。

Continue reading »


IDなきデータ

Written by bonohu in misc on 月 10 7月 2017.

IDがない場合にどう関連づけるか。生命科学系の遺伝子のデータの場合はそれを塩基配列の類似性検索でなんとかなるが、そうでない場合にそれをどうするか。「Ontology使えよ」が真っ先に言いたくなるセリフだが、それを使わないで大量のデータがすでに作られてしまっている場合にどうしたらいいか。 その後もいろいろ議論して、その果てに出てきた言葉は、「わたしので作りました」。

Continue reading »


'Mishima.syk #10'

Written by bonohu in misc on 日 09 7月 2017.

今回は沼津駅北口プラザヴェルデにて開催された Mishima.syk #10 に参加。 まずは、勉強会のページのお昼ガイドにあった沼津駅北口の千楽を攻める。怖いもの見たさで、ポークソテーに挑戦。出てくるまでかなり待たされたものの、値段相応な満足のいく肉が出て来た。ソースの味も素晴らしかった。次回も別メニューで攻めてみたい。 [caption id="attachment_3820" align="aligncenter" width="640"]千楽のポークソテー ポークソテーライス1700円也[/caption] そして、勉強会本体。今回はテーマが決められておらず、それぞれに好きなことを話す形。自分は、最近データ解析をやっている時にふと再発見したBiocondaについて紹介。なぜBiocondaに行き当たったか、その経緯や、Homebrewでは何故ダメなのか、そういうところにみなさん食いつきがよかったと話していて感じた次第。 自分の発表以外にさまざまなことを教えてもらったが、十分に咀嚼しきれていないので、これからじっくり時間をかけて学んでいきたい。 懇親会は南口にできたビアバールにて。最近できたビアバールのようだが、種類も多く、わが故郷の箕面ビールもあって大変ご機嫌。幹事の皆さん、お疲れ様でした。

そして翌日、自分の発表の最後で参加を呼びかけたサテライトミーティング的な温泉インフォマティクス研究会を開催。熱と浸透圧刺激のみならず、富士山も時折見れる開放的な空間でいろいろと議論。あー、楽しかった …

Continue reading »


Biocondaを使ってみた

Written by bonohu in misc on 土 08 7月 2017.

(このエントリは、Mishima.syk #10のライトニングトークのネタです)

Biocondaとは、

Bioconda is a channel for the conda package manager specializing in bioinformatics software.

とのことで、Bioinformaticsソフトウェアに特化したconda package mangerのチャンネル(bioconda.github.io)。Pythonで書かれたツールだけかと思ってスルーしていたのだが、実際はPythonに限らず、なんでもあるところがこれまでしてきた大きな誤解であった。

conda必須なので、入ってなければ、まずMinicondaを入れる。macOSの場合64bitしかないから楽だが。しかしながら、ここでもpythonのバージョン問題再発。2か3か、それが問題だ。とりあえず3で。ダウンロードして落ちてくるのはシェルスクリプトなので、普通に実行。

sh ~/Downloads/Miniconda3-latest-MacOSX-x86_64.sh

ライセンスに同意して、すぐにインストール完了。そして …

Continue reading »


rsem-tbam2gbam

Written by bonohu in misc on 金 07 7月 2017.

RSEMの計算、TPMやFPKMなどしか見ないだろうと思っていたが、やっぱりgenomeに対するアラインメントを見る必要が出てきて。もちろん、--output-genome-bam をつけて再計算すればそれで良いのだが、それはそれでまた時間がかかる。長い計算の時にログを見ていた時に変換するコマンドがあったような…見つけられないので再計算しかけたが、その最中にログを見ていてわかった。rsem-tbam2gbamがまさにそれである! [shell] rsem-tbam2gbam -p 4 ref/hogenome_RSEM_ref hoge.transcript.bam hoge.genome.bam [/shell] 再計算する必要なく、transcript.bamからgenome.bamへと変換できる。RSEMのreferenceを指定する必要があるが。また、threadオプションもあるので、それも指定するとさらに実時間の実行時間は短くなる。 ただ、これで生成されたgenome.bamはIGVで見るには、sortした上index作る必要があるので注意。

Continue reading »


Sashimi plot

Written by bonohu in misc on 木 06 7月 2017.

IGVをいじっていたら、右クリックメニューにSashimi plotなるものを発見。'sashimi plot'でPubmed検索しても1件しかでてこなかったが、'sashimi plots'にすると3件出て来て、その一つ(Quantitative visualization of alternative exon expression from RNA-seq data)によると、

a quantitative visualization of aligned RNA-Seq reads that enables quantitative comparison of exon usage across samples or experimental conditions

ということで有用そう。'sashimi plot'でPMC検索すると125件もヒットして来て、たしかに使われている印象。[caption id="attachment_3801" align="aligncenter" width …

Continue reading »


Good news

Written by bonohu in misc on 火 04 7月 2017.

長年の懸案だったGeneChipのソレとRNA-seqのソレをついにjoinできた。これでさらに精度良く、目的の遺伝子群が抽出できるはず。 また、それ以外にもいい知らせが。2017年後半戦、ますます楽しくなってきた。

Continue reading »


横方向のcat

Written by bonohu in misc on 月 03 7月 2017.

RSEMの結果ファイルからFPKM値で複数のサンプルの結果を抜き出したいとき。current directoryすべての結果ファイルに対してそれをしたい場合、以下のようなシェルスクリプトで。実行する前にFPKMというdirectoryを作成して、そこに処理したファイル群が書き込まれるようにする。

1
2
3
4
5
6
#!/bin/sh
mkdir FPKM
for f in *.genes.results;
 do echo $f > FPKM/$f
 cut -f7 $f >> FPKM/$f
done

RSEMの結果ではFPKM値は左から7番目のカラムに書き込まれているからそれをcut -f7で抜き出すようにする。 これらの結果だけではFPKM値のみで、遺伝子名とかの情報が入らなくなるので、左に来るべきファイルを以下のようなコマンドであらかじめ作っておく。

1
2
#!/bin/sh
cut -f1,2,3,4 hoge.genes.results > FPKM …

Continue reading »


十年一昔

Written by bonohu in misc on 土 01 7月 2017.

本日2017年7月1日で、ついにライフサイエンス統合データベースセンター(DBCLS)に来て丸10年が経った。あの日、まだプレハブの仮住まいだったDBCLSから歩いて本郷三丁目駅に向かい丸ノ内線に乗って東京駅に。まだ絶賛工事中だった東京駅地下の黒塀横丁に現在は同僚となっているN氏を呼び出し、すぐにDBCLSに参加するよう呼びかけたのが昨日のことのように思い出される。

生命科学研究を続ける上で、まずやらねばならないインフラ整備と思って、データベース統合化に関わってやってきたつもり。まずはDBをどう使ったら良いかを伝える手段として、当時ブレイクしそうだったYouTubeも利用した動画チュートリアル統合TVを始め、現在では約1200のコンテンツに。DB利用技術の普及を目的に統合データベース講習会AJACSを全国でやろうということで始めた。現在ではJSTがAJACSを引き継いでくれていて、それと合わせると日本の都道府県の半分以上で講習会をこの10年で実施して来たり。「教育」をやれと言われた文部科学省委託研究開発事業だった当初(2007-2010年度)の使命はある程度は果たせたかなと。

データベース統合化事業としてNBDCができてJST管轄となってからは、DBCLSは統合DBのR&Dとして、とくに自分は大規模データ利用技術開発に注力するように。この10年でものすごい進化を遂げた塩基配列解読手法によるデータのアーカイブ(SRA)の目次とその検索インターフェースづくりは、世界に3つしかない公式にSRAをアーカイブする機関の一つであるDDBJの協力の下、大きなプロジェクトとなりつつある。また遺伝子発現関係のウェブツールも、リファレンス遺伝子発現データ(RefEx)を作ろうという試みがだんだん大きくなって来て、理研FANTOMプロジェクトとの共同研究に発展。そして、遺伝子発現目次(AOE)もオミックスデータ目次に発展していく流れ。SayaMatcherでやっていたことをsuffix arrayで …

Continue reading »


2017年前半戦終了

Written by bonohu in misc on 金 30 6月 2017.

去年のこの日にも書いた振り返りエントリ。 2017年前半を振り返って。出張による外泊は、28泊と昨年前半の43泊より減少。出張を抑制、データ解析や物書きに取り組もうとしている姿勢が数字に出た感。これは、自分のやるべきことを方向付けて実行に移した結果と言えよう。これは、2017年年頭に書いた目標の一つで、出張外泊数を抑えることもその一つであった。 また、もう一つの目標であった、文章を書くことをさらに習慣づけtwitter以外の手段による情報発信は、2017年6月末の時点では地下に潜っているプロジェクトも含めて、順調に進んでいるかと。乞うご期待。

Continue reading »


Differential Expression Analysis using EBSeq

Written by bonohu in misc on 木 29 6月 2017.

RSEMによるRNA-seqの続き。RSEMデータ解析チュートリアルにある発現差解析方法。 rsem-run-ebseqとrsem-control-fdrはmake installしても/usr/local/bin以下にインストールされないので、注意。hoge1とhoge2の2つのサンプルの発現差を解析する場合、以下のように。 [shell] rsem-generate-data-matrix hoge1.genes.results hoge2.genes.results > hogeMat.txt ~/Documents/src/RSEM-1.3.0/rsem-run-ebseq hogeMat.txt 1,1 hogeMat.results ~/Documents/src/RSEM-1.3.0/rsem-control-fdr hogeMat.results 0.05 hogeMat.de.txt [/shell] 自分の環境ではRSEM関係のスクリプトは~/Documents/src/RSEM-1 …

Continue reading »


真夜中のaccept

Written by bonohu in misc on 水 28 6月 2017.

前日に投げてたrevisionへのrevisionが日本時間の夜に。共同研究者に取り急ぎ連絡しておくとすぐに返事が来て、re-resubmitできる状態になったので、思い切ってすぐに。そうしたら、これまた寝る直前に返事が来て、よく読むと基本accept。でもまだ小さな修正を言われて直さないといけないというオチつきだったが。

Continue reading »


参加者リストの集計

Written by bonohu in misc on 火 27 6月 2017.

先日参加した学会の参加者リストが公開されていた。ナンバリングされていたため、最後の行を見る限り255で、255名の参加者がいたらしいことがわかるものの、その内訳は分からない。テキスト版は提供されていないが、幸いこのページをコピー&ペーストすることで情報が取れそうな素直なページの模様。そうして得たファイルをlist.txtとして、自ら集計することにする。 参加者の国は左から5カラム目にありそうということで [shell] cut -f5 list.txt | less [/shell] で眺めて見る。確かに抽出できている。そこで、さらにワード別カウントをしてみる。

1
2
3
4
5
6
7
8
#!/usr/bin/perl
while() {
        my($word) = split;
        $num{$word}++;
}
foreach (sort keys %num) {
        print "$_t$num{$_ …

Continue reading »


研究データ利活用協議会公開シンポジウム ~オープンサイエンスを巡る世界の最新動向~

Written by bonohu in misc on 月 26 6月 2017.

標題のシンポジウムに参加して来た。研究データ利活用協議会(Research Data Utilization Forum(RDUF、読み方不明))とは、わが国における研究データの利活用を推進する活動を行う集まりとのこと。今回NBDC/DDBJセンター長の高木利久先生が話すし、塩基配列DBからデータを再利用して研究している我が身としては関係あるかな、ということで出てみたが、参加してみるとそれ以外にも多面的に関わりがあった。 まずDOI(Digital Object Identifier)。普段、論文の引用だけでなく、最近では統合TVの動画に対しても個別にDOIがつけられてる。そのDOIを割り振ってくれているのが、今回の集まりの事務局のジャパンリンクセンター(Japan Link Center(JaLC; じゃるく、と読むらしい))とのことで。日本でDOIを割り振れるのはここだけとのこと。 また、先週SPARC JAPANのキックオフミーティングでご一緒した人が数多く参加していたり。参加していたというよりは、演者であったり、ディスカッションリーダーだったり、活躍されていた。 最後のグループディスカッションでは、「データレポジトリの企画運営、メタデータ検討」のグループに。もっといろいろ話しを聞きたかったが、時間の制約でそれも叶わず …

Continue reading »


意図しないプリンター出力

Written by bonohu in misc on 土 24 6月 2017.

出張先でプリンターから出力する必要があり、プラインター設定をちゃらっとして出力したものの。A4に打ち出したはずなのに90度回転したレイアウトで打ち出される。レイアウト設定やそれ以外の設定もチェックしてもだめ。その文書がまずいのではと思って他の論文PDFを印刷してみても同様。しかし、他の人はちゃんと打ちだせるようなので、悪いのは自分のコンピューターの設定ということでいろいろ調べた結果。

macOSのプリンター設定画面

このプリンターを追加する設定画面で「プロトコル」にIPP (Internet Printing Protocol)を選んでしまったからで、LPD (Line Printer Daemon) を指定するとうまくいくということが判明。設定重要。

Continue reading »