Category: misc

'今日のワンライナー: Perl -a'

Written by bonohu in misc on 金 22 12月 2017.

今日のワンライナー。普通なら

cut -f1,3 hoge.txt

で済ますところだが、さらなる処理、IDのバージョン情報を取る(s/.d+//)とか必要な場合にPerlで処理したい場合、こんな風に。

perl -anle 'print "@F[0]t@F[2]"' hoge.txt

-aはawkモードの意味らしい。

-Fでフィールドセパレータを変えたりとかもできるらしいが、多くはタブ区切りのこの業界。

Continue reading »


NBRPシンポジウム2017

Written by bonohu in misc on 水 20 12月 2017.

ナショナルバイオリソースプロジェクト(National BioResource Project; NBRP)のシンポジウムに参加。今年度(2017年)から第4期が開始ということであったが、それは5年を1期とするプロジェクトが3回行われ、今年度から4期目が始まったという意味で、つまり16年目。非常に長きに渡って続けられているプロジェクトらしい。30種類の生物というか、生物群に対して支援がなされているとのこと。

統合DBとの接点というか、お互いwin-winになれる部分がないか、と話を聞いたが、その生物学的なコンテンツのおもしろさに魅了された。異なる生物でも同じようなターゲットをやっていることにほくそ笑んだり。今のところは、今のオミックス目次をガッツリ使ってもらえるレベルにまで完成度を上げることが私がやるべきことかなという結論。

Continue reading »


SPARQLthon63

Written by bonohu in misc on 木 14 12月 2017.

BH17.11の続き。NCBI GEOのメタデータをDBCLS SRAのAPIから取得してこれるよう、AOEのコードを追加。そしてそれらをGitHubにアップすべくまとめたり、ドキュメントを充実させたり。短いコードであってもそれらを書き散らすのは楽しい。

Continue reading »


Pythonオープンサイエンスシンポジウム in つくば

Written by bonohu in misc on 火 12 12月 2017.

普段日程が合えば参加しているみんなのPython勉強会(Start Python Club)が、Pythonオープンサイエンスシンポジウムをつくばで開催。これまたちょうど都合がよかったので参加。

いろんな研究分野でPythonを使っている人が増えていることが実感できるとともに、そういった研究分野の一端を知るキッカケに。それがむしろ私にとっては興味深かった。また、そういう方々と知り合いに。もちろん、懇親会まで残って膝を突き合わせて色々話したから、ではあるが。他の分野の方々のお話を聞くことは重要。自分のやっている研究分野(生命科学)がどういう立ち位置にあるのか知ることができて。たまにはそういう機会があるべきだなと。

いろいろとおもしろくなってきた。

Continue reading »


ConBio2017 4日目

Written by bonohu in misc on 土 09 12月 2017.

最終日は、RefExとAOEの口頭発表。今回は@h_ono氏が発表をやってくれた。2年前に同じく神戸で(その時は自分が)口頭発表したときに比べて、disり質問もなく。(今は)公共データを再利用しよう、という流れをここでも感じた。遺伝子発現データの利用事例をもっと作って発表していこう!

そして、ランチの時間帯に行われたJSTのバイオサイエンスデータベースセンター(NBDC)のフォーラムだが…公共データベース利活用がはやりの流れからか超満員となり、嬉しい悲鳴だった。データベースに対する関心は我々の想像を超越していた感。もっと「どう使ったか」伝えられるような、そういう事例を作っていかないと(シツコイようだが…)。

Continue reading »


ConBio2017 3日目

Written by bonohu in misc on 金 08 12月 2017.

この日には夜に癌研究者の集まりに。毎度研究コミュニティーのsmall world感を感じながらも、初めて会った人にも統合TVすごく使っていただいていることをお話いただいて、やってきた良かったなあと。

その一方で、ブース展示するたびに統合TVをまだ知らない研究者に紹介しつづけている現実もあり、そういった層にもっとリーチするにはどうしればいいかを考えるキッカケになったり。物凄く効率の良い手段なんてないんだろうけど。

Continue reading »


ConBio2017 2日目

Written by bonohu in misc on 木 07 12月 2017.

2日目はブース対応をメインのはずだったが、Bono本サイン会があったりして迷惑かけてしまった…。そちらのイベント自体は大成功だったのだが。

この日の夜には「統合データ解析環境 Galaxy を使った再現可能なデータ解析」のフォーラムがあって参加したが、フォーラムとは思えない人の入り(約80名!)で、関心の高さが窺い知れた。ユーザーコミュニティがさらに広がっていくといいな。

Continue reading »


ConBio2017 1日目

Written by bonohu in misc on 水 06 12月 2017.

ConBio2017は初日の午前にいきなり主宰ワークショップ「いかにして『使える』データベースを維持し続けるか?」から開幕。以下のような豪華な演者陣でバイオなデータベースをめぐるさまざまな立場からお話いただいた。

  1. 高木氏 「ライフサイエンス統合データベースプロジェクトから学ぶこと」 20171206ConBio_takagi(PDF)

  2. 粕川氏 「FANTOMプロジェクトおよび一細胞データベースSCPortalenにおけるデータリソース維持管理の取り組み」 https://doi.org/10.6084/m9.figshare.5682850

  3. 林氏 「オープンサイエンス政策とその実践が目指す研究者社会に向けて」 https://doi.org/10.6084/m9.figshare.5691196

  4. 新谷氏 「論文の補足資料を越えて:リポジトリとデータジャーナルによる効果的なデータ共有」 https://doi.org/10.6084/m9.figshare.5687536

  5. 八塚氏 「生命科学におけるオープンデータの理想と現実」 https://doi.org/10.6084/m9.figshare …

Continue reading »


ConBio2017 0日目

Written by bonohu in misc on 火 05 12月 2017.

次の日朝イチで主宰ワークショップだったので、午前にミーティングに出てから午後に移動で、前日入り。それに乗じて途中下車して共同研究打合せ。結果として、ミニハッカソン@グランフロントみたいになり、有意義な打合せができたかと。

それにしてもJR大阪駅は日本各地の料理が食べられるグルメスポットになっていて。変わったな。

Continue reading »


BH17.11

Written by bonohu in misc on 金 01 12月 2017.

2017年の国内版バイオハッカソンは熊本にて、11月26日〜12月1日まで。 AOEのコード群をDBCLS傘下のGitHubに移し、書き散らしていたコードをまとめたり、発現定量値を使ったソレを議論したり。その裏で、共同研究の配列データ解析も進めつつ。 途中の日から会場の隣に岩盤浴のある日帰り温泉施設があることがわかり、温泉インフォマティクス研究会を開催。でも帰ってきたら体重は増加していたというオチ。食欲の秋だった。

Continue reading »


Annotathon2017

Written by bonohu in misc on 木 16 11月 2017.

今回で2回目のアノテーソン。ゲノム配列解読系の人が多かったような。自分の考えていた「アノテーション」とは違う世界に戸惑うものの、アップデートされたデータに対するデータ解析が不十分なことを思い知らされた。それもやらねば。 アノテーションで用いるツールを参加者みんなでリストアップしたのは、大きな成果の一つ。

Continue reading »


kallisto

Written by bonohu in misc on 水 15 11月 2017.

遅ればせながら、kallistoを試す。日本語でブログに書いている人もいる模様だが、最新の情報は英語の本家のドキュメントから

indexはtranscriptのFASTAファイルに対して。つまりtranscriptごとの発現定量がなされるわけである。

time kallisto quant -i index -o results/ -t 12 test1.fq test2.fq 23Mのpair-end readのGRCh38なtranscriptでの定量が

275.06s user 9.22s system 438% cpu 1:04.81 total

つまり約1分。爆速である。

time kallisto quant -i index -o results/ -t 12 -b 100 …

Continue reading »


第15回がんとハイポキシア研究会2日目

Written by bonohu in misc on 土 11 11月 2017.

日が変わってもなお議論。いつにも増してハードな会となった。

自分ですべての「データ」を出すだけでなく、公共データベースにいろいろと利用可能なのだから、それらを活用すればいいのに、と思ったこと多数。まずはそういうのが使えるということを認識して使ってみるというところから。

次回、第16回がんとハイポキシア研究会は2018/11/9-10にホテルグリーンタワー幕張で、とのこと。

Continue reading »



みんなのPython勉強会#30

Written by bonohu in misc on 水 08 11月 2017.

2017年5月以来、半年ぶりに参加。期せずして3冊のPython本の著者の人が話される節目の勉強会30回目で、大変参考になった。その3冊とは、以下の通り。

  1. 「いちばんやさしいPythonの教本」

  2. 「Pythonエンジニア ファーストブック」

  3. 「PythonユーザのためのJupyter[実践]入門」

Bono本とその読書会の宣伝もLTしたものの。反応が鈍くて残念。生ビールを飲みながらの歓談には敵わなかった感。

それでもまたスケジュールが今回のようにうまくあったらまた参加したい。特に次回は、2017年12月12日(火)に「Pythonオープンサイエンスシンポジウム in つくば」ということで、つくばでオープンサイエンスと銘打ってPythonによるデータ解析の話の回として昼間に開催されるので可能なら参加したい。本日(2017年11月9日正午)より募集開始で、参加者多数の場合、抽選になるようだ。

Continue reading »


日付変更線

Written by bonohu in misc on 日 05 11月 2017.

日付変更線を越えてきたため、私にとっての今日の日は物凄く短く、すぐに終わってしまった。11月1日が37時間あった分のツケ。

Continue reading »


Genome Informatics 2017 day4

Written by Hidemasa Bono in misc on 土 04 11月 2017.

Genome Informatics 2017 day4

カードキーがいきなり磁気が飛んで無反応になるやシャワーのお湯がなかなか温かくならない等、いろいろあったが、基本楽しめた。 とくにScientificには大満足。 このConferenceは一番自分に合っていることを再確認。

次回はイギリスで2018/9/17-20、次々回はCSHLで2019/11/6-9の予定とのこと。 できればまた自分で参加したい。

Continue reading »


Genome Informatics 2017 day3

Written by Hidemasa Bono in misc on 金 03 11月 2017.

Genome Informatics 2017 day3

日本は祝日らしいが、こちらはとくに祝日でもないので、普通にセッションが朝から晩まで。

最初だけかと思っていたら、ずっとヒトに関する応用ばっかりで。 ポスター発表にはそれでもまだ植物系のものもあるのだが、ショウジョウバエやC.elegansのそれは皆無。 非モデル生物を主戦場とするようになってそこが気になるようになったのだろうか?

いくつか、新しい解析プログラムに関しても情報を得て、大変満足。 今後出て来るであろう、役立つリソースに関しても。 帰ったら早速試そう。

Continue reading »


Genome Informatics 2017 day2

Written by Hidemasa Bono in misc on 木 02 11月 2017.

Genome Informatics 2017 day2

twitterから得た、参加者らしき人のtweetによれば、229の発表があり、そのうち44が口頭発表で残り185がポスター発表とか。 参加者数は345とか。これもtwitter情報

発表者のLast nameのアルファベット順にポスター番号が振られ、口頭発表も含めて分け隔てなくsimpleにナンバリングされるのは相変わらず。 abstractのページ数がそのまま自分のポスター番号になっている。 上記の通り、総ポスター発表数が多く、会場が2つに別れたばかりか、会期中張りっぱなしでなく1日だけで、今日2日目が自分はポスター発表だった。 今回は多数ポスター発表を聞いてくれる方が来て、論文が出たタイミングの発表だったので、さまざまな質問にも明快に答えられた。 人が途切れたときには他のポスターを見て回る時間も取れて、個人的には満足。

夕方ぐらいまでは大丈夫だったが、結局時差ボケ辛くて早めに寝てしまった。 シエスタ必要だったかもだが、スケジュールが詰まっていて無理。 かつては緩いスケジュールが印象的だったCSHL meetingだったのだが。

Continue reading »


Genome Informatics 2017 day1

Written by Hidemasa Bono in misc on 水 01 11月 2017.

Genome Informatics 2017 day1

2017/11/1-4まで Cold Spring Harbor Laboratory (CSHL) で開かれている Genome Informaticsに参加。 隔年でCSHLとWellcome Genome Campusとで開かれていて、今年は米国で。 実は、第1回目に出ていて口頭発表しているという最古参。 しかしながら、ここ最近はわりと同僚の誰かがこのmeetingに出ていることが多く、自分自身が出るのは調べてみたら、なんと ~~6~~ 7年ぶりということで、かなり久しぶり。 そして、CSHLに来るのも3年ぶり。ガッツリ勉強してきたい。

Continue reading »



SPARC Japan 2017 2nd done

Written by Hidemasa Bono in misc on 月 30 10月 2017.

第2回SPARC Japan セミナー2017「プレプリントとオープンアクセス」無事終了

セミナー企画ワーキンググループメンバーの担当として企画から関わった第2回 SPARC Japan セミナー2017「プレプリントとオープンアクセス」が無事終了した。 企画自体は8月頭ぐらいから開始していたものの、大変申し訳無いことに本業の論文出版とプレスリリースや、なぜかこの季節に来てしまった講演クラスターと9月初旬のバイオハッカソン、そして私事ではあるが9月末のBono本の出版など、いつになく時間が取れず、結果として周りに迷惑をかけてしまった。 とくに一緒に企画に入っていただいた方お二人には本業もお忙しいところ多大なご助力をいただいた。 今後はこういった仕事を引き受ける際にはそういったことが重ならないよう、うまく調整する必要があることを今回学んだ。

今回司会は初めてで、至らないところだらけで運営には迷惑をかけてしまったかもしれない。 個人的には、セミナー自体はプレプリントに関する最新の情報を知ることができ、大変勉強になった。 総合討論は時間を持て余すのではないかと恐れていたが、結果として盛り上がったところで時間となってしまう感じで、とても良かったかと。 そしてなにより、その後の反省会で異分野交流ができたことが一番の成果だったかと。関係者の皆さん、お疲れさまでした。

しつこいようですが。 このSPARCは、こっちのSPARQLとは関係ありません。

Continue reading »


SPARQLthon61

Written by bonohu in misc on 火 24 10月 2017.

台風直撃により、前日入り。いろいろ作業を進めて、それぞれそれなりに進捗があったのだが、SPARQLthonでメインでやるべきAOEまわりはほとんど進まず、無念。今年度の開発の仕様を固める文章化を進めるべし。

Continue reading »


SPARC Japan 2017 2nd

Written by Hidemasa Bono in misc on 月 16 10月 2017.

第2回SPARC Japan セミナー2017「プレプリントとオープンアクセス」

今年も、セミナー企画ワーキンググループに入ってやらせていただいているSPARC Japanの2017年のセミナー2回目が参加募集開始に。いろいろあって遅くなってしまったが、上々の集まり具合のようで。今回も同じ会場ではあるが机も入れて実施することになったため、定員が少なくなり、満員御礼が早くなっている模様。仮にあぶれたとしても動画中継も行われる予定なので、聞いていただくことはできるかと。

今回は昨年から世話係やるようになって初の司会を。うまくやれると良いのだが…。

念のため。このSPARCは、こっちのSPARQLとは関係ありません。

Continue reading »


職場でのGitHubの利用法

Written by bonohu in misc on 土 14 10月 2017.

(このエントリは、Mishima.syk#11のLightning Talkネタ)

職場では、GitHubを日常的に使っている。その実例を紹介する。

  1. 統合データベース講習会AJACSでは講習会資料が基本GitHubで管理している。講師は講習資料をmarkdownで作成し、それを講習会のrepositoryにpull requestを送る。 それを管理者がmerge。講習会配布資料が紙で配られるが、それは整形されたmarkdownのそれをPDFに変換して印刷しているだけで、手間がかからないようになっている。

  2. 最近、data journalのScientific dataに論文の出たRefExは、そこで作成したコードやデータはすべてGitHubのRefExに。データに関しては、公共データアーカイブのfigshareにも。

  3. 現在開発中の公共オミックスデータ目次AOEも。

追伸: Bono本出ました。

追伸その2: 第2回 SPARC Japan セミナー2017 「プレプリントとオープンアクセス」、やります。

Continue reading »


xenomeその後

Written by bonohu in misc on 金 13 10月 2017.

githubに復活したものの、実行が終わらないxenome。他の人も同様な状況らしく。1.0.1に関することとか書かれていたので、ちゃんと見て試そうと思っていたが。そのバージョンでもうまくいかないとのレポートも。もうちょっと待つか…

Continue reading »


研究会ラッシュ

Written by bonohu in misc on 木 12 10月 2017.

気がついたら今年度の後半戦。ちょっとした研究会ラッシュ。これから広報を開始するフェーズの研究会や、旅費の申請が通ってこれから実行に移す、これから企画を申請する、などなど。どれも議論が盛り上がってそれぞれの研究に良い効果を生むといいなぁ。

Continue reading »


代謝ナビゲーション

Written by bonohu in misc on 月 09 10月 2017.

Dr.Bonoの生命科学データ解析と同じ出版社(メディカル・サイエンス・インターナショナル)から同時に出版された本の一つがこの代謝ナビゲーション

日本生化学会の代謝マップを元にKEGGのデータを作成するお手伝いをしていた私には要らないでしょうと言われたが、まったくそんなことはない。それをデータベース化していた90年代からの研究の進捗が加味された教科書は、さらに深く代謝を知る上で大変参考になる。例を挙げると、低酸素誘導因子(HIF)による代謝の調節がそれである。第10章「シグナル伝達と代謝」のp176辺りに「酸素とグルコースによる転写ネットワークの調節」の節で、2000年前後から解明が進んだこの分野の知見が綺麗にまとめられている。

より深く知りたい人のための文献として第3章「解糖系」ではKEGGのGlycolysis/gluconeogenesisのURLが紹介されているのは、感慨深いものがある。URLもこの種の教科書の重要なリファレンスとしてリストされるようになったのだ。

Continue reading »


第2回RDF講習会

Written by bonohu in misc on 金 06 10月 2017.

10月6日はトーロクの日。データを登録し、他の人に使ってもらう機会を増し、データの再利用性を高める機会にすると良い、ということでこの日にDDBJing講習会を(トーゴーの日と連続で)開催することを提案しているのだが、未だ実現せず。

その代わり(?)に、今年は第2回RDF講習会が開催。去年第1回が開催されて好評だったからか、今年も市ヶ谷のJSTにて。去年は日本癌学会学術総会と被っており参加できなかったので、今年初めての参加。参加者は30名ほどで、BioHackathon2017もあってアナウンス期間が短かかった割には多数集まった感じとのこと。

普段月一回のSPARQLthonで進捗を聞いていはいるものの、まとめて通して学び直すのは非常によい知識の整理になることを実感。いろいろと情報が抜けていたり、なぜそれをしているのかなどを知る、とても良い機会であった。もちろん、近日公開予定のtogoDBの新バージョンを使っての話などアップデートも盛り沢山。今回の講習会もすべて録画されていて、後日統合TVから配信される予定なので、参加できなかった方は是非。

Continue reading »


トーゴーの日シンポジウム2017

Written by bonohu in misc on 木 05 10月 2017.

今年も巡ってきた10月5日。ということで、「トーゴーの日」シンポジウム。今年も東京大学弥生講堂にて2日間に渡って開催されたが、ポスター発表数が多く半分は別の建物での発表となった。しかし、会場はとても盛り上がっていた。

副題が「バイオデータベース『作る』から『使う』へ」にあるように、実際にどう使ったかを前面に出してきたが、結果としてはやはり「作る」方がメインの発表が多かったかと。もちろん、データベースを全く使わない研究なんて今やほとんどないだろうから、そういう方々がどんどん発表するようになったら、今年80だったポスター発表もそれよりももっと多くなって運営が大変になるだろうけど。

データベースを作る人たちもせっかくやっているのだから、その対象コンテンツの生物学的なおもしろさも聴衆に語れるようになって欲しい、というのは高望みしすぎだろうか?

Continue reading »