統合TV10年

統合TVを始めてから10年の月日が経った(「統合TVの歴史」参照)。その間、1,263件の動画を公開した。そのうち、554が講演動画、311が実習の動画。それ以外の約400がスクリーンキャプチャーによるチュートリアル動画ということに。

当初は、チュートリアル動画を作成するために、Research Assistantという形で大学院生アルバイト(大学生も)を大量に雇った。その組織は後に統合牧場と呼ばれていたが、我々の職場が三島に移転するにあたり、事実上解散となった。その後は、cloudfarmとしてテレワークで動画作成してもらっている。

それ以外にも生物アイコンとして独立に作られていた画像コンテンツと、統合牧場活動から生まれたTogo Picture Galleryの画像コンテンツが統合TVのウェブサイトに統合され、「自由に使える画像を探す」からたどり着けるように。

当初狙いとした、ググったら使い方の動画が出てくる、はある程度達成されたように思う。それを維持していくことが今後の課題であることはいうまでもない。はじめは動画作成、そして今は統合TVのEditor in chiefとして活躍しているhono氏の尽力があって可能となったことに間違いはない。この機会に感謝の気持ちを新たにしたい。

TogoTV 10th

統合TV10年!

この絵をTerminalというか、bashで描くコードが以下。#bashfillというサイトで生成。


#!/bin/bash
#Background Colors
E=$(tput sgr0); R=$(tput setab 1); G=$(tput setab 2); Y=$(tput setab 3);
B=$(tput setab 4); M=$(tput setab 5); C=$(tput setab 6); W=$(tput setab 7);
function e() { echo -e "$E"; }
function x() { echo -n "$E "; }
function r() { echo -n "$R "; }
function g() { echo -n "$G "; }
function y() { echo -n "$Y "; }
function b() { echo -n "$B "; }
function m() { echo -n "$M "; }
function c() { echo -n "$C "; }
function w() { echo -n "$W "; }

#putpixels
function u() {
h="$*";o=${h:0:1};v=${h:1};
for i in `seq $v`
do
$o;
done
}

img="\
x40 e1 x1 b5 x2 b2 x2 b4 x2 b2 x2 b5 x1 b1 x3 b1 x7 e1 x3 b1 x3 b1 x2 b1 x1 b1 x4 b1 x2 b1 x3 b1 x3 b1 x3 b1 x7 e1 x3 b1 x3 b1 x2 b1 x1 b1 x2 b1 x1 b1 x2 b1 x3 b1 x4 b1 x1 b1 x8 e1 x3 b1 x4 b2 x2 b4 x2 b2 x4 b1 x5 b1 x9 e1 x40 e1 x40 e1 x12 y4 x6 c2 x3 c4 x9 e1 x11 y1 x1 y1 x1 y2 x6 c1 x2 c2 x2 c2 x8 e1 x12 y4 x7 c1 x2 c1 x4 c1 x8 e1 x12 r3 y1 x7 c1 x2 c1 x4 c1 x8 e1 x13 y2 x8 c1 x2 c1 x4 c1 x8 e1 x5 y13 x5 c1 x2 c2 x2 c2 x8 e1 x12 y2 g1 y1 x1 y1 x5 c1 x3 c4 x9 e1 x12 m2 y4 x22 e1 x12 m1 y3 x9 c1 x3 c1 x10 e1 x12 y4 x8 c3 x2 c1 x10 e1 x12 y1 x2 y1 x9 c1 x3 c3 x8 e1 x12 y1 x2 y1 x9 c1 x3 c1 x1 c1 x8 e1 x11 y2 x2 y2 x8 c1 x3 c1 x1 c1 x8 e1 x40 e1 x40 e1 x40"

for n in $img
do
u $n
done
e;
exit 0;

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 趣味のプログラミング, 雑感 | コメントする

統合TV動画チュートリアルのある論文公開

統合TVで使い方チュートリアルを作成し、統合TVから公開したツールf-treeの論文が公開された。

f-treeGC: a questionnaire-based family tree-creation software for genetic counseling and genome cohort studies
Tomoharu Tokutomi, Akimune Fukushima, Kayono Yamamoto, Yasushi Bansho, Tsuyoshi Hachiya and Atsushi Shimizu
BMC Medical Genetics 20171 8:71 DOI: 10.1186/s12881-017-0433-4

統合TVを今もやっている2人の名前をAcknowledgementにまで入れていただいて大変恐縮。次回があるなら是非、すべての統合TVにDOIが(過去に公開した分も遡って)付くようになったので、その統合TVもcitationに加えていただけるようになるとなお良いかと。

統合TV始めて今月(2017年7月)でちょうど10年。ようやく、ここまで来た。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 雑感 | コメントする

markdownを何で書くか?

かなりしばらくぶり(といっても約半年ぶり)に、いくつかの講習会の講師に指名された。そこで、またテキストを作るわけだが、最近の統合データベース講習会AJACSは基本markdownで書いてGitHubにアップする形がデフォルト。これまではkobitoを使ってプレビューで見ながらmarkdownを準備して、最終的にプルリク送ってマージしてもらっていた。しばらく使っていなくてトレンドが変わっているかも、と思って後輩に聞いたところやはり変わっていた。

前から一応インストールはしていたATOMで書いて、その中でmarkdownのプレビューもできるというのだ。それにはプラグインなるものをインストールして…という世界ができているらしい。ググってみると、それらしいqiitaの記事(「Atom をMarkdownエディタとして整備」)確かにもある。

そこでそれに従って、markdown-writerやmarkdown-scroll-syncなどのいくつかのプラグインをインストールして編集環境を作り、実際に使ってみた。うん、確かに以前より快適だ。おかげで、ざっくりとした骨組みはさらっと作成できた。来週以降、本格的に講習テキスト準備モードになる前に訊いておいてよかった。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 雑感 | コメントする

異分野のセミナー参加

PerkinElmer Japan ヘルスケアITセミナー「病院に於ける医療ビッグデータの活用とその最新事例」に参加。結果として、異分野殴り込み。話題となっているツールは同じなのだが。どストライクじゃない分野のセミナーに出てみるのもいいもんだ。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 雑感 | コメントする

ライフサイエンスデータベース統合推進事業 事業報告書

標記の報告書が公開され、NBDCの事業推進に関する報告書等に追加された。
それに対する「ライフサイエンスデータベース統合推進事業(平成23年度~平成28年度)事業評価報告書」も同時に公開され、その中で

今後の事業継続にあたって、強化・改善すべき点についての意見
(1) 医科学、医療、創薬の分野に加え、食、環境、バイオマスエネルギー(グリーンバイオ)などの分野におけるデータベース整備も重要

とあった。こちら方向の取り組みも頑張っていきたい。
また、「バイオサイエンスデータベースセンターの今後のあり方について(提言)」も公開されており、今後の参考にしたい。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 雑感 | コメントする

静岡新聞のDDBJ連載

DDBJ30周年を期に静岡新聞に毎週連載されていた「遺伝子バンク30年」という連載が完結した模様。
大学院生時代に所属していた京都大学化学研究所の研究室の名誉教授がDDBJを始めた大井龍夫先生であった関係上、DDBJに関しては先生から話を伺う機会があり、人一倍知っているつもりであったが、この連載で知ることが多かった。というか、知らないことだらけだった。
特に最終回の高木先生への取材を元にした「適切な整理・活用が課題」は、データベース統合化に取り組んできた経緯がうかがい知れる。一読の価値はあるかと。新聞記事のウェブ版ゆえ、いつまで読めるかわからないので、お早めに。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 2010年代のバイオインフォマティクス, データベース生物学, 雑感 | コメントする

IDなきデータ

IDがない場合にどう関連づけるか。生命科学系の遺伝子のデータの場合はそれを塩基配列の類似性検索でなんとかなるが、そうでない場合にそれをどうするか。「Ontology使えよ」が真っ先に言いたくなるセリフだが、それを使わないで大量のデータがすでに作られてしまっている場合にどうしたらいいか。
その後もいろいろ議論して、その果てに出てきた言葉は、「わたしので作りました」。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 雑感 | コメントする

Mishima.syk #10

今回は沼津駅北口プラザヴェルデにて開催された Mishima.syk #10 に参加。
まずは、勉強会のページのお昼ガイドにあった沼津駅北口の千楽を攻める。怖いもの見たさで、ポークソテーに挑戦。出てくるまでかなり待たされたものの、値段相応な満足のいく肉が出て来た。ソースの味も素晴らしかった。次回も別メニューで攻めてみたい。

千楽のポークソテー

ポークソテーライス1700円也


そして、勉強会本体。今回はテーマが決められておらず、それぞれに好きなことを話す形。自分は、最近データ解析をやっている時にふと再発見したBiocondaについて紹介。なぜBiocondaに行き当たったか、その経緯や、Homebrewでは何故ダメなのか、そういうところにみなさん食いつきがよかったと話していて感じた次第。
自分の発表以外にさまざまなことを教えてもらったが、十分に咀嚼しきれていないので、これからじっくり時間をかけて学んでいきたい。
懇親会は南口にできたビアバールにて。最近できたビアバールのようだが、種類も多く、わが故郷の箕面ビールもあって大変ご機嫌。幹事の皆さん、お疲れ様でした。

そして翌日、自分の発表の最後で参加を呼びかけたサテライトミーティング的な温泉インフォマティクス研究会を開催。熱と浸透圧刺激のみならず、富士山も時折見れる開放的な空間でいろいろと議論。あー、楽しかった。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 趣味のプログラミング, 雑感 | Mishima.syk #10 はコメントを受け付けていません。

Biocondaを使ってみた

(このエントリは、Mishima.syk #10のライトニングトークのネタです)

Biocondaとは、

Bioconda is a channel for the conda package manager specializing in bioinformatics software.

とのことで、Bioinformaticsソフトウェアに特化したconda package mangerのチャンネル(bioconda.github.io)。Pythonで書かれたツールだけかと思ってスルーしていたのだが、実際はPythonに限らず、なんでもあるところがこれまでしてきた大きな誤解であった。

conda必須なので、入ってなければ、まずMinicondaを入れる。macOSの場合64bitしかないから楽だが。しかしながら、ここでもpythonのバージョン問題再発。2か3か、それが問題だ。とりあえず3で。ダウンロードして落ちてくるのはシェルスクリプトなので、普通に実行。

sh ~/Downloads/Miniconda3-latest-MacOSX-x86_64.sh 

ライセンスに同意して、すぐにインストール完了。そして、anacondaで入れるプログラムが優先的に実行できるよう、PATHを通す。.bash_profileのテンプレート作ってくれるので、それを活用。condaと打ってcommand not foundでない反応が返ってきたらインストール成功。

conda config --add channels defaults   
conda config --add channels conda-forge
conda config --add channels bioconda

とこの順番に写経。最後にbiocondaの行を入れるのがポイントの模様。

例えば、RNA-seqデータ解析ソフトウェアのSTARRSEMとかは、Homebrewになくて、これまでパッケージマネージャーを介さないで手動でインストールしないといけないと思いcondaこんでいたが。

conda install star
conda install rsem

で入る。超絶便利。なんで今まで知らなかったのだろう。これまでRSEMは普通にインストールして使って来たが、これだと全てのスクリプトがPATHの通ったdirectoryにコピーされないため、発現差解析でちょっとめんどくさい。しかし、このbiocondaを使った手法だとPATHの通ったdirectoryにバッチリインストールされるので、このようにPATHを指定する必要がない、など便利に使える。

とくに、macOSに限らず、Linux版もあるのは、マルチプラットフォームで作業する人間には同じ操作でできて大変ありがたい(といってもmacOSとLinuxだけだが)。

Biocondaを再発見した本当のきっかけは、並列版fastq-dumpを探していて。それも

conda install parallel-fastq-dump

で入る。

time parallel-fastq-dump --sra-id DRR045547 -t 8 -O fq 

てな具合で。だが、並列版fastq-dumpは同僚がbash版を作っているので、そっちを利用いただきたく。

その同僚からさらに聞いた話では、Biocondaに入れるとdocker containerに変換してくれるらしい

we succeeded in creating an very efficient Linux container for every* Bioconda package.

ということで。docker推しな我々は、ますますBiocondaな流れになりそう。さらにhomebrewから(bio)condaへ!

fink から macports、そしてmacports から homebrew。時代の移り変わりを感じずにはいられない #オッサンの戯れ言

おまけ: 温泉インフォマティクス研究会のお誘い

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 2010年代のバイオインフォマティクス, 趣味のプログラミング, 雑感 | 1件のコメント

rsem-tbam2gbam

RSEMの計算、TPMやFPKMなどしか見ないだろうと思っていたが、やっぱりgenomeに対するアラインメントを見る必要が出てきて。もちろん、--output-genome-bam をつけて再計算すればそれで良いのだが、それはそれでまた時間がかかる。長い計算の時にログを見ていた時に変換するコマンドがあったような…見つけられないので再計算しかけたが、その最中にログを見ていてわかった。rsem-tbam2gbamがまさにそれである!

rsem-tbam2gbam -p 4 ref/hogenome_RSEM_ref \
 hoge.transcript.bam hoge.genome.bam

再計算する必要なく、transcript.bamからgenome.bamへと変換できる。RSEMのreferenceを指定する必要があるが。また、threadオプションもあるので、それも指定するとさらに実時間の実行時間は短くなる。
ただ、これで生成されたgenome.bamはIGVで見るには、sortした上index作る必要があるので注意。

Creative Commons License
ぼうのブログ by http://bonohu.jp/blog is licensed under a Creative Commons Attribution-NonCommercial 2.1 Japan License.
Based on a work at bonohu.jp.

PDF
カテゴリー: 2010年代のバイオインフォマティクス, データベース生物学, 趣味のプログラミング, 雑感 | rsem-tbam2gbam はコメントを受け付けていません。