Category: misc

July2019

Written by Hidemasa Bono in misc on 水 31 7月 2019.

2019年7月を振り返って

2019年7月は出張外泊多く、11泊にもなった。 前半は、国内版バイオハッカソンBH19.7で指宿、 後半は、統合データベース講習会AJACSa6河内などで大阪。 阪大医Python会の集まりで、関西のアクティブな人たちに会えたのはいい刺激になった。

校正がレターパックでしょっちゅう送られてきて、それを週末にやっつけて毎週のように撃ち返す状況。 収穫の秋に向けて準備中といったところ。

書き物としては、そういった日本語よりは本業の方の英語のそれに移行しつつある、そんな感じ。 bioRxivからone click submission(そんなものがあるのかw?)した論文も無事submitされたようだし。 こちらも楽しみ。

Continue reading »


AJACS advanced 6th done

Written by Hidemasa Bono in misc on 土 27 7月 2019.

統合データベース講習会AJACSa6河内を終えて

大阪府枚方市の関西医科大学にて、2019年7月25-26日に開催した、中上級向け講習会AJACSadvanced(AJACSa)のAJACSa6河内が終了した。

salmonの実行だけなら30分ほどで終了してしまうセミナーとなってしまうところだが、RUNデータの取得やSRAからFASTQへのフォーマット変換、トリミングなどを説明、できる限り自分でやってもらって3時間ちょいの講習となった。 流石にRUNデータの取得は全員ではやらず、あらかじめ用意してきた外付けUSB HDからコピーで代用。 それ以外の中間ファイルもそこに入れてできなかった時はそこから使うという三分間クッキング方式で。 様子を見ながら進めたが、発現定量してデータを得るまでで割とお腹いっぱいになったようだったので、今回は基本的にはそこまでに。

そんなことは余裕でできて時間を持て余してしまった上級者向けに、先日のShizuoka.ngs#2でもやったCommon Workflow Language(CWL)を使ってkallistoを実行するハンズオンの別の発現定量化ツール版を用意した。 それを取り組んでくれた人も何人かいたようだが、コケない限りは我々に訊いてこない参加者たちだったため、完全には把握できず。

会をアレンジしていただいた関西医科大学の広田喜一先生には大変お世話になりました。 ありがとうございました。

Continue reading »


OUMed-python mokumoku kai

Written by Hidemasa Bono in misc on 金 26 7月 2019.

阪医pythonもくもく会

2019年3月に三島合宿にきた阪医python会のyyoshiakiたちと、次に大阪に行った時には話する機会を作ろうと話していたのがきっかけで。

統合データベース講習会AJACSa6河内で大阪に行くことになり、有言実行 でそうすることになった。 それが今回の阪医pythonもくもく会となった。 そういうわけで、私は「生命科学研究としての公共遺伝子発現DBのメタ解析」と題して、長めに話させていただいた。 話としては、自己紹介の延長でバイオインフォマティクスということの私なりの定義から始まり、阪医Python会謹製のikraを利用した公共遺伝子発現データベースのメタ解析の話を、我々が普段本務で作っているサービスの紹介を交えながらさせていただいた。 熱心に聞いていただいていたようで、話す側としてもやってよかったなあという感触。 あとで見てくれる人も少なからずいるのではないかと思い、プレゼン資料も話に出したfigshareにアップロードして、会のウェブサイトから辿れるようにしたり。 こういった地方行脚を日本各地いろんなところでできるといいのかな、と思った次第。

Continue reading »


BH19.7

Written by Hidemasa Bono in misc on 月 08 7月 2019.

国内版バイオハッカソンBH19.7

2019年7月8日〜12日まで、鹿児島県指宿市の国民休暇村で開かれた国内版バイオハッカソンBH19.7に参加。

前半は、書きかけていたTrim Galore! v0.6.3のCWL書きを、CWLマスターに話をうかがいながら。

詰まった点は何点かあって、まずはdockerPull:の記法。 trim-galore:0.6.3--0のように--0をつけないと動かない模様。

また、元々のコマンドラインオプションとは別の名前にcwltoolで指定するオプションはしたほうがいいっぽいことも。

まだまだまずい点があるだろうけど、とりあえずは動くものとなった。 paired-end version(trim_galore.cwl)はこんな感じで。

cwlVersion: v1.0
class: CommandLineTool
hints:
  DockerRequirement:
    dockerPull: quay.io/biocontainers/trim-galore …

Continue reading »


MS-BIO2019

Written by Hidemasa Bono in misc on 日 07 7月 2019.

質量分析インフォマティクス研究会 2019年ハッカソン・プレ・ミーティング

2019年7月7日に、国内版バイオハッカソンBH19.7に先立って鹿児島県指宿市の国民休暇村で開催された質量分析インフォマティクス研究会 2019年ハッカソン・プレ・ミーティングで講演。

門外漢からの話題提供という役回りで、的外れな話だったかもしれない。 それぞれのオミックス研究での悩みどころというものの一端に触れることができたのはよかった。

Continue reading »


12 years passed

Written by Hidemasa Bono in misc on 月 01 7月 2019.

DBCLS12年

この2019年7月で、2007年7月にDBCLSに移って一回り、すなわち12年が過ぎた。 昨年の今日のブログにも書いたことだが、 プロジェクトを開始した当時は、動画でDBを紹介することなんて考えてなく、紙媒体の教科書としてそれをまとめて形にすることを目論んでいた。 出版業界の事情もあり、それらは実現してこなかったが、Dr.Bonoの生命科学データ解析を出したおかげで、本の出版話が来るようになった。

そして。この一年で、DBCLSに来て始めた統合TVに関する本、生命科学データベース・ウェブツールを出版することができた。 さらに、システムエンジニアに生命科学分野のデータ解析について知ってもらうための書籍、生命科学データ解析を支える情報技術も上梓できた。 共に多くの同志に協力していただいたからこそ、実現した書籍化であった。

さまざまなバックグラウンドの人に知ってもらうという活動が少しづつ広がりだしたが、まだまだ道半ばである。 その一方で、構造化した知識(約10年前当時流行っていたキーワードでいうと、「知の構造化」)を、実際のこれからの生命科学研究で活用していくことも進めていかねばならない。 誰かにやってもらうのではなく、自らもそれの先頭にたって。

Continue reading »


June2019

Written by Hidemasa Bono in misc on 日 30 6月 2019.

2019年6月を振り返って

前半は、5月から実行してきたメタ解析。 Dockerなスクリプトのikraを使ったわけだが、FASTQの取得を別でやったこともあって最初に書いたらそれで終わり、というわけにはいかなかった。 取得失敗するエントリのrecover等、手動の作業も多く。 しかし、学会参加等で出かけていた裏で実行したこともあり、時間が有効に活用できた。 Docker使ったため、ソフトウェアのインストール等しなくてよかったのだが、やはりCWLで動かしたい熱がむしろ高くなるキッカケに。

上述の学会参加も含めて、2019年6月は宿泊回数5泊。 日帰りも多く、この数字以上に出張に行っていたかんじがする。 6月11日には東京農工大で集中講義で、大学院生にガッツリ「Dr.Bonoの生命科学データ解析」を講義した。 6月22日にはShizuoka.ngs#2で静岡エリアのエンジニアさん向けに生命科学データ解析の話とRNA-seqデータ解析のハンズオン。

また、母国語での執筆活動は相変わらず続いていて、だらだらと書いてきたのをとりあえず脱稿。 まだいくつか書き物の仕上げが残っているものの、今後は監修業に専念できるかな。

Continue reading »


QuickLook

Written by Hidemasa Bono in misc on 土 29 6月 2019.

less-less なファイル操作

ファイルシステムにあるファイル(多くはダウンロードしてきたファイルだが)の中身を確認することはしょっちゅうある。 テキストファイル(とそれが圧縮されたファイル)であれば、CUIだとターミナル上でlessコマンドで中身を見るだろう。 Finderのwindow中やデスクトップにそのファイルのアイコンがある場合、それを選択して(シングルクリック)、スペースを押せば中身がプレビューできる。 それがQuickLook(クイックルック)である。 lessコマンドをあまり使わなくてすむ(less)機能ではないかと。 Mojaveだとテキストだけでなく、画像や動画ファイルでさえ見れるようになっている。

QuickLookを便利に使うためのプラグインなんていうのもある。 ここで紹介されているのは全部入れてあって、結果としてQuickLookでコンマ区切り(csv)やタブ区切りテキスト(tsv)を綺麗にフォーマットして表示され、非常に重宝している。 また、markdownはそのコードではなく、フォーマットされた状態でプレビューできるのでこれまた便利。 次は、CWLかな。

Continue reading »


17th Workflow Meetup

Written by Hidemasa Bono in misc on 金 28 6月 2019.

17th Workflow Meetup

15回目に参加して以来、3回連続。

今回は17回目。 CommandLineToolを単体で動かすところだけだが、Shizuoka.ngs#2で人に紹介したりして、なんとなくCWLの活動に貢献できてきたかなと。

さらに調子に乗って、CWLでsalmonを動かしてみるコンテンツを作ることなどをしていた。 これは、2019年7月25日にやるAJACSa6河内にて早く課題が出来てしまった上級者向けにやってもらう予定。 今回は生命科学者向けということと、より多くの人に見てもらうために日本語のここ(ぼうのブログ)ではなく、英語のブログの方に。

それも出来て、やっと自分でもCWLを書こうという状況になってきた。 以下のエントリが参考になりそう。

役立つコンテンツを公開いただき、ありがとうございます。

Continue reading »


AJACS advanced 6th

Written by Hidemasa Bono in misc on 火 25 6月 2019.

統合データベース講習会AJACSa6河内

毎年やっている中上級向け講習会AJACSadvanced(AJACSa)を今年も開催。 今年は、大阪府枚方市の関西医科大学にて、2019年7月25-26日に。 詳細は案内のウェブサイトを。

今回は、医科大学での開催ということもあって、ヒトにおける発現解析と疾患・表現型データベースに焦点を当てて。 RNA-seqデータから転写単位ごとの遺伝子発現を定量化する方法を学ぶハンズオンを。 生命科学データ解析を支える情報技術(IT4BDA)の「第2章 解析環境の構築」の 「2.8 遺伝子発現データ解析の実際」にも取り上げられている内容だが、また別の定量化プログラムを使った演習とする予定。

蛇足ながら、中上級向けということで、UNIX操作を一通りマスターした人が対象。 次世代シークエンサーDRY解析教本のLevel1の2「コマンドラインの使い方」にある程度を一通りやった方を想定して話を進める予定。 もちろん、Dr.Bonoの生命科学データ解析(Bono本)の第3章の3.1「基本リテラシ」にある内容でも構わないのだが。

余裕でできて時間を持て余してしまう上級者向けに、先日のShizuoka.ngs#2 …

Continue reading »


Shizuoka.ngs#2 done

Written by Hidemasa Bono in misc on 日 23 6月 2019.

Shizuoka.ngs#2に参加しての雑感

このブログの過去のエントリにも書いたように、Shizuoka.ngs#2が開催された。 場所は、前回の読書会と同じ貸し会議室@静岡駅前で。

生命科学データ解析に触れてみたいエンジニアの皆さんに向けて、それを広く紹介しようということで、エンジニアのための生命科学入門的なコンテンツで話をさせてもらった。 主に生命科学データ解析を支える情報技術(IT4BDA)の第1章「生命科学データ解析入門」に書いた内容ベースで話をさせてもらった。 しかしながら、生命科学をこれまであまり知らなかった人にとっては理解するために知るべきことが多く、大変なのだろうなあということは話していてもヒシヒシと。 もっと分かりやすくする努力をしないといけないのだろうなあと痛感した。

その後、RNAの発現量を配列カウント数から推定するRNA-seqデータ解析は、生命科学初心者にも取っ付きやすいのではないかということで、IT4BDAにも遺伝子発現データ解析の実際として「第2章 解析環境の構築」の 「2.8 遺伝子発現データ解析の実際」に取り上げられており、それをハンズオンとしてみんなでやった。 初対面ということでなかなかリアクションがわからないケースもあったが、事前にサイズの大きな(数GB)配列ファイルを外付けハードディスクとして用意し、環境をmacOSだけとして揃えることでほぼ全員が動かせられた模様。 中身の解釈に関してもうちょっと説明が加えられるよう準備しておくべきだったとこちらも反省。

単にそれだけでは申し訳ないということで、Common Workflow Language(CWL)を使ってkallistoを実行するハンズオン …

Continue reading »


Running kallisto via CWL

Written by Hidemasa Bono in misc on 土 22 6月 2019.

Common Workflow Language(CWL)を使ってkallistoを実行する

このエントリは、Shizuoka.ngs#2で行われたワークショップの上級者用コンテンツです。

生命科学データ解析を支える情報技術」の 「第2章 解析環境の構築」の 「2.8 遺伝子発現データ解析の実際」にあるkallistoを実行する手順をCommon Workflow Language (CWL)を使って動かしてみよう。

実行に必要な配列セット(1. queryの配列(FASTQ形式)、2. 検索対象のtranscriptome配列セット(FASTA形式))はすでにあるものとする。 ここでは例として以下の配列セットを用いる。

  1. 生命科学データ解析を支える情報技術」p48にあるSRR7300567(タモキシフェン投与したMCF-7細胞株)
  2. transcriptome配列セットとしては(上記のMCF-7はヒト由来の細胞株であるので)EnsemblのhumanのTranscript sequences ftp://ftp.ensembl.org/pub/release-96/fasta/homo_sapiens …

Continue reading »


Install pelican with markdown

Written by Hidemasa Bono in misc on 金 21 6月 2019.

PelicanをMarkDown付きでinstall

condaの不具合から一度全部アンインストール。 そのため、このブログが更新できなくなってしまったので、再度pelicanをインストール。 単純にpelicanをcondaで入れればいいだけでなく、MarkDownも必要。

1
2
3
#!/bin/sh
conda install pelican
conda install MarkDown

Continue reading »


Lecture on insect physiological chemistry

Written by Hidemasa Bono in misc on 火 11 6月 2019.

大学院講義 昆虫生理化学特論

東京農工大学農学府にて、大学院の集中講義として。

基本的には、Dr.Bonoの生命科学データ解析(Bono本)の内容に沿った内容で。

この内容に沿って自分で講義するのは、出版から1年と9ヶ月あまり経つというのに、実は初めてという不思議な状況。 需要がないのか、供給が足りているからなのか、どっちなのだろうか。

もちろん、それだけでは大学院講義の内容としては最新のコンテンツに欠けるので、その部分も盛り込んで、丸1日。 そういうわけで新ネタで、出来具合が納得のいかないパートもあって、それは今後の課題に。 諸事情あってという部分もあり、それは時間が解決してくれるかと…。

講義資料は、公開するには色々と問題あるものが多く。 そういうわけで、見たい方々はぜひ講義に呼んでくださいw。 半期や年に一回限りの講義であれば、できる限り対応します。

Continue reading »


JSGEDIT 4th

Written by Hidemasa Bono in misc on 水 05 6月 2019.

日本ゲノム編集学会第4回大会

東京(船堀)開催だったというのもあって、初めて参加。 有用物質生産や育種での応用を調査する目的で。 アウェーだと思って行ったわけだが、割と知っている方もそれなりに居て。

未発表のデータが多く発表されているなどよかった。 つまり、参加しないとわからない情報が数多くあったということ。 それゆえに当然だけど、プレプリントとかはまだ出ていないのがほぼ全てだった。

funding情報を明らかにしてない発表も多かったのがちょっと気になった。 論文出すときに明記するようになってきているように、それも貴重な情報源かと。

また、全体的にゲノム情報ありきで話が進められている印象。 編集する元のゲノム情報をケアした発表がもっとあっても良いかなと。

Continue reading »


May2019

Written by Hidemasa Bono in misc on 金 31 5月 2019.

2019年5月を振り返って

前半は、4月から準備してきた、Cold Spring Harbor Meeting on Biology of the Genomes関係。 AOEの論文をプレプリントとしてbioRxivにアップロードしたり。 おかげで、CSHL meetingの時に大変説明しやすく。 帰国後はメタ解析の方を重点的に。

それ以外は国内出張は少なかったが、2019年5月は宿泊回数9泊。

また、母国語での執筆活動は、月始めに某脱稿して一段落。 それ以外の方もそろそろ出番が出てきそうな感じ。 6月は集中講義もあるし、頑張っていこう。

ぼうのブログの2018年1月以前のコンテンツを現在のサーバーの方に移行したおかげか、アクセス数が増えた。 傾向としては、これまでtwitterからの流入が多かったのが、インターネット検索からと思われるアクセスが増え、 また、PCとモバイルからのアクセスがほぼ半々だったのが、PCからのアクセスが増えた。 最近は、技術的なメモは英語版の方に書くようにしているのでそちらで。

Continue reading »


ikra revisted

Written by Hidemasa Bono in misc on 水 22 5月 2019.

ikra再び

tximportで定量する部分を使わせてもらった、阪大医学部Python会のyyoshiaki氏によるikraであるが、また別プロジェクトで使わせてもらうことに。 Docker以外は特にデータ解析ソフトウェアをインストールしていない環境で手っ取り早くsalmonによる発現定量をしたかったため。 実は、このsalmonで発現定量をやる方法、Dr.Bonoの生命科学データ解析(Bono本)には載っていないのであった。

SRRのIDをリストで渡して配列データ取得からやってくれるSRR modeは確かに便利なんだが、直接FTPで配列取得するのに比べて時間がかかりすぎる気がする感じであった。 そこで、FASTQデータはすでに取得してあることが前提のFASTQ modeで使ってみたが、ちょっとバグがあってyyoshiaki氏とやりとりしたりして。 30サンプルほどのFASTQがほぼ1日半ほどで計算が全て終わった。 ただし、多くはファイルのトリミングとそれに続くQCに多くの時間がかかっていて、実際の定量は各サンプルあたり10分ほど。

もちろん、動かしている内容をきっちりわかっているという条件付きであるが、インストールでハマることなどなく、発現定量値を得ることができた。

ドッカの鯖で、ではなく 自鯖のDockerで、

このようにデータ解析パイプラインを流す時代になっていくのだろうか?

Dockerが入ってないといけないし、メモリ要求性もそれなりに高いし、誰でもすぐに簡単にとはいかないが。

Continue reading »


Direct search links added

Written by Hidemasa Bono in misc on 日 19 5月 2019.

直リンク追加

ここで説明したことがないから気づかれてないかもしれないが。 現在のレイアウトでは右カラムに並んでいるLinksとSocialは、 単にそれぞれのサービスのトップページへのリンクではなく、 実は自分(の名前やID)をqueryにそれぞれのサービスで検索した結果への直リンクとなっている。 例えば、PubMed をクリックすると、PubMedにindexされた自分の論文が表示されるようになっているわけである。 今回、bioRxivとf1000Researchへの直リンクの張り方がわかったので、それらを追加。

それらの中で、オススメはeuroPMCへのリンクである。 これはORCIDのIDをqueryとして実現しているが、bioRxivなどのpreprintを含めた論文数の推移が動的にバーチャートとして描かれる。 ORCID取得するだけでこれが可能となるので、これまで論文を出した方は是非ORCID取得されたし。

Continue reading »


AOE archived in LSDB archive

Written by Hidemasa Bono in misc on 金 17 5月 2019.

AOE、生命科学系データベースアーカイブに

All of gene expression(AOE)のデータ(遺伝子発現データのメタデータのindex)が、生命科学系データベースアーカイブ(LSDBarchive)という公的なデータアーカイブからダウンロードできるようになった。

なぜそうしたかなのだが、一番の原動力は、(一次データベースではないものの)生命科学系のデータベースとして全てをダウンロードできるようにし、再利用性を高めたいということ。 実は、データ全体が欲しいというリクエストは、以前からあった。 これまではAPI使って取ってください、ということで対応していた。 しかしながら、再利用してもらうにはちょっとハードルが高いかなと、思ってはいた。 それが今回、LSDBarchiveに入ったことで全体のダウンロードもクリックしていくだけで簡単に可能となった。 より使ってもらえるようになったのではないか。

また、寄託したデータ自体に以下のようにDigital Object Identifier(DOI)が付き、引用する際のIDとして使えるようになった。

Continue reading »


Always on SSL for AOE

Written by Hidemasa Bono in misc on 木 16 5月 2019.

AOEのHTTPS化

業界の多くのウェブページがHTTPS化する中、取り残されていた。 特に必要性を感じなかったからだが、やはり多くの人にそのサービスを使ってもらうと考えると、HTTPS化は必須だろうと思い立ち。

実際先にそうした同僚にどうやったかを相談して。 そしたらHTTPS化をSEさんに相談してフロントエンド側でなんとかなりそうらしいことがわかり。 結果として、現在のコンテンツに混在していたHTTPとHTTPSのリンクをHTTPSに一元化するだけで、それが実現した。 やってみればなんてことはないのだが、そこはコロンブスの卵

今後はこのhttpsから始まるアドレスを示していきたいと思う。 関係者の皆様、ご協力ありがとうございました。

Continue reading »


Jet Lag in 2019

Written by Hidemasa Bono in misc on 水 15 5月 2019.

時差ボケ

今回は13時間時差のあるところに5日間(4泊)だったのだが、やはり帰ってきても時差ボケに。 いつもなら帰ってきても欠かさずmelatonin投与してそれほどでもなかったのだが、今回はそれをサボっていたせいか、割とキツイ。 なので、帰国後数日経っているが、寝る前にmelatonin服用して合わせるように。

Continue reading »


Apple Watch Theater mode

Written by Hidemasa Bono in misc on 日 12 5月 2019.

Apple Watchのシアターモード

Apple Watchを普段から愛用している。

これまでApple Watchをつけて飛行機に長時間乗るとすぐに電池が消耗し、しかも飛行機によくついているUSBにApple Watch磁気充電ケーブルをさして充電しても全然充電が進まないどころか、むしろ電池が減るという事態に。

それをtweetしたところ、シアターモードにすれば良いかもという助言が。

シアターモードは元々は名前の通り映画館でふとした動作でApple Watchが光ってしまい、周りに迷惑をかけてしまうのを防ぐモードで、画面をタッチするか脇のボタンを押すかしないと画面が表示されなくなる。

そこで帰りの飛行機に実際そうしてみたところ、ちゃんと充電されるようになった。 飛行機の中は振動が多く、普通にしていても画面が光ってしまう。 そのせいで電池が消耗していたのだろう。

さらに、おやすみモードというのもあって、それに設定すると通知がされなくなる。 飛行機の中では、通知されることはおそらくはない状況なので、これも併せて設定しておくと良いだろう。 そうすると電池が長持ちして、現地についてからもすぐにApple Watchを使うことができるだろう。

でも一番最初に出たモデルを使っている私としては、そろそろ新しいのが欲しい時期だが…。

Continue reading »


The Biology of Genomes 2019 day5

Written by Hidemasa Bono in misc on 土 11 5月 2019.

The Biology of Genomes 2019 day5

meeting最終日。 来た日には、5日間もあって長いなあと思っていたが、実際にはあっという間だった。

全体的な雑感としては、順調に女性参加者の割合が増えていたのに、今回で急に下がったらしいが、何があったのだろうか。 久しぶりに参加した私からすると、米国からの参加者の割合が高くなった気がしてならなかった。 そして、かつてより「テクノロジー」の演題が減って、「データ解析」のそれが増えた。 このことはやはり米国参加者が増えているのと関係がある気がする。 それと、やはりヒトが対象の研究が多い。 Biobankのデータを使った研究が特に口頭発表で多く見られた。 他の生物もあるが、基本産業的に重要な穀物や家畜だけのイメージ。

帰りは偏西風に逆行するので、約13時間のフライトと長かった。 「スパイダーマン:スパイダーバース」 を見たら別のを見たくなって、 「アリー、スター誕生」、 「レプリカズ」、 「アクアマン」 と、結果として4種類の映画を見ることができた。

Continue reading »


The Biology of Genomes 2019 day4

Written by Hidemasa Bono in misc on 金 10 5月 2019.

The Biology of Genomes 2019 day4

「なんとかseq」はまだまだ増殖中、というのを再確認。 というか、手法の命名方法として多用されていて、それは塩基配列解読がカップルしているからに他ならない。

Continue reading »


The Biology of Genomes 2019 day3

Written by Hidemasa Bono in misc on 木 09 5月 2019.

The Biology of Genomes 2019 day3

Population Genomicsのセッションを聴いていて、ゲノムデータを使った研究の広がり、を感じた。 その使った研究がもっと増えていかねば。 もちろん、オイラが使われているのを知らないだけかもしれんが。

解析手法開発のためのエコシステムが必要だと痛感。 ただ、解析手法を作ることを目的に開発するだけではそれは難しく、何かgrand(grantかも) aimは別にあって、それを達成するためのナニカでないと今後続けていけないのでは? この先生きのこれない、ってやつ。

Continue reading »


The Biology of Genomes 2019 day2

Written by Hidemasa Bono in misc on 水 08 5月 2019.

The Biology of Genomes 2019 day2

ポスター発表は会期中の2,3,4日目に、毎日日替わりで、発表者のLast Name、アルファベット順。 ということで、Bから始まる私は初日に。

2日目だとバッチリ日周期(circadian rhythm)が残ってて、ポスター発表の午後の時間帯は超絶眠く。 なんとか立ってはいられたものの、積極的に話すのは辛い状態。

それにしても、

  • ほとんどがopt inにtweetableな口頭発表がほとんど
  • bioRxivに論文としてすでにアップロードしてある

ことがとても印象的だ。

Continue reading »


The Biology of Genomes 2019 day1

Written by Hidemasa Bono in misc on 火 07 5月 2019.

The Biology of Genomes 2019 day1

2019/5/7-11まで Cold Spring Harbor Laboratory (CSHL) で開かれている The Biology of Genomes に参加。 ミーティングの名前を変えながらも、この時期に毎年行われているヒトゲノム解読プロジェクト当時からある。 実は、22年前にこのミーティングに出て発表したのが自分の海外学会発表デビューであった。 そもそも当時はJFKについたら怪しいタクシーに乗らないと移動手段がなかったような…。

時代とともに色々変わっていて、最近では事前に要旨集がPDFで送られてくるようになったし、ソーシャルメディアの使用もキッチリとガイドラインがあって推奨されている。 それをiPadでも見れるようにと、iCloud共有してみたが、PDFファイルを開いただけじゃテキスト検索できない。 開いた画面の右上の上向き矢印アイコンで出てくるメニュー「"ブック”で開く」を選んでブックを起動するとテキスト検索が出来るように。 iBooksはブックになっていたようだ、いつの間にか。浦島太郎状態だな…

CSHLに来るのは、2017年秋のGenome Informatics以来1.5年ぶりだが、このGenomeのミーティングにくるのはおそらく理研にいた時以来、17年ぶりぐらいではなかろうか。 今回もガッツリ勉強してきたい。

Continue reading »


Docker setting for genomer

Written by Hidemasa Bono in misc on 月 06 5月 2019.

ゲノム解析者用Docker設定

Docker Desktop for macのおかげで、macOSでもDockerを使ってツールを起動することが簡単になった。 インストールの際にライブラリの依存性に悩まされることもなく、またバージョンの違いによる差異も決まったバージョンで動かせば解消されるはずである。 何よりも(あまりないのだが)macOSで動かないツールを動かすことができるのが魅力である。 ただ、最初に実行するときのイメージがかなり大きく、ネットワーク的に恵まれてないと厳しい上に、実行するためにはnativeに動かすよりも多くのメモリが必要となる。 ゲノム系のツールはもともとメモリをたくさん必要とするものが多く、その辺がさらにネックとなっているのではないかと。 デフォルトで2GiBのメモリがDockerに割り当てられて動いているが、これではすぐに足りなくなるであろう。 足りなくなるとエラーもなく、急に実行が止まってしまうので、何が原因なのか、わかりにくい。

yyoshiakiもikraのページで書いているが、salmonを実行するにもデフォルトの2GiBではメモリが足りなかったようだ。 今後多くの人がハマりそうなポイントなので、ここでも再度書いておく。

Dockerが起動しているときに上に出ているDockerのアイコンメニューからPreferences...を選択する。

メニュー

そして、開く設定画面からAdvancedの項目を選択すると以下のような画面が出てくる。

詳細設定

この画面では、2GiBになっているメモリの割り当てを増やして、12GiBに設定したことになっている。 ただ、つまみを動かしたままではダメで、下部のApply & Restartボタンを押してDockerを再起動する。

これで前はコケていたDockerのプロセスが動くようになることが多いのではないだろうか。

Continue reading »


completion of writing 2019

Written by Hidemasa Bono in misc on 日 05 5月 2019.

脱稿2019

年頭から書いてきたとある書き物を脱稿した。

1
2
#!/bin/bash
wc -m *.md

でカウントした文字数の合計は、212,364となった。

今回はその進捗を#某進捗ハッシュタグで記録してきた。 そのデータを使って、TIBCO Spotfireで可視化してみた。 その前処理は以下の通り。

1
2
3
4
5
#!/bin/bash
grep ^190 shinchoku.txt \
| awk '{ print "20"$1"\t"$2 }' \
| perl -pe 's/現在、文字数合計//' \
> shinchoku2.txt

twitterで表示したデータはshinchoku.txtとし、Spotfireで読み込むタブ区切りテキストファイルがshinchoku2 …

Continue reading »


what is tilde

Written by Hidemasa Bono in misc on 金 03 5月 2019.

チルダ

電子メールなどの文書には出てこないがUNIXコマンドラインで出てくる文字として、~がある。 読み方は、「にょろ」ではなく、「チルダ(tilde)」である。

かつてはウェブサイトなどでこの~を含むURLも多かったので、その存在を知っている方も多いかもしれない(ちなみにうちの職場の個人サイトはこの~を含むURLとなっている)。

この~であるが、UNIXコマンドラインでは、これはホームディレクトリという意味がある。 個人のホームディレクトリはアカウントごとにその絶対パスは異なるわけであるが、それをスルーして画一的に記述する際に便利な文字だからだ。 例えば、カレントディレクトリ以下のファイルをすべてホームディレクトリ以下のDocumentsディレクトリにコピーする場合は以下のコマンドだ。

1
2
#!/bin/bash
cp * ~/Documents/

これも一字一句間違えないように打たないと動作しない。 間違いがちなのは、チルダのあとの/を忘れたりすることである。

しかしながら、これは知らなくても多分なんとかなる文字かなと思う。 ホームディレクトリを指定する方法は~を使わなくても何通りでもできるし。 そんな風に何通りにも同じ動作が記述できるのがUNIXのいいところである。

Continue reading »