Category: misc

第1回オモロイ生き物研究会

Written by bonohu in misc on 日 23 10月 2016.

札幌の定山渓にて、10/22-23の一泊二日で。研究会のお題目の通り、オモロイ生き物でさまざまな生命現象を解明しようと取り組んでいる人たちの集まりで、かなりハイレベルな議論が。 ライフワークとなりつつある遺伝子機能アノテーションの話をして、これまでモデルとされておらずDBリソースが不足している生物種ならではの話をした。研究会の最後の方だったため、それを踏まえた議論があまりできなかった印象。今後の共同研究につながるといいな。

Continue reading »


ファイルの捜し物

Written by bonohu in misc on 日 16 10月 2016.

MacOSXだとSpotlight検索が中身まで検索対象になっていて便利だが、ファイル名でのみ検索したいときがある。しかもコマンドラインで。そういう時に使っているのがlocateコマンド。 [shell] locate hoge [/shell] でhogeを(絶対)ファイルパスに含むファイルをリストしてくれる。 それでも見つからないときはfindコマンド。 [shell] find . -name index.html -print [/shell] とかやるとindex.htmlというファイルをcurrent directory以下から探してくれる。 [shell] cd / find . -name 'hoge*' -print [/shell] とするとroot directoryに移動してから、hogeからはじまるファイルがリストされる、という具合に。

Continue reading »


第75回日本癌学会学術総会@横浜

Written by bonohu in misc on 土 08 10月 2016.

今年はトーゴーの日シンポジウム(10/5-6)と1日被り、大会2日目からの参加。企業展示ならびにポスター会場がスカスカでびっくりする。別の学会と被ったから、らしいが。clinical sequenceに移行していくなか、ますますアウェー感が増した印象。公共DBの再利用よりも自分のところで出した大量のデータをいかに解析するか、そっちの方が喫緊の課題であるような。その一方で大型機器は予算の制約で買えず、某社のデータ解析サービスが赤字に耐えかねて有償化という状況。果たしてどうなっていくのやら。

Continue reading »


トーゴーの日シンポジウム2016

Written by bonohu in misc on 水 05 10月 2016.

今年も、10月5日ということで、「トーゴーの日」シンポジウム。今では、この1年の進捗を発表する機会となっているが、統合データベースプロジェクトが始まって早10年。論文で測ることのできない成果が出てきているとは思うが、データの大量化に伴う個人持ちのデータの解析に悩む人はむしろ増えているのではないかと。そこを改善する解決策を提案していければよいのだが。

Continue reading »


XXV International Congress of Entomology (ICE2016) 参加

Written by bonohu in misc on 土 01 10月 2016.

Entomology(昆虫学)の国際学会に参加。初参加でアウェーの学会だったが、来てみると全く問題なかった。自分は、いわば系統樹を書くときのアウトグループのような存在かと思っていたが、わりとそうでもなく。

種が多い昆虫ならではなのだろうか、比較生物学がごく当たり前に行われていて、また研究の分業化がされていてRNA-seq解析などもごく普通にやられているのも本邦との温度差を感じた。やはり身近にそういうデータ解析ができて相談(もしくは共同研究)できる人がいるようにならないと。

Keynote lectureが事情により録画で流されたり、学会に来れなかった人がskypeで遠隔からプレゼンしたり、新しいタイプの発表にも衝撃を受けた。学生のプレゼンでもちゃんとgrantを明らかにしているのは、当たり前だがきっちりしている。こういうところは見倣わねば。

周りの人に自分が何者かを話していると、専門がバイオインフォマティクスの遺伝研に居るが遺伝研所属じゃないデータベース流通業という、自分の中で少々曖昧になっていた自分の立ち位置を再認識できた良い機会となった。良い刺激を受けることができたのではないかと。

Continue reading »


日本生物工学会誌連載1回目「ウェブ上に散在する情報を生命科学研究にどう役立てるか」掲載

Written by bonohu in misc on 日 25 9月 2016.

日本生物工学会誌に「バイオインフォマティクスを使い尽くす秘訣教えます!」という連載が開始。2ヶ月に1回、全7回の予定。2016年1月に鹿児島大学医学部で行われた統合データベース講習会: AJACS薩摩でその会誌の編集委員の方が受講されていて、講習の合間に話したのがきっかけとなって連載する話に。引き受けたのは、掲載後すぐネット上で公開され、会員でなくても誰でも読める、というところが決め手だった。その後、先方が遺伝研にいらした際に詳細を話し合って連載の構成を決め、第1回は私による「ウェブ上に散在する情報を生命科学研究にどう役立てるか」ということで。シリーズの今後の内容に乞うご期待。

Continue reading »


1 month past rsyncing ArrayExpress data

Written by bonohu in misc on 月 12 9月 2016.

ArrayExpressのdataをrsync開始してから今日でちょうど一ヶ月。前回と変わらず、experimentディレクトリのミラーが終わらない。データ転送量的には、合計1.5Tbyteほど。もう1thread増やしてやっているものの。約44Tbyteと書かれている全体のデータを信じれば、あと2年半。対策を考えねば。

Continue reading »


考えていることの体系化に向けて

Written by bonohu in misc on 日 11 9月 2016.

いろいろ書き散らす。2016年の計として元旦に誓ったことでもあるし。まさかこういう形で転ぶとは思っていなかったが。このやり方のほうが怠惰な自分が奮起してやり遂げるのではないかと。もちろん、本務優先ではあるが、長い目で見るとこれこそがやるべきことになるのかもしれないね。

Continue reading »


Trailblazer

Written by bonohu in misc on 土 10 9月 2016.

昨日のセミナーで知った言葉だが、どうも気にかかると思ったら、やはり自分たちが果たしてきた役割をいう言葉だった。折しもそのセミナー中に、この夏にずっと待っていた研究費の結果がやってきて、次のTrailbalzerを果たすべきターゲットがまた1つ増えた。個人的には、比較的大きな山だった昨日のセミナーが終わり、達成感とともに空虚感に見舞われていたところで、ちょうどいい。次なるTrailblazerとして頑張っていこう。

Continue reading »


第1回 SPARC Japan セミナー2016「オープンアクセスへの道」

Written by bonohu in misc on 金 09 9月 2016.

前にも書いたとおり、今年度(2016年度)から国際学術情報流通基盤整備事業(SPARC Japan)のセミナー企画ワーキンググループのメンバーとして、セミナー企画に携わっている。2016年度には3回セミナーを開催することを企画しているのだが、自分はそのうちの2つを担当する、ということで第1回 SPARC Japan セミナー2016「オープンアクセスへの道」が2016年9月9日に一ツ橋の国立情報学研究所にて開催。

ということで、演者の選定から関わった。生命科学研究者の立場からOpen Access(OA)に関して話してくれる人を探せばよかったのだが、演者決定まで時間もなく、そして何よりも話してくれそうな人が思い浮かばず、結局自分で話しをすることに。実は自分も適任者の一人だったのかもとスライドを作っていて思ったり。

参加申し込みがはじまってから1週間経たないうちに満席になるなど、今回のセミナーのテーマは現在関心の高いものだったらしく。多数の方が話を聴きたいのに会場の都合で入れないという事態になり、YouTube liveで動画配信されることに。セミナー企画メンバーの担当者がtwitterでもつぶやく、という情報発信を行ったので、ハッシュタグ(#SPARCJP201601)をみてもらうと感じがわかるのではないかと。とりいそぎ、自分の発表スライドはfigshareにアップしておいた。

Bono, Hidemasa (2016): 生命科学分野における研究者の投稿先雑誌選択趣向とOAへの意味づけ. figshare.
https://dx.doi …

Continue reading »


3 weeks past rsyncing ArrayExpress data

Written by bonohu in misc on 金 02 9月 2016.

ArrayExpressのdataをrsync開始してから3週間。だが、experimentディレクトリのミラーが終わらない。データ転送量的には、合計0.9Tbyteほどで、約44Tbyteと書かれている全体のデータからするとやはりまだまだ。thread数を増やしてみましたが、果たして。

Continue reading »


遺伝研研究会「次世代モデル生物におけるゲノム情報利用ワークショップ」やります

Written by bonohu in misc on 水 31 8月 2016.

今年度、申請して遺伝研研究会としての開催が決まっている「次世代モデル生物におけるゲノム情報利用ワークショップ」。それを2016年12月15-16日に遺伝研宿泊施設の会議室で開かせていただくことに決めました。ちょうど同じ日程で企画されているSPARQLthonの裏になりますが。よろしくお願いします。

Continue reading »


Trinityがコケる

Written by bonohu in misc on 月 29 8月 2016.

single end readsのTrinityの実行がこけて、hoge.fq.readcountファイルに以下のような記述が。

Error, cannot convert fastq file to fasta since cannot recognize read orientation as /1 or /2 (instead: F)

このエラーメッセージでググると同じ目にあった人のQAが。どうも、FASTQファイルのヘッダに問題があるようで、それを書き換えてしまえば問題ない模様。このQAにはこの書き換えスクリプトまで書かれていた。 [shell] awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' hoge.fq | awk '{if(NR%4 …

Continue reading »


NBDCヒトデータベースとJGAに感謝

Written by bonohu in misc on 金 26 8月 2016.

かつて関わった厚生労働科学研究費補助金(2009年度〜2011年度)による高齢者のがん研究のデータがNBDCヒトデータベースより公開されたと連絡をいただく。当初は生命科学系データベースアーカイブに、と提案したのが2年前。その後、一緒にやってきた担当者が亡くなるなど紆余曲折あったものの、データ公開の日を迎えて感無量です。

ヒトデータということで、データベースアーカイブに収めるのではなく、NBDCヒトデータベースでの制限公開という形になった。それでもメタデータはいつでも誰にでも見え、公共データベースの登録番号も付いた(hum0064)。NGSデータでなく、前世代な配列解析やマイクロアレイデータが主体のデータだったが、JGA(Japanese Genotype-phenotype Archive)にもきっちり入った模様(JGAS00000000061)。

データ公開を独自にするのではなく、NBDCヒトデータベースというしっかりした仕組みを使うことが出来て、本当助かった。何かあったら連絡下さい、と先方の引き継いだ担当者に言っておいたが、結局私は一度も手を下すことなく、データを持っている先方とNBDCとのやりとりだけでデータのアーカイブが実現された。こんなところでも、統合DBの取り組みのご利益が出てきている。関係者の皆様、ありがとうございました。

Continue reading »


trim_galoreでトリミングとQC

Written by bonohu in misc on 火 23 8月 2016.

トリミングしたうえでfastqcをかけてくれるソフトがこのtrim_galore。CutadaptとFastQCがすでにインストールされていることが必須(以下の使い方だと)。 singleの場合

[shell] trim_galore --fastqc --trim1 hoge.fq [/shell]

ペアエンドの場合

[shell] trim_galore --fastqc --trim1 --paired hoge_1.fq hoge_2.fq [/shell]

Continue reading »


1 week past rsyncing ArrayExpress data

Written by bonohu in misc on 金 19 8月 2016.

ArrayExpressのdataをrsync開始してから1週間。atlasディレクトリは終わったものの、残りの2つ、arrayとexperimentは終わらない。データ転送量的には、合計0.4Tbyteほどで、約44Tbyteと書かれている全体のデータからすると1/100ほど。ただ、全部ミラーしたらこの容量になるのかどうかも今のところわからず。続行する。

Continue reading »


Say good bye to our deer twitterer

Written by bonohu in misc on 日 14 8月 2016.

初めての山の日(8/11)、急逝した研究者仲間のtwittererの初盆に名古屋へ。同じ分野の研究者というわけでもなく、オフラインには学会オフ会に近くだからというので集まったぐらいの仲だが、twitter上では日常を見られている人たち。それも今は「研究者仲間」と呼んでいいのではないかな、と自己紹介する際に思った。

一緒に行った、やはり研究者仲間が終わってから曰く、

[楽しくなってよかった、と言い切りましょう。彼もまた楽しんでくれているだろう。これでいいのだ。](https://twitter.com/kun32xu/status/763746145390567426)

人はいつ死ぬかわからない。だからこそ、今を楽しくおもしろく生きていきたいね。結局この日は、ここまで遅くなることは無いだろう、と思いつつも取っておいた新幹線終電に。研究者twittererとの話は、本当尽きない。今年はオフ会企画に積極的にcommitしよう。

また、数日後にこんな風にも。

[先日の初盆で、きしめんさんのお父さんから健康に充分気をつけけて、とお言葉を頂きました。話を聞いて少しでも体に異変を感じたら忙しくてもすぐに病院に行く、家族や親戚の大病についてより多く把握して弱点を知っておく、大丈夫やろ的自己判断しない、などが大切だと思いました。生きましょうね。](https://twitter.com/kun32xu/status/764456136892293123)

個人的にはポケモンの聖地 …

Continue reading »


inodeの枯渇

Written by bonohu in misc on 土 13 8月 2016.

ストレージの容量は多くの場合ファイルサイズで問題になることが多いが、たくさんファイルを作るようなプログラムやデータベースを扱っているとファイルのinode数が問題になることがまれにある。その場合には、 [shell] df -i [/shell] とやってinode数をチェックする。普通 [shell] df -h [/shell] などでストレージの容量をチェックするのであるが、それと違うオプション指定でわかる。 もしストレージにまだ容量があるのに、ファイルシステムに新たにファイルが作れなくなっている場合、ひょっとしたらこれが原因かもしれません。

Continue reading »



「新米探偵、データ分析に挑む」を読んで

Written by bonohu in misc on 水 10 8月 2016.

[amazon template=thumbnail&asin=4797382309]

新米探偵本、ようやく通読。出てきたことが一度だけでなく、俵太のまとめと天羽社長の統計学指南で波状に複数回出てきて、大変わかり易い。コードの解説もまとめられてて、復習に便利。データがあらかじめダウンロード可能なようになっていて、再現も簡単だった。Rを使った統計解析入門本としてよいかと。

Continue reading »


TIBCO Spotfire アカデミックフリー化

Written by bonohu in misc on 火 09 8月 2016.

先日の沼津でのワークショップで伺った、嬉しいニュース。

アカデミアの方々などに無料でご利用頂けるようになりました。 TIBCO started free of charge Spotfire License. http://spotfire.tibco.com/better-world-donation-program/

本当かと思って、上記URLで出てくるフォームを埋めて送っていたが、返事なく。送ってから2週間以上経ち、さすがに忘れられたかと思い、もう一度送ってみると今度は一晩で返って来た。 「普通にtrialを申し込んで下さい、そしたら1年間にその期間を伸ばします」とのこと。 これでtrialで使うのではなく、正規にライセンスがいただけるように。 いきなりここから登録しなくても、まずは試してみてはいかがかと。ただMac版はないので、Parallels Desktop内で。なんといっても可視化が素晴らしい。

Continue reading »


bam2wig

Written by bonohu in misc on 木 28 7月 2016.

bam形式なリファレンスゲノムへのアラインメントの情報をwig形式のcoverageファイルへ変換。 実は昔もやったことがあり、ググって出てくるawkのワインライナーでなんとか凌いでいたが、今ネット検索するとbam2wigというコマンド化されたPerlスクリプトをgithubに発見。今回はこれを使ってみた。

[shell] git clone https://github.com/MikeAxtell/bam2wig [/shell]

でgithubからダウンロードしてきて、

[shell] ./bam2wig/bam2wig hoge.bam [/shell]

でhoge_bam2wigというディレクトリが作成され、その中にhoge.wigというファイル名でwigファイルが作成される模様。 ただ、何もオプションを付けないとゲノム全体を対象に計算がなされるので、時間がそれなりにかかる。そこで、限定した領域だけ計算する場合には-cオプションをつかって

[shell] ./bam2wig/bam2wig -c chr1:1-10000 hoge.bam [/shell]

のように実行すればよい模様。

コードを見る限り、前にもこのブログでも言及したsamtoolsがインストールされ、コマンドサーチパスにないと動かない模様。

wigに変換したデータはUCSC Genome BrowserやEnsembl Genome …

Continue reading »


'jPOST Workshop 2016 : プロテオームデータと生命科学データベース'

Written by bonohu in misc on 水 27 7月 2016.

東京白金台の北里大学薬学部にて、「ゲノムと遺伝子発現DBの現状ートランスオミクスのための基礎知識」というタイトルで、30分ほど話した。ワークショップの前座。

そのうち統合TVにアップされると思うが、とりいそぎfigshareからプレゼンを公開

Bono, Hidemasa (2016): ゲノムと遺伝子発現DBの現状ートランスオミクスのための基礎知識. figshare. https://dx.doi.org/10.6084/m9.figshare.3506273.v1 Retrieved: 06 47, Aug 01, 2016 (GMT)

Continue reading »


SPARQLthon46 day2

Written by bonohu in misc on 火 26 7月 2016.

昨日の続き。直で職場のサーバーにsshできないのはやはり不便だ。 やはり、1日経ってもファイルリストの取得、終わっていない…。定期的にrsyncするように早くしたい。が、昼前に終わったので、実体の取得を開始。仕込んでランチに。大雨だが、傘なしで死亡orz 帰還後、入力データをgithubにアップしてあるスクリプト群で作成して、ウェブサイトのデータをアップデート。ランキングは変わらず。が、2016年登録分だけみると、NGSがarrayをデータシリーズ数で抜いた模様。

Continue reading »


SPARQLthon46 day1

Written by bonohu in misc on 月 25 7月 2016.

今回はいつもと違い、DBCLSではなく新潟大学での開催ということで、RDFやSPARQLの入門的な講習会がほぼ1日開催された。こういうスタイルは新しいが、こういう形の地方行脚重要。 こちらはいつものハッカソンで、ネットワーク接続にちょっと手こずるも、あらかじめ仕込んでいたAOE更新用のindexの取得が失敗していた…orz。なぜかマシンが落ちてた模様。emobile回線に切り替え、VPN使ってログインし、USB HDをマウントして、再度開始する。

rsyncが使えるかどうか、 [shell] rsync rsync.ebi.ac.uk:: [/shell] というコマンドを実行して調べてみたところ、どうも使えるらしい。そこで、さらに継続してrsyncのオプションを調査。 例えば、ftp://ftp.ebi.ac.uk/pub/databases/arrayexpress/data/gxa/rdf/以下をcurrent directoryにrsyncしたい場合には、 [shell] rsync -av rsync://anonymous@rsync.ebi.ac.uk …

Continue reading »


SPARQLthon@新潟大学

Written by bonohu in misc on 日 24 7月 2016.

明日、明後日(2016/7/25-26)に、新潟大学にてSPAQRLthon開催(SPARQLthon46)。いつもの柏とは別の地域で開催することは、RDFの普及という意味で重要だと思う今日このごろ。そういった研究活動をしている研究者が居るところでしかできないのが難点。SPARQLthonに来るような、データベース統合化に関わっている研究者が日本全国に職を得て、普段から教育活動するようになってくれると良いのだが。今回は、まさにその実例として素晴らしい。地元の学生さんが多く参加されるようで、大変楽しみ。

Continue reading »


非モデル生物から新規モデル生物へ

Written by bonohu in misc on 土 23 7月 2016.

前職では、基礎と臨床を医学の研究をやろうということで、ノーベル賞を取った線虫(C.elegans)を使ったprogramed cell deathの研究が当時もてはやされていたこともあってそちら方面の可能性を探っていた(ちなみに、「きそ」と「りんしょう」の「いがく」の研究、ということで「きしょい」研究と銘打ってやっていたのだが、定着はしなかったようだ)。普段は土の中に潜っていて低酸素な環境に居るから良いモデルになるかも、ということで線虫を使った低酸素モデルでのトランスクリプトーム解析をマイクロアレイでやっていたものの、すでに先行研究があって別の系とのクロストークを探っていたのが10年前。 DBCLSに来てしばらくはDRY onlyだった。もちろん、データベースセンターなので、それが普通なのかもしれない。しかし、データベースの有用性を知ってもらうには、なによりも実際に使って上手くいった実例をあげていかないといけないと思うようになっていった。だが、単なるお手伝いではいけない。成し遂げるのに困難なのだが、バイオデータベースの専門家による手助けの恩恵が強い分野…これまでモデル生物とされてこなかった非モデル生物、もとい新規モデル生物におけるデータ解析研究ではなかろうか、と思うに至った。 その過程で、たまたま縁あって昆虫生化学者との共同研究が叶い、パーキンソン病モデルとしてカイコが使えるという論文を出し、さらにその続きの研究を今も進めている。 また、これまた縁あって癌や老化の新しいモデル生物として注目されているハダカデバネズミを使った研究にも関与している。ハダカデバネズミ由来のiPS細胞に関する研究の論文が出たところだが、それ以外の現象に対してもこの新規モデル生物でアプローチできないか、議論している。 それ以外にも要請あればいろいろとやっていきたいと思っている。自分の持っている研究できる時間は有限だけれども …

Continue reading »


アクセッション番号のバージョン

Written by bonohu in misc on 金 22 7月 2016.

データベース(DB)、とくに塩基配列DBは公共DBに登録しないと論文が受理されないこともあって、DBのアクセッション番号(ID)に関する認知度は高いようである。しかしながら、アクセッション番号のバージョンについては知られていないのではなかろうか? 例えば、論文を投稿する際にAB016471というアクセッション番号がついたとすると、バージョン付きのIDはAB016471.1となる。つまり.1の部分がバージョンの情報で、バージョンが上がるごとに.2、.3と変わっていくわけである。 一般的にはバージョンなしのAB016471でアクセッション番号としては流通することがおおく、この種のバージョン情報を一括で消したい場合もある。その場合に有効なのが以下のワンライナーで、一行ごとにアクセッション番号が書かれたファイルaccessions.txtに対して

[shell] perl -i~ -pe 's/.d+//' accessions.txt [/shell]

という処理をするとバージョン情報の部分を削り取ることができる。ちなみに、元のファイルはaccessions.txt~というファイル名となってバックアップされている。

Continue reading »


第16回日本スポットファイアーワークショップ(創薬研究領域)

Written by bonohu in misc on 木 21 7月 2016.

沼津でのSpotfireワークショップ2日目。今日は丸一日で、午前中はトレーニングセッション、午後はPKJ社セッションとJASPUGユーザーセッション。 自分は10年を超える長年のSpotfireユーザーではあるものの、典型的なユーザーと使い方が異なっている。昨日もSummary Tableの可視化が使えていない自分に気づくなどしたし。取りこぼしている機能が多々あるので、初心者向け体験会ということだったがトレーニングから参加。Trellisは活用していたものの、フィルタのウインドウの特定の部分をドロップしてTrellisが作れるようになっているのは全く知らなかった。それらしい機能があるのは知っていたものの使ったことがなかったCross Tableも便利だと気付かされたり。トレーニングを一通りやってみて、いろいろ得るものが多かった。 ユーザーセッションでは、大量に出てくるデータをどう見るか、それを考える姿勢に感銘を受けた。対象となるデータが違っても取り組む姿勢は大変参考になる。これまでの自分の普段のやり方で果たしていいのか、考えさせられた。もっと、自分が解析したデータを見て考えることに時間を取るべきですね。 Twitterのフォロワーさんが参加していたというのを終了してから知るなども。お会いできなかったのが大変心残り。Spotfireが広まってきたのか、この世界が狭いのか、果たして。次回の再会を楽しみに日々励もう。

Continue reading »


第15回日本スポットファイアーワークショップ(創薬研究領域)

Written by bonohu in misc on 水 20 7月 2016.

今年も沼津駅北口のプラザヴェルデで開催のスポットファイアーワークショップ。2日間開催の1日目は第15回ということで、MedChem(Medicinal Chemistry)な内容。2日目は第16回目で、バイオHCS(High Content Screening)編。 なぜMedChemな内容の1日目の今日に来たのか、訊かれたり。最近ではPubChemChEMBLがRDFでデータを提供していることもあり、本務のDB統合化でも化合物なデータの扱いも増えてきていて。かつてよりもずっと、いろんな意味で関係が深くなっている心持ちなのだが、参加者の人達にはそうとは思われていないんだろうか。そっち向けに統合DBの宣伝が足りないかもしれません。 SpotfireからNBDC/DBCLSで維持しているRDFデータの資産が直接利用できるようになるといいな、と妄想したり。

Continue reading »