国の機関サイトの5年残存率

Written by bonohu in misc on 火 11 4月 2017.

ショッキングな統計値を教えてもらった。国の機関サイトの残存率というもので、5年残存率は40% (2015年)というものである。つまり半分以上は5年経つと消えるということだ。 これは、国立国会図書館がインターネット資料収集保存事業として調べ続けているもので、他には保存した1万サイトの可視化というウェブ魚拓を取っているものもあってなかなかおもしろい。資料として、説明する際の拠り所として、役に立ちそう。

Continue reading »


Trinity実行時のFASTQヘッダ問題

Written by bonohu in misc on 月 10 4月 2017.

Trinityを実行する際にFASTQのヘッダが問題となる事例。以前から同様の事が起きており、その場合は、 [shell] bzcat file.fq.bz2 | awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' | awk '{if(NR%4==1) $0=sprintf("'"@${index}%d"'",(1+i++)); print;}' | bzip2 -c > file2.fq.bz2 [/shell] のようなコマンドでヘッダを書き換えしのいでいたが、これが今回効かず。

ちゃんとSRAからダウンロードしてきたFASTQファイルなのに、Trinityでエラーが出て先に進めないなんて、と思ってエラーメッセージを眺めていたら、

If your data come from SRA, be …

Continue reading »


諸行無常

Written by bonohu in misc on 日 09 4月 2017.

未来永劫続くプロジェクトやデータベースはないとはわかっていても、その継続を仮定してしまうのはなぜだろう。 調べ物をして知ったのだが、GDBというデータベースは、ヒトゲノム情報の集積場の「Genome Data Base」として作られていたのに、GDBは使われなくなり、なぜかカナダに行って、その後2008年には無くなっていたとか。 また、Ensemblは開始以来、European Bioinformatics InstituteとThe Wellcome Trust Sanger Instituteの共同プロジェクトだったのに、Sanger Instituteは2016年に共同をやめ、2017年の今は関わっていないとか。イギリスのEU離脱が関係しているのだろうか。 こういうふうに思うのは、日本人の国民性だろうか? 昨今の国際情勢からして、今後いろんなプロジェクトや重要なデータベースが続かなくなったときにどうすべきか、対策を考えていく必要があるだろうと思い巡らせたり。

Continue reading »


国立遺伝学研究所一般公開2017年

Written by bonohu in misc on 土 08 4月 2017.

DBCLSが三島の国立遺伝学研究所に移転した2014年から毎年の参加で、これで4回目。しかしながら、雨になったのは初めてと。 去年に引き続き、公開講演会の撮影補助。もちろん撮影にかかわる人的なコストはかかっているが、こういう形で所属ではないが普段お世話になっている宿主の研究所に貢献できるのはよいことだという認識。後に統合TVコンテンツの一つとなることだし。 それにしても今日の講演の最後でデバ(ハダカデバネズミ)の話が出てきたのはビックリした。そのネタで科研費の研究分担金も貰っている自分としては頑張って研究を進めねば、と襟を正した次第。頑張ります。

Continue reading »


遺伝研の論文 in Pubmed

Written by bonohu in misc on 金 07 4月 2017.

昨日のDBCLSの論文数の検索と同じことを遺伝研でやっていみると…。

https://www.ncbi.nlm.nih.gov/pubmed/?term=National+Institute+of+Genetics[ad]

遺伝研ほどヒット数が多いと、右上に年ごとのヒストグラムが出るようです。 I先生が書かれていたように、最近数年間でaffilicationの扱いが変わったのか、論文数が多くなっているように見える結果に。何れにせよ、この研究所はコンスタントに論文を出してきている研究力のあるところだというのは間違いないようです。

Continue reading »


DBCLS10年の論文数

Written by bonohu in misc on 木 06 4月 2017.

とあるtweetがきっかけで、所属としてDatabase Center for Life Science (DBCLS)が載っているPubmedエントリを抽出してみた。

https://www.ncbi.nlm.nih.gov/pubmed?term=Database+Center+for+Life+Science[ad]

というURLでリストされる。2017年4月6日現在43本あって、1本を除いてすべてOpen Accessという徹底ぶりは凄い。みなさん、さすが。E-utilsでの取得も同じように。

https://eutils.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?db=pubmed&term=Database+Center+for+Life+Science[ad]

最初の20件しか入ってないけど…。全件取るには工夫が要りそう …

Continue reading »


転写因子のChIP-seqデータの可視化

Written by bonohu in misc on 水 05 4月 2017.

まずはChIP-Atlasで調べる。目的の転写因子があれば、ラッキー。 ない場合は、"転写因子の遺伝子名"+"ChIP-seq"をqueryとしてNCBI GEOで検索。ヒットしてきたエントリを見ていって、ChIP-seqのデータがあるものを探す。FASTQ形式の生データに加えて、peak call後の解析済みデータ(多くの場合、bed形式)があればラッキーで、macs2などによる再計算不要。それをダウンロードする。圧縮は解かなくてもいい。 その場合、どのバージョンのゲノムに対して計算されたものかを原著論文にあたって調べる。そのバージョンのゲノムをUCSC Genome Browserで選択し、Custom trackとしてそのbedファイルをアップしてみると、ChIP-seqのpeakがゲノムブラウザ上に出現するように。

Continue reading »


Overleaf

Written by bonohu in misc on 火 04 4月 2017.

ふとtwitterのタイムラインを見た時に「オンラインLaTeXエディター“Overleaf”:論文投稿プロセスを変革する共同ライティングツール」という日本語論文が情報管理に掲載されたとその筆者のつぶやきが目に止まった。 論文タイトル通りOverleafというツールの紹介で、一言でいうと研究者版Google Docsという触れ込みに興味津々。さっそくアカウントを作ろうとするとTwitterやORCIDなどでログインできるではないか!!というわけで、ORCIDでログインすることで、あっという間にアカウントが作成できてしまった。 現在、Academic journalのテンプレートを使って今度投稿したい雑誌のそれを落としてきて使おうとしているところ。情報科学系な同僚はすでに使っていたらしく、無料で使える容量は少ないが便利だとのこと。 LaTeXは博士論文を書いて以来使っていないが、またこの機会にこのOverleafで使ってみようと決意。次の論文からではあるが。

Continue reading »


Data Authorship as an Incentive to Data Sharing

Written by bonohu in misc on 月 03 4月 2017.

The New England Journal of Medicine に掲載された論文(sounding board)、"Data Authorship as an Incentive to Data Sharing" doi:10.1056/NEJMsb1616595。 Data Sharing に関わる Incentive として Data Authorshipを、というわかりやすい考え方が Figure 1. Credit for Data Sharing and Tracing the Data Set にまとめられている。 データを出した人をrespectしつつ、それを再利用し、科学の発展を加速する。データを再利用することを推進し、自らも実践している自分にとって、とてもsupportiveな内容で、自分たちのやっていることを後押ししてくれている論文。 このFigure1はきっと、今後の発表でも多用することになるに違いない …

Continue reading »


春の嵐

Written by bonohu in misc on 日 02 4月 2017.

三島も4年目に突入。年度頭から締め切りに追われているが、ブレインストーミングに温泉インフォマティクス研究会単独開催。火の付いた仕事を効率よく進めるための頭の整理になったかと。あとはひたすらinput!

天気も荒れ模様に向かうようで、まさに春の嵐。ともに荒れて欲しくないが…。

なべて世の 風を治めよ 神の春

Continue reading »


パスワード付きzipファイルを作る

Written by bonohu in misc on 土 01 4月 2017.

個人情報保護ということで、電子メールで添付ファイルを送付する際もパスワードを付けて、と言われる時代に。早速、必要になったので調べた。

例えば、hoge.jpgというイメージファイルを送る際には、まずzipファイル(hoge.zip)を作成して、zipcloakというコメンドでパスワードが必要な処理をすれば良いらしい。 [shell] zip hoge.zip hoge.jpg zipcloak hoge.zip [/shell] ググって上位に出てきたこのサイトを参考にした。

実は、zipコマンドの-eオプションを使えば1コマンドで済むらしい。 [shell] zip -e hoge.zip hoge.jpg [/shell] 上記のサイトを見て、さらにディレクトリ単位で、と思って検索してて見つけたこのサイトに書いてあることを参考にした。

パスワードを付けたzipファイルは、付ける前と同じファイル名なので、ちゃんとパスワードが付いているか、確認したほうが良いのはいうまでもないだろう。

また、ファイルが複数ある場合はディレクトリ(フォルダ)を作成してそこに置いてzipファイルにしてからzipcloakを実行すればよい。hogedというディレクトリ以下のファイルをzipで固めてパスワードを付ける例。 [shell …

Continue reading »


2017年第1四半期終了

Written by bonohu in misc on 金 31 3月 2017.

2017年も三ヶ月が終了した。その実感はやはりない。あっという間に終わってしまった感。 本務の共同研究に関わる打合せが多かった他、科研費の研究打合せやその他の用務で呼ばれていく出張が多かった。 結果として、出張による外泊数が18泊と海外出張がこの期間中一回もなかったにもかかわらず、1週間強の海外出張があった昨年(16泊)に比べて多い。このペースでは、今年も過去最多だった昨年より多くなり、記録更新しそうな悪寒。

そして、この2年半の間、同じ建物の別のフロアーで仕事されていたY先生が退職の挨拶に。理研時代に一緒のプロジェクトをやらせていただいたり、三島に来てからはとくにお世話になりました。これからも頑張ってと言われて、身の引き締まる思いというのはこういうことか、と思った次第。より使われるバイオリソースを目指して全力で取り組んでいきます。

Continue reading »


深くゆっくり考えよう

Written by bonohu in misc on 木 30 3月 2017.

twitterのRT(ReTweet)で流れてきたとあるつぶやきにハッとする。

日中の仕事の大半が事務仕事を含む細々したルーチンワークになる場合、頭の働き方が仕事を短時間でさばくモードになってしまう。このモードになると、物事を深くゆっくり考えられなくなる

自分の場合、そこまでルーチンワークではない(と自分は思っている)ものの、短時間でさっさとさばいてしまい、物事をゆっくり深く考えていない自分に心当たり。深くゆっくり考えられるよう、自分を仕向けねば。

Continue reading »


第61回日本応用動物昆虫学会大会3日目

Written by bonohu in misc on 水 29 3月 2017.

最終日。この日も朝からガッツリ口頭発表を聞く。その間に昨晩の仮説の検証を試みるも…。不審感だけが残る。 この日は自分の研究も含んだ発表もあり、どういった反応が来るか楽しみだったが、それほど深く突っ込んだものではなくて少々肩すかし。来年度も話させてもらえるようなネタをこの一年かけて作ってこようと思った次第。

意外にここ(ぼうのブログ)を見ている人がいることに勇気づけられる(ただし、n=1)。単なるやったことメモ+雑文なんだが。

ちょうど、昨日見学したばかりの東京農工大学科学博物館で学んだ遠藤先生のニュースがその日に流れていたり。

[「ガードナー賞に東京農工大の遠藤章氏 『スタチン』発見」](http://www.asahi.com/articles/ASK3X7D8TK3XULBJ01F.html)

ノーベル賞とれますかね?

Continue reading »


第61回日本応用動物昆虫学会大会2日目

Written by bonohu in misc on 火 28 3月 2017.

2日目は朝から夕方まで口頭発表。主に生理学・生化学方面を聞く。 お昼を挟んで、ポスター発表。その合間に何回か共同研究打合せ。 そして、日が暮れてからは、同業種交流会。そういった会ならではのオフラインな情報を仕入れることが出来て、大変満足。帰ったら早速我が仮説の検証をしてみたい。

Continue reading »


第61回日本応用動物昆虫学会大会1日目

Written by bonohu in misc on 月 27 3月 2017.

アウェーの学会大会参加。のはずが、会場に着くなり知り合いに会うなど。 そこでの議論で、来年度の講習会をどうやっていくか、そのやり方に関して考えさせられた。ぶっちゃけ、すでに統合TVにコンテンツも多く蓄積しているので、それを見てもらえばそれでいいわけで。face-to-faceのハンズオンでしか出来ないことをやるべきだろうな、理想的には。 午後はシンポジウム。まだまだ、生物システムを我々は知り尽くしてない。決めつけはキケン、ということを学び取ったつもり。 懇親会にもかなり多くの人が参加していて驚かされる。そこで、pre-twitter時代にブログで交流の会った方に再会(リアルには初顔合わせ)。本当、この業界、狭いわ。

Continue reading »


日本生物工学会誌連載4回目「塩基配列データベースの現状とその有効活用方法」掲載

Written by bonohu in misc on 日 26 3月 2017.

日本生物工学会誌「バイオインフォマティクスを使い尽くす秘訣教えます!」という連載を開始してからはや半年。とはいえ、2ヶ月に1回のペースだから、まだ3回しか公開されていないのだが。これまでの内容は以下の通り。

  1. 「ウェブ上に散在する情報を生命科学研究にどう役立てるか」

  2. 「AllieとColilの使い方―PubMed/MEDLINEから効率よく情報を抽出する日本発のサービス―」

  3. 「DBCLSが提供する日本語コンテンツ」

2,3回目とDBCLSが提供するサービスの紹介が続いたが、4回目の今回は、塩基配列データベースに関する話題。DBCLSの塩基配列関連ツール紹介はすでに日本語の総説も多数あるので、今回はDNA Data Bank of Japan (DDBJ)中村保一さんと共著で、「塩基配列データベースの現状とその有効活用方法」と題して塩基配列データベースへのデータ登録とその利用の両側面から塩基配列データベースを紹介させてもらった。30年もの歴史のある塩基配列データベースなので、本当はいろいろと書きたいことあったのだが、敢えて短くまとめた。詳しくはウェブ上のリソースで調べてもらうことを願って。

シリーズとしてはあと3回あるので、そちらも乞うご期待。

Continue reading »


説明会、その後

Written by bonohu in misc on 金 24 3月 2017.

説明会。この種のそれは約十年勤めてきて初めて。わかったことは、現状今後のことはよくわからないということ。 終了後、雰囲気が悪くなる。実は、自分は楽観的なんだな、と感じたり。 もちろん、やるべきことは頑張ってやっていくつもりだが、それ以外にもっと戦略的にしないといけないことがあるような気がした。

あしたは どっちだ

Continue reading »


命の洗濯

Written by bonohu in misc on 木 23 3月 2017.

有給休暇扱いにして、ホームワーク。所属はしていないが勤務先のある研究所で開催される公開セミナーを聞きに職場へ。今流行りのゲノム編集のそれだったが、やはり出てきた大量データ処理なくしては到達不可能な内容であった。 終了後、早めに出て近くの日帰り温泉施設に。長らく行っていなかったが、近くていい施設であることを再認識。また来よう。その帰りに、これまで行ったことないスーパーで買い物など。 非日常を経験することで、変化をつけて気分転換。大事なことかと。

Continue reading »


csvlookが使えない

Written by bonohu in misc on 月 20 3月 2017.

ある日、タブ区切りのデータを人に見せる必要があって、csvlookを使おうとしたら

zsh: /usr/local/bin/csvlook: bad interpreter: /usr/local/opt/python3/bin/python3.5: no such file or directory

というエラーが出て使えず。しょうがないのでその場は普通にlessで見せたが、その後原因究明を。 どうも、homebrewで入れたpythonのバージョンが上がったために(3.5から3.6に)、このエラーが出ているらしい。pythonはhomebrewで管理している一方で、csvlookはcsvkitの一部で、pipで管理されているツールである。そこで一度uninstallして再度installする戦略で。 [shell] pip3 uninstall csvkit pip3 install csvkit [/shell] しかしながら、

PermissionError: [Errno 13] Permission denied: '/usr …

Continue reading »


JST OPERA「ゲノム編集による革新的な有用細胞・生物作成技術の創出」キックオフシンポジウム

Written by bonohu in misc on 金 17 3月 2017.

JST産学共創プラットフォーム共同研究推進プログラム(OPERA)研究領域 「ゲノム編集による革新的な有用細胞・生物作成技術の創出」キックオフ・シンポジウムに呼んでいただき、「ゲノム編集におけるビッグデータ活用」と題して話しさせてもらった。 私の話に関しても、この研究課題でやっていると思われた感。本務専念義務がある以上、大学の運営費交付金が本給の財源である(普通の)大学教員と同じというわけにはいかず、この種の活動には参加できないということが理解されていないのかも。 それにしても、こういう技術開発する人は、データアーカイブということに興味ないのでしょうか?もしそうだとしたら、懇親会でお話したJSTの副理事の方と話題になったように、やはり公的資金を使って行った研究のデータアーカイブへの登録をもっと強力に推進していく必要があるかと。

Continue reading »



SPARQLthon54

Written by bonohu in misc on 月 13 3月 2017.

三島開催。だが、急用で1日目だけの参加。 引き続き、ArrayExpressにない、RNA-seqデータを回収する件。ArrayExpressのデータと同じようにTitle行をどう取得するか、悩みどころ。いろいろな不具合が見つかってバグ出しには貢献したものの、解決までは至らず。基本、論文があればそのTitle、なければBioProjectのデータといったところか。実装にはもうちょっと精査が必要。

Continue reading »


なんでブログやSNSをやっているのか?

Written by bonohu in misc on 日 12 3月 2017.

ブログを始めたのっていつからだろう?と考え込むぐらい日常的にブログを書いたり、他人のそれを読んだりな自分だが、どうも自宅に常時ネット接続できるサーバーを設置した2003年頃からではないかと。 tdiaryをそこにインストールして、コンテンツを発信するのがカ・イ・カ・ンだった。当時、コンテンツを発信するCMS(Contents Management System)として、一番手軽な手段がブログだったような。そこにmixiやはてなブログなどが時期を同じくして出てきて、そっちを使っていた時期もあったけど、結局また自宅サーバーのブログに戻ってきてしまった。もっとも今使っているWordPressは攻撃の対象となりやすいので、次のCMSを検討しないといけないフェーズにきているものの。 ネット上に晒すことがとくに怖くない時代に始めたからか、ブログでいろいろ情報発信することで人とあった時の話題になったり、さらなる技術情報を教えてくれる人が居たり、いろいろあった。もちろん、いいことばかりでなく、嫌なこともあったが。今は主にデータ解析に必要だったコマンドやツールの備忘録、まさにログとして未来の自分が情報検索で困らないようにやっているところもあるかと。それも今後、時代とともにまたいろいろ変わっていくんだろうけど。 また、「書きとどめよ 議論したことは風の中に吹き飛ばしてはいけない」というガリレオ・ガリレイの言葉の下に、職場に来てくれていたRA(Research Assistant)さんたちにもやったことをブログとして残していくことをお願いしていた。今でもググっているとその頃の彼らのブログに行き当たることがままある。やはり、書き残すことは重要だ。

Continue reading »


丸6年経った今日

Written by bonohu in misc on 土 11 3月 2017.

黙祷。もう6年、つまり小学校を卒業するだけの年数が経ってしまったと考えると、本当に時が経つのは早いという印象。 あの時朝食のパンが買えなくなって、朝食に御飯を炊くように生活習慣が変わったのを思い出した。急に来た停電の際に、懐中電灯にコンビニ袋かぶせてランタンがわりにしたこともあったな。 また大きな地震はいつかどこかで起こるだろうし、そういった時のために日持ちのする食料を備蓄しておくとか懐中電灯を準備しておくとか、日頃から備えることは忘れずに継続していきたい。備えよ常に。

Continue reading »


あの頃の未来

Written by bonohu in misc on 金 10 3月 2017.

26年前の今日(1991/3/10)、大学の合格発表だった。その時から画一的な評価基準を離れ、好き勝手にやってきたわけだが。曲がりなりにも研究者として生きている「あの頃の未来」になっているのは、夢の実現と言って良いのではないだろうか。それだけに飽き足らないのは、「研究者」の性分なのだろうけれども。ここのところ、向いていない職についたかと絶望する機会も多かったが、実は向いていたのかもしれない。

Continue reading »


足元を見られる

Written by bonohu in misc on 木 09 3月 2017.

来週の講演に向けて、外行きの靴を買いに。まったくないわけではないが、良い機会なので。「足元を見られる」という話を、親父は祖父より言われていたという話を聞かされてきたが、これまではそんなのは関係ないと思ってきたものの。歳を重ねてきて、たしかにそういうところはあるなあ、と実感を持ったが故に。もちろん、中身が重要なのは言うまでもないが、見た目もきっちりしておかなければならない。とんがっているだけだった自分も、大分歳を取りました。

Continue reading »


もっと並列に!

Written by bonohu in misc on 水 08 3月 2017.

多数のプロジェクトをかかえ、それぞれにさまざまな進捗状況になるのは当たり前。それをうまく並列に御して業績を出していくことは、数え切れないほどのプロジェクトをかかえてしまったFANTOM2の共同研究の時に身に着けた技なのかもしれない。それを並列にこなしているつもりでいたが、そうではなかった。自分にとって思い入れのあるプロジェクトであってもそのone of themであり、それにかかりっきりになってしまうと他が止まってしまうということを、それが一段落して認識した今日。それではダメだ。もっと並列度を上げていかねばならない。そう、すべての関わっているプロジェクトに優劣をつけず、取り組んでいかねば。

Continue reading »


三人寄れば文殊の知恵

Written by bonohu in misc on 火 07 3月 2017.

お世話になっている研究所内部の共同研究プロジェクト打合せ。今回、痛感したのは、

  1. 公共DBに関する正確な知識のアップデートの重要性

  2. 研究者間でのデータ共有の仕組みの必要性

とくに、某所で某プロジェクトに関わる人達でのデータ共有の仕組みを作ろうとしていることは、実はとっても大事なことを身をもって知ることに。いつもと同じ結論だが、データ利用現場との意見交換や議論はとても大事なことを再確認した。

Continue reading »


共同研究打合せ@広島大学原爆放射線医科学研究所

Written by bonohu in misc on 金 03 3月 2017.

2017年3月2-3日は、広島大学原爆放射線医科学研究所の放射線災害・医科学研究拠点の共同研究打合せに広島大学霞キャンパスへ。いろいろと多岐に渡って情報交換を行い、お互いに有意義だったのではないかと。私から最近のオープンサイエンスをめぐる動向などを紹介。それ以外にも、アカデミックフリーとなったTIBCO Spotfireのそれは時間をとって私なりの使い方を披露するなど。 次回には、DBのメタな解析から出てきたデータ解析結果を検討する場としたい。やったことは確実に、目に見える形に。

Continue reading »