Genomic Expression Archive (GEA) に登録してみた
DDBJがメンテナンスから戻ってきた。
メンテナンスの前に投げてあった遺伝子発現データのアーカイブ、Genomic Expression Archive (GEA) から正式にアクセッション番号が発行されて戻ってきた。
これまでSequence Read Archive (SRA; DDBJではDRAともいうが) にすでに登録しているのであれば、それほど大変な手続きではない。
すでに登録したDRAの番号を入れれば、多くの情報が自動でGEAに書いてもらえるし、ヒトやマウスなどメジャーな実験動物をやっている場合は特に手間は少ないかと。
メタデータもSRAよりはサンプルやRNAの抽出方法など少々詳しく書かないといけないところはあるものの、それほど大変な分量ではなかった。
発現定量値のファイルフォーマットも特に決まっているわけでないようだし。
ここの定量結果を別々のファイルにしてもいいし、それらをまとめてexpression matrixにしてもいいし。
ただ、それらのファイルのMD5をメタデータとしてカラム中にそれを書いて登録しないといけないというのはさすがに気がつかなかったが。
SRAに配列は登録したものの …
Continue reading »
ぼうのブログ引越し
新しく買ったMacMini2018にサーバー移行作業。
基本、
にして手元のマシンから。
ブログコンテンツの引越しがメイン。
やったことは以下のような感じ。
SSHの設定
リモートログイン(ssh
)を手軽に使うために、公開認証鍵を作成。
# ssh-keygenの実行
ssh-keygen -t rsa -b 4096
ホームディレクトリ以下の.ssh
ディレクトリに出来たid_rsa.pub
ファイルの中身を、リモートマシンのホームディレクトリ以下の.ssh
ディレクトリにあるauthorized_keys
というファイルに書き込む。
そのファイルがなければ作成する。
すでにそのファイルがあれば、追記(1行1エントリ)。
その際気をつけるのが、そのファイルは自分しか見えないようにパーミッションを変更すること。
# chmod でauthorized_keysファイルのパーミッション変更
chmod 600 ~/.ssh/authorized_keys
ウェブサーバーを自動起動に
Apacheは最初からインストールされているので、
システムの起動と同時に自動でそうなるように。
# apacheを自動起動するように
sudo launchctl …
Continue reading »
PLOS ONE
昨日のエントリで紹介した本「なぜ科学はストーリーを必要としているのか」 のp266には、馴染みの深い論文誌PLOS ONE に関しても言及されている。
プロスワンの編集者たちの基本理念は、掲載論文を「研究の意義(significance)よりも健全・安定性(soundness)」に基づいて受理するというものだ。
その後にある程度はうまくいっている、という研究者のコメントが続いている。「重要性」に基づいて採用されるNature, Scienceとの対比で。
出す側としては意義があると思って出しているんだけどね…。
Continue reading »
なぜ科学はストーリーを必要としているのか
2018/11/10-11/14に参加したアメリカ昆虫学会の年会 。
そのkeynote speech speaker、Randy Olsonさんの著作、やっと完読。
研究者は学会発表のための抄録をはじめとして文章を頻繁に書き、読む人に自分の発見や考えを伝える必要がある。
それらの書き方は場数を踏んで自然と身につけてきている。
現在では、論文に関してはIntroduction,Method,Result and Discussion (IMRAD )という文章構成がほぼ使われるようになっている。
しかし、事実だけを列挙する文章や、否定語で流れを振り回す文章が散見されるのが実態で、その専門家であるおかげでなんとか言いたいことが伝わっているのが現状であろう。
そこで、And-But-Thereforeで文章を組み立て、「ストーリー」を作るABT が本書で提唱され、それを中心とした詳細が説かれている。
単純な私は早速これに影響されて、日常的な書き物をはじめとしてこのぼうのブログを書く際にも意識するようになっている。
ABTに関する記述だけかと思ったが、それは広く科学コミュニケーションに関する話題にまで波及していた。
ちょっと考えればその通りなのだが、科学者にとっては予算獲得にもかかわり、とても大事なことである。
また、「ストーリーを作る」ということに対する反論もバッチリ書かれていて、一読に値するかと。
日本語に翻訳をしていただき、ありがとうございました。
気になった部分をいくつか。
p297真ん中あたり
四六歳位なってからやるよりは …
Continue reading »
2019年の計
あけましておめでとうございます。本年もよろしくお願いします。
年頭恒例にしているその年の計。「2019年、かくありたい」
公共遺伝子発現DB目次 の論文化
プレプリント(BioRxiv)にアップした公共DBのメタ解析研究 のデータ更新、そして査読論文化
それらを利用した研究を各方面で進め、グラントを獲得できるように
さらにSNSに割く時間を減らし、情報発信を英語と日本語の両方で
Continue reading »
2018年を振り返って
年頭に書いた「2018年、かくありたい」 に沿って、2018年の活動を振り返ってみたい。
引き続き、ずっと取り組んでいるメインの仕事、公共DBの全レコードを対象としたデータ解析研究に力を注ぎ、懸案の仕事を論文化したい。
公共DBのメタ解析に関しては長年やってきたことをbioRxivにプレプリントとして2月にアップできた。
さらに関西医科大学 広田喜一さんとの共同研究の論文も1本プレプリントにアップされている。
In renal cell carcinoma, cancerous phenotypes linked to hypoxia-inducible factors are insensitive to the volatile anesthetic isoflurane https://doi.org/10.1101/375311
それ以外にも …
Continue reading »
2018年出張外泊数
三島勤務になって以来、ここ5年数えて来た「仕事で外泊」した日数。2018年の日数が確定。
その結果、2018年は83泊 で昨年より6泊増えて、さらに悪化。
年
泊数
2017
77
2016
77
2015
65
2014
50
今年も努めて抑制するようにして来たのだが、逆に増加してしまったという結果。
Continue reading »
農研機構 農業情報研究センター
農研機構に2018年10月にできた ばかりの農業情報研究センター を訪問。
内閣府や内閣総理大臣官邸が眼の前という凄い立地。
「NBDC/DBCLSにおけるデータベース統合化とその活用事例」 と題した講演を1時間半ほどさせていただく。
まだ先方specificに何もしていないのだが、統合TVに対する感謝の言葉をいただくなど。
それ以外にも積極的な質問やコメントを数多くいただき。
今後に乞うご期待。
Continue reading »
よくわかるバイオインフォマティクス入門
関西学院大学の藤博幸先生編集による「よくわかるバイオインフォマティクス入門」 を買った。
藤先生自身は分担執筆されていないようだが…。
というのは、11章を同僚が担当し、「データベース」について書いており、その中身に興味があったから。
これは直接的な理由で、1章「配列解析」に関してどういったアプローチでその話を始められているかにも興味があり、岩部先生さすがだなと。
また、5章「NGSデータ概論」と7章「トランスクリプトーム解析」は、かつて理研時代の同僚でもある東大の門田幸二 先生が書かれており、素晴らしい仕上がり。今後のリファレンスとして重宝するのは間違いなかろう。
さらに、自分が手薄な分野に関して、その道の専門家がきっちりとした内容で書かれているので、そこもしっかりと読ませてもらって勉強したい。
見た目にしても、中身に関しても、Dr.Bonoの生命科学データ解析(Bono本) とは毛色の違う構成になっており、こちらの方がよりadvancedな(踏み込んだ)、専門的な内容となっている。
6章「ゲノム解析」の参考文献にかつて監訳した「ゲノミクス」 が挙げられていたり。
蛇足だが、多くの章で次世代シークエンサーDRY解析教本(DRY本) が参考文献として挙げていただいていたのは嬉しかった …
Continue reading »
2018年忘年会
早いもので、忘年会が行われれる、もうそんな季節に。
隣のセンターの長の交代や統合牧場第三のチルドレンの加入など、2018年に起きたさまざまな変化を振り返り、今後どうしていくべきか、考えさせられるいい機会であった。
来年2019年は攻めに出ないといけないかもしれない。
Continue reading »
Biohack18 6日目
午前は今回やったことをdocumentathon。
個人的にはAOE関係でやろうと思っていたことが他のプロジェクトとの兼ね合いで進めれなかったものの、CWLで書くことを教わるということで別の形で自分のプロジェクトを進めることができた。
また、oec014さんが主に進めてくれたCellFishing.jlの件も、これまでスタックしていた案件が今後につながる形で再起動できた感。
終わってみれば、これまでにないレベルでやりがいのある、かつとても実りのあるBioHackathonだった。
教えていただいた側にとっても適用事例の1つとして認識してもらったようで、お互いにとって良かったなと。
これこそがBioHackathonの醍醐味なのだろう。
そして、片付け。みんなでやれば早く終わるという当然の理。
最後は、山陰ひとり旅。
Continue reading »
Biohack18 5日目
この5日間でやり散らしたことをwrap-up。
結果として、AOEのCommon Workflow Language化がメインとなった今回。
Continue reading »
Biohack18 4日目
AOEのCWL化に取り組む(CWLizationと呼んでる)。
CommandLineToolを2つ組み合わせて、1つのWorkFlowとした単純なものから。
色々なトラップがあったものの、プロフェッショナルの多大なる助言をいただいて、動くようになった。
GitHubにアップロード してあるので、自動的に可視化できた 。
そして、いくつかのWorkflowを見直し、同じようなことをしているスクリプトに関して引数を変えるだけで動くように。
今回のCWLizationは、見直しするいい機会になっている。
Continue reading »
Biohack18 3日目
ようやく、Common Workflow Language(CWL)でAOEのindex作成ワークフローを書いてみる。
ネットワークづたいにデータを取ってくるからか、cwlファイルはvalidであっても、コケる。
発現類似性検索プロジェクトの方も、テストデータに対しては動くが、自分でloom形式のファイルを作ってやるとエラーでコケる。
うまくいかないもんだな。
しかし、かつて統合TV黎明期に動画を作成して多大な貢献をしてくれた方と再会。
そのかたが作ってくれた「パワーポイントの図形描画機能でイラストをつくる方法」 は直近の1年において統合TVの動画再生数ランキング 2位というスーパーコンテンツ。
もう7年も前のコンテンツなのに。
人との繋がり、そして継続してやることの大事さを再確認した次第。
その功績を讃え、手持ちの統合TV本こと、「生命科学データベース・ウェブツール 図解と動画で使い方がわかる!研究がはかどる定番18選」 にサインして献本するなど。
いやしかし。初日にT先生が言っていたことと見事にかぶったな…。
Continuation is power
Continue reading »
Biohack18 2日目
Common Workflow Language(CWL)でAOEのindex作成ワークフローを書き直したいとふと思って、取り組む。
cwltool が入らず。typing
が入らないというエラーだったため、一度消去した上でpipで入れ直したり。
テストコードは動くようになったので、いよいよ本格的に、というところでタイムアップ。
裏で、AOEの更新のためのArrayExpressデータのmirrorスクリプト改変。GEOのデータはもう更新されないだろうから、そこをskipするように。
Continue reading »
Biohack18 1日目
会場は引き続き、松江のホテル、バイオハッカソン開始。
AOE周りのやるべき項目をまず、リストアップ。
SRAのRNA-seq取り込み周りは、他との兼ね合いで後回しに。
そこで、CellFishing を手元のマシンに入れ直そうとするが、エラーが出て入らず…。
しょうがないので、研究室のマシンでやることにする。
AOEのAPIに関しても訊かれたので、それもやらねば、というところ。
Continue reading »
Biohackathon2018 シンポジウム
今年は松江で開催のBiohackthon。
しかし電車が人身事後で3時間ほど遅延して、大遅刻。
YouTube Live発信でネット参加しつつ、午後からシンポジウム 会場へ。
自分の発表は午後からで間に合った。
発表は去年に引き続き、Lightning talkの5分間でAOE 周りを紹介。
Continue reading »
がん免疫療法の誕生 科学者25人の物語
ふとしたキッカケから、「がん免疫療法の誕生 科学者25人の物語」 を献本いただいた。
この本を翻訳するかどうか、という時に出版社から相談を受けて意見したということなのだが、その時はまだ本庶佑先生がノーベル賞を取られる前。
だが、がん免疫療法に関する業界の注目度は高く、検討されているのなら翻訳されたらいいのでは、と軽い気持ちで意見したのが約8ヶ月前。
だが、現在の事態を予測できていたわけでは決してない。
10月頭の今年のノーベル生理学医学賞の発表を受け、急いで本を出されたのだろう。
その脚力には、(統合TV本 に関してもだが)本当恐れ入る。
本を受け取ったばかりで、まだまえがきぐらいしか読んでないので、一通り読んだら読書感想文をここにアップしたい。
そして本日(2018年12月7日)は、授賞式当日。
本庶先生、おめでとうございます!!
日本で研究している生命科学研究者として、誇りに思います。
Continue reading »
第41回日本分子生物学会年会を終えて
今年も日本分子生物学会年会(分生) が終わった。
例年通り、NBDC/DBCLSはブース出展、今年も日本で生命科学分野のDBをやっている関係各所が一堂に会するBioDBコーナー の一部で展示会/ポスター会場の一角にて。
データ解析よろず相談 待機をしていたが、いる時にはほぼ相談もなく。
また今年もワークショップ(2PW1-15 いかにして公共データベースを生命科学研究に活用するか? )のオーガナイザーを務めた。2日目の午後の時間帯で、 昨日のエントリ にも書いた通り、予想をはるかに上回る参加者に参加いただいた。
関心が高まっているのか、それとも年会が関東開催で、開催した時間帯も良かったせいなのか。
それはわからないが、とにかくたくさんの人に公共データベースを活用することに関して話を聞いてもらえたのは、純粋にとてもよかったと。
調べてみると、2009年の第32回日本分子生物学会年会にて中村保一さんと共に初めてワークショップ「ウェット研究者が情報技術的に自立するために:統合データベースプロジェクトからの提案」 をオーガナイズしてから、毎年ワークショップを提案してきた。
それももう10年ほど続けていることになる。
もちろん採用されなかった年もあるが。
VIDEO
しかし、いつまでもだらだらと続けるのもよろしくないし、有志で企画してきた統合DB関係ワークショップは一度止めてみようかと。
誤解があるといけないので蛇足ながら書き加えると、統合DB関係のワークショップがまったく無くなるのではない。
バイオサイエンスデータベースセンター(NBDC)が企画するワークショップ が開催されるようになってきたので、来年以降は自分は企画しない、単にそれだけである。
今後は …
Continue reading »
第41回日本分子生物学会年会3日目
本日11月30日(金)で、最終日の3日目。
昨日はオーガナイズしたワークショップ、2PW1-15 いかにして公共データベースを生命科学研究に活用するか? が行われた。
これまでになく多くの方に参加いただいた。
その証拠に、パンフレットは200部用意してもらったが、始まる前にそれはなくなり、50部追加してもらったが、それも全部はけた。
つまり250人以上は来ていた、ということで、公共データベース利活用への関心の高まりを再確認。
日本で生命科学分野のDBをやっている関係各所が一堂に会するBioDBコーナー にてNBDC/DBCLSもブース出展しており、これも今日まで。
提供しているサービスの紹介とデモのほか、データ解析よろず相談 をやっており、今日も基本その近くで待機する予定。
また、監修した本「生命科学データベース・ウェブツール 図解と動画で使い方がわかる!研究がはかどる定番18選」 の先行発売も本日午後3時半まで。
ここを見たといえば、買った本にサインしますので。
Continue reading »
第41回日本分子生物学会年会2日目
本日11月29日(木)、2日目。
今年も日本で生命科学分野のDBをやっている関係各所が一堂に会するBioDBコーナー を展示会/ポスター会場の一角にてやっており、NBDC/DBCLSもブース出展しております。
提供しているサービスの紹介とデモのほか、データ解析よろず相談 をやっており、今日も基本その近くで待機しているかと。
ただ本日は、DBCLSニュースにも出していただいた ように、15:45-17:15に第15会場(5階 501)にて、2PW1-15 いかにして公共データベースを生命科学研究に活用するか? と題したワークショップのオーガナイザーを務めます。その概要は以下の通り。
オープンデータ、オープンサイエンスの潮流の中、生命科学研究における公共データベース(DB)は自らのデータを発表する場所としての役割も担うようになってきており、それらをいかに活用するかが研究をうまく進める鍵になってきている。そこで、どのように有用なDBを利用・維持していけばよいのかを実際にうまく利用している研究者やデータベースの運用に関わる研究者を交えて議論する場としたい。
監修した本「生命科学データベース・ウェブツール 図解と動画で使い方がわかる!研究がはかどる定番18選」 が先行発売中。
ここを見たといえば、買った本にサインしますので、気軽にお申し付けください。
Continue reading »
第41回日本分子生物学会年会1日目
本日2018年11月28日より、今年の日本分子生物学会年会(分生) 。
そして、自らの執筆し、監修した本「生命科学データベース・ウェブツール 図解と動画で使い方がわかる!研究がはかどる定番18選」 が先行発売、そして今日の12:00-13:00にサイン会 が展示場 書籍売場 [B06] メディカル・サイエンス・インターナショナル(MEDSi)の書籍ブース行われます。
午後のポスター時間帯は、ディスカッサーというポスター発表を盛り上げるボランティアとしてポスター会場にいるのではないかと。
そして、それ以外の時間帯は、NBDC/DBCLSの出展ブースに。
日本で生命科学分野のDBをやっている関係各所が一堂に会するBioDBコーナー が展示会/ポスター会場の一角にて、今年も特別企画としてあるのだ。
提供しているサービスの紹介とデモのほか、データ解析よろず相談 をやってますので、参加される方はぜひお立ち寄りを。
ただ、当方人見知りなので初対面の方には素っ気ないかもしれませんが、何卒ご容赦のほどを。
Continue reading »
第41回日本分子生物学会年会0日目
いよいよ今年の日本分子生物学会年会(分生) が明日2018年11月28日から。
例年通り、NBDC/DBCLSはブース出展、今年も日本で生命科学分野のDBをやっている関係各所が一堂に会するBioDBコーナー の一部で展示会/ポスター会場の一角にて。
提供しているサービスの紹介とデモのほか、データ解析よろず相談 をやっており、年会中は基本そこに居るはず。
また、年会会場にても、DBCLSニュースにも出していただいた ように、2日目の11月29日(木) 15:45-17:15に第15会場(5階 501)にて、2PW1-15 いかにして公共データベースを生命科学研究に活用するか? と題したワークショップのオーガナイザーを務めます。その概要は以下の通り。
オープンデータ、オープンサイエンスの潮流の中、生命科学研究における公共データベース(DB)は自らのデータを発表する場所としての役割も担うようになってきており、それらをいかに活用するかが研究をうまく進める鍵になってきている。そこで、どのように有用なDBを利用・維持していけばよいのかを実際にうまく利用している研究者やデータベースの運用に関わる研究者を交えて議論する場としたい。
参加される方はぜひお目にかかりましょう。
ただ、当方人見知りなので初対面の方には素っ気ないかもしれませんが、何卒ご容赦のほどを。
あと、私事ですが、監修した本「生命科学データベース・ウェブツール …
Continue reading »
機能改変昆虫の産業利用の可能性
農研機構の生物機能利用研究部門主催シンポジウム「機能改変昆虫の産業利用の可能性」 に参加。
秋葉原駅直結のUDX6階の会議室 で、交通の便も良く、あとで聞いたところ場所の割には高くないらしく。
タイトルの通り、ゲノム編集ネタだらけ。
狙いは産業界に向けた情報提供の場であったらしいが、個人的には、大変勉強になった。
その後どうなっていくのかが気になるネタも多数あったので、また開催されるのであれば参加したい。
Continue reading »
2018 ESA, ESC and ESBC Joint Annual Meeting に参加して
最終日の11/14には、あったPrenary lectureはRyan Church さんという方で、またもやハリウッド関係という。どんだけ映画好きな方がプログラム編成されたのだろう。いや、北米がこういう文化なのかもしれない、と話を聴いてて思い至るように。
実は彼も虫屋だという話から始まり、スター・ウォーズ・シリーズに出てくる宇宙船などのデザインは昆虫にヒントを得たものが多数あるというのを紹介されていた。
やっぱり、昆虫すごい。
だからというわけではないが、今回は珍しく行き帰り共にずっと映画を見ていた。
行き
ミッション:インポッシブル/フォールアウト
ハンソロ
パシフィックリム
帰り
Logan
カメラを止めるな!
La La Land
Deadpool2
最終日には自分のポスター発表もあったが、最終日の午後ということもあって全般的に人が少ない上に機能アノテーション手法開発の研究ということもあって…。
現にたくさんデータが出てきてて、まさに博物館の標本のようにきっちりと整理して蓄えた上で、必要な時にすぐに取り出せるようにしていかないと。
ぜひ興味を持って、コミュニティー全体で取り組んでいってほしい、一緒にやっていくので …
Continue reading »
2018 ESA, ESC and ESBC Joint Annual Meeting
11/10-11/14まで、アメリカ昆虫学会の年会に参加。
カナダとブリティッシュコロンビア州の昆虫学会との合同年会ということで、バンクーバーにて。
バンクーバーはすでに冬で季節外れの暖かさの日本とは大違い。
初日のkeynote speechにはRandy Olsonさんが登壇。
非常にわかりやすい話で、あとで調べたら著書は邦訳されていた。これは、読まねば、という内容かと。
Continue reading »
16th cancer hypoxia
がんとハイポキシア研究会に今年も参加。
今回の会場は前回と打って変わって、JR京葉線海浜幕張駅前のアウトレットの真ん前のホテル。
今回は合宿形式ではなかったものの、遠方組はやはり泊まりで。
しかも多くの知り合いは同じホテルということで、遅くまで夜の部で意見交換ができた。
近い分野の研究やっている人がオフラインに会って知り合いになれるとてもいい機会であったかと。
自分は海外出張のため、そのまま成田空港へ。
海浜幕張駅からだと電車よりもバスが乗り換えもなく、便利なようだった。
Continue reading »
第3回RDF講習会
第3回RDF講習会が2018年11月1日に開催。
一昨年昨年に続き、今年も市ヶ谷のJSTにて。
今年も参加して復習。
二週間前に申し込みサイトがオープンになったばかりで短かかった割には、多数集まった印象。
トーゴーの日で予告されていたり、他の要因があったからだろうか。
去年と同じ内容と聞いていたが、さらに洗練された印象。
具体例も身近なコンテンツを使っていて、わかりやすく。
昨年の講習会の時点では近日公開予定だったtogoDB の新バージョンが実際に使えるようになってて、ゲノム弁当のデータの例 で紹介されたのは、実務的にはとてもよかったのではないだろうか。
今回の講習会もすべて録画されていて、後日統合TV から配信される予定なので、参加できなかった方は是非。
Continue reading »
第2回SPARC Japan セミナー2018「オープンサイエンス時代のクオリティコントロールを見通す」で講演
結果として、今年もオープンアクセスウィーク に企画されたSPARC Japanセミナー、第2回 SPARC Japan セミナー2018 (オープンアクセス・サミット2018)「オープンサイエンス時代のクオリティコントロールを見通す」 で話してきた。
今回は、話題提供的な20分の口頭発表とパネラーということだったが、この一年に起こったことの体験談を話してきた。
その体験談とは、去年のこのSPARCセミナー(2017年10月末) でプレプリントの洗礼を受けた後に、さらにCold Spring Harbor Laboratoryで「プレプリント出してないのになんで発表しているの?」という世界観を植えつけられた 。
そして、共同研究論文が2018年2月にPLOS ONEに出た のをきっかけに自分のパートをより詳しく生命科学系のプレプリントサーバであるBioRxiv にアップロード。
さらに、しばらく経ってからそのアクセス状況、他の共同研究でもプレプリントに出すように次第になっているというそういう話。
自分が思うところのプレプリントのメリット、デメリットなども。
それにしてもF1000Research のManaging Director の Rebecca Lawrence …
Continue reading »
第10回三島バル
個人的には5回目の参戦の三島バル 。
今年行った店は結果として、以下の通り。
MASTICAVINO
パステリア地中海
メロン・ドゥ・メロン 三島広小路店
Lantern
abierto
ラーメンやんぐ
ル・パサージュ
最後は雨が降ってきて、終了という感じで。
メロンでふと確認したところ、ナンバーズが的中してしまい、メロンパン3つゲットしてしまった。これで運を使い果たして居なければいいが。
Continue reading »
同業種交流会
ひょんなことからローカルな飲み会。
どのようなデータセットを選択すべきか、閾値をどう指定したらいいか、はところ変われど共通の悩みであることを再認識。
いい研究にしたいと思うのなら、多くの人に見てもらえるようにすべし。
いくらデータを出しましたと言っても、そのデータが科学コミュニティで共有されないようでは。
その想いを新たに。
Continue reading »
第2回SPARC Japan セミナー2018「オープンサイエンス時代のクオリティコントロールを見通す」
今年度はセミナー企画ワーキンググループから御役御免になったSPARC Japanなのだが。
今年もオープンアクセスウィーク に企画されたSPARC Japanセミナーに関わることに。
具体的には、第2回 SPARC Japan セミナー2018 (オープンアクセス・サミット2018)
「オープンサイエンス時代のクオリティコントロールを見通す」 と題して、2018年10月25日(木)に国立情報学研究所 12階 1208,1210会議室にて。
去年は司会だったが、今年は話題提供的な20分の口頭発表とパネラーということで。
「生命科学研究におけるプレプリント活用の現状」と題して、生命科学系のプレプリントサーバであるBioRxiv にアップロードした経験を踏まえて話す予定。
本日2018年10月10日から参加募集開始。
Continue reading »
統合牧場の追憶
休みの日だったが、職場近くで行われていた若手の会が終わって、3人の若手がDBCLS見学に。
かつて、DBCLSが東大本郷に間借りしていた時はよくこうやって人がやってきた な、と思い出した。
その中で、我々のいた部屋は「統合牧場 」と呼ばれるようになっていったんだったなーと(参考資料:統合牧場に関する動画 )。
そして、我々の職場が今のところに2014年初めに移動、続けてやりたかったが学生が通ってこれないという場所的な問題から、消滅。
統合TVを作成するなどの開発は、クラウド化して続けている ものの。
今日のような人との出会いは激減したんだな、と人が来てくれたことで思い出した。
平日じゃないからしょうがないのだが、ここにもっと若手の研究者を呼びたいのであれば、もっとうまく連携すればいいのに。
オレオレで連携する気はないのかな、そもそもデータベース系のバイオインフォマティクスな人が居ない10月5日トーゴーの日にぶつけてくるあたりとか。
でも私はもっと積極的に研究者とのリアルの交流をしていきたい。
ええ、ちょっと辺鄙なところにある職場だけれども。
Continue reading »
GO解析という言い方
最近よく「GO解析(ジーオーカイセキ)」という言い方を聞く。
よく話を聞いてみると、発現差などのあった遺伝子群をエンリッチメント解析して、Gene Ontologyのtermで有意な値が出て来たものをみるということのようだが。
Gene Ontology以外のKEGGのPATHWAYやMeSHなども見ていることも多いのではないかと思う。
不正確なので、その都度直しているのだが。
そういうOntologyとその遺伝子へのアノテーションを手軽に使えるようになっている対象生物での研究ならではの悩みなのかもしれないが。
Continue reading »
トーゴーの日シンポジウム2018
今年も。作る側の報告会的な色合いが強い会だったが、大分使う側に向けた口頭発表が多くなり、そちら側の参加が増えた印象。
某賞のアレもあったし、世間的な関心度は以前より上がっているのではないかと。
だからこそ、続けてやっていく必要性をもっと訴えていくべきかと。
Continue reading »
ぼうのブログ復電
ぼうのブログをホストしているマシンが41時間ぶりに通電して復活。
台風による停電はおそらく初めて。
これまでは瞬電が原因でネットワーク接続が切れてしまうパターンが多かったが、本当に電力供給がこんなに長い時間止まってしまったのは初めて。
電気のありがたさを感じた次第。
復旧に尽力していただいた方々、ありがとうございました。
Continue reading »
2018年9月を振り返って
9月は出張が多かった。
まず月初めから8月末からの熊本出張があり、その翌週には蓼科での若手支援技術講習会、広島でのゲノム編集特化型講習会、獣医学会のシンポジウムでの講演が連続して。
そして、月の最後に大阪での日本癌学会学術総会。
しかしながら、外泊数としては8で、5月や7月に記録した10ほどではなかった。
それでも出払っていることが多く、データ解析野郎としては不完全燃焼。
その間に分担翻訳したゲノム第4版 の出版があったり。
そして、Dr.Bonoの生命科学データ解析 も発売から丸一年を迎えるなど。
多くの方に読んでいただけたようだが、教科書として使っていただいてより多くの方に読んでいただければと。
でも、気がついたら、2018年の3/4が今日で終わるわけで。
自らのoutputを出すことに10月以降、注力したい。
Continue reading »
ゲノム第4版出版
翻訳を分担した最新の生命科学教科書、ゲノム第4版 を3連休前の金曜日、2018年9月21日に拝受した。
500ページを超える分量の割には薄くて軽かった。帯にもあるように スリム化した賜物であろう。
翻訳したとはいえ、担当した5,6章以外は見たこともなく、どうなっているかはそれまで全く知らなかったので、翻訳をされた方は最終的な訳者一覧の校正で知っていたものの、新鮮な感じ。
第4章の4.2節「次世代塩基配列決定法」でNGSによる配列決定方法がバッチリ解説されている。PacBioもNanoporeも。最新の教科書だからこそのコンテンツかと。
じっくり読ませてもらいたいと思う。
この本の章立て(目次)が出版社のページで公開された ので、こちらも参考に。
そして、2018年9月24日にはamazonで(予約ではなく)即時購入可能となった。
Continue reading »
ROIS立川
研修で初めてROIS立川へ。
国立極地研究所と統計数理研究所が都内から移転してきて、現在ここに。
多摩都市モノレールも初めて。
一区間(立川北→高松)だけ乗るのもったいないな、と思いつつ、しかし歩いて行くほどの時間もないので乗ったら100円でビックリ。
そして高松駅で降りると、進行方向にまだモノレールの高架があって。
車庫があるための施設のようだが、ROIS立川(もしくは立川市役所)近くに駅が出来るといいなと勝手に思ったり。
Continue reading »
BioRxivとは何か
BioRxiv にアップした論文をポスター発表していたら意外な質問が。
「このBioRxivって何ですか?」
そもそも読み方からして知られていない。「バイオアーカイブ」と読む。Rxivのx
は「エックス」でなく、「カイ二乗検定」のχ
(カイ)。それで「アーカイブ」と読む。なお、アーカイブの本来の綴りはarchive
。
そしてこれは、一体全体何なのか、だが。
新たなる論文誌ではなく、preprint(プレプリント)と呼ばれるものである。
論文として査読に出す前に論文をpreprint serverと呼ばれるウェブサイトにアップロードすることで公開する仕組み、なのだ。
詳しくは2017年10月に、第2回 SPARC Japan セミナー2017 (オープンアクセス・サミット2017)「プレプリントとオープンアクセス」 というセミナーをオーガナイズさせていただいたので、そちらの資料が参考(PDF) になると思うが、かいつまんで私のイメージを以下に。
物理学の一部の分野では昔からこの仕組みが採用され、本家arXiv に論文をアップすることで研究者同士が論文を共有してきた …
Continue reading »
ゲノム編集特化型DB講習会
2018年9月11日(火)に広島大学東広島キャンパスにて「ゲノム編集特化型DB講習会 」が開催され、それの講師に。
参加者は30人ほどで、自分は「統合DBの便利なサービス」と題して40分でざっと紹介させていただいた。
講習の内容は統合データベース講習会AJACS同様、GitHub に。
実は、広島大学東広島キャンパスは初めて。
残念ながら、講習会を午前中にしただけで他に時間がなく、見学とかは全然できなかった。
近くで広島風お好み焼き を食べにいったり、生協で売っていたスケルピョンを捕獲 したぐらい。
機会があれば、また行ってみたい。
帰りにバスを間違えて危うく広島駅まで行ってしまいかけるなどもあったものの、予定通りミッションを果たして来た。
公共DBの広く知ってもらうという意味でも、ミッション(mission; 「布教、伝道」)なのかなと思ったり。
Continue reading »
若手支援技術講習会2018
2018年9月6-8日、若手支援技術講習会2018 に参加。
ずっとこの集まりとは縁がなかったのだが、昨年度ROIS-DS-JOINTというデータサイエンス共同利用基盤施設の活動で共同研究集会「若手カンファレンス:がん研究とデータサイエンスのコミュニケーション」を一泊二日で主催し、こういう集まりがあることを教えてもらって、今回参加させていただくこととなった。
招待講演などではなく、ただの参加者として。
自分の視野を広げる勉強のため、ということで仕事ではなく、有給休暇を取得しての参加で。
元々はがん分野の若手の集まりだったということらしい。
現在では先進モデル動物支援プラットフォームの若手支援技術講習会ということで、神経や発生、免疫の分野の若手研究者が参加して、二泊三日で長野県茅野市蓼科で合宿、というスタイルになっているとのこと。
それらの多岐にわたる分野のお話が聴けた他、主催となっている文部科学省 新学術領域研究 学術研究支援基盤形成 先端モデル動物支援プラットフォーム の各種支援事業に関する紹介もあった。
知り合いの研究者がそういった活動に実は関与していることを初めて知るなど、色々新規に知る気付きがあった。
基調講演的な位置づけのSpecial Scientific Lectureでは、翻訳に参加させていただいたゲノム第4版 の監訳者である石川冬木先生がお話しされるなど、私にとってはタイムリーであった。
ポスター発表も議論が盛り上がるよう工夫されてて、比較的近い分野の10人以下のグループに分かれ、それぞれで内容説明と議論を行う形で、その狙い通り予定されていた時間が足りなくなるぐらい議論が盛り上がった。
その発表内容の研究は、次世代シークエンサーDRY解析教本 で勉強してできるようになったという方も複数いて、まさに筆者冥利に尽きる、状況。
それを書いた人が、同じ枠でポスター発表している、というのは彼らには不思議に思われたようだが …
Continue reading »
昆虫のゲノムデータベースとそれを活用したデータ解析2
ROIS-DS-JOINT共同研究集会として去年度より始めた「昆虫のゲノムデータベースとそれを活用したデータ解析」を今年度も開催。今回もDBCLS柏 にて。2018年8月9,10日に。
2回目ということもあって比較的準備は馴れたものだったが、それでも色々とややこしい事態は発生。今回は開催日に開催地への台風直撃の予報という天災まで。結局、最後で台風は逸れ、2時間開始時間を遅らせただけの被害で無事開催できたのだが。毎度、もうこれで最後にしようと開催直前には思うのだが、終わってみればまたやろう、という気持ちになるのが不思議。
今回も何人かに長く話してもらい、他の参加者は5分間のライトニングトークをするという構成で、全員が話をするという形。JST NBDCによるNGSハンズオン講習会 に出た上で、次世代シークエンサーDRY解析教本 を読んで勉強したという学生さんの話に、ああやっぱり出してよかったなあと。
古くなった部分があるとはいえ、必要だと思ったことをできる限りカバーしたつもりなので、もっと読んで勉強して欲しいと思ったりもしたものの、これらの書籍やブログ、twitterなどを通して情報発信してきたことが見られているんだなということを再確認する機会ともなった
今回は2日目終了後の午後にAJACSa5柏 と称して中上級向けの講習会を連続開催してみた。前回の研究会終わった時に、2日目午前で終了ということなら、午後にも残ってやりたい人だけで講習会をやったらいいんじゃないかと思ったのがキッカケ。内容的には割と高度だったのだが、受講生の皆さんのリテラシーが相対的に高く、また学びたいというモチベーションも高かかったこともあって、予定していた時間よりはるかに早く終わってしまった。もうちょっと発展課題を用意しておくべきだったと反省。
それなりに充実した会になったのではないだろうか。リアルに顔を合わせて話をすると良いことがある、ということが広まるといいな。もちろんここには書けないけどw。
オーガナイザーの横井さん、そして参加者の皆さん …
Continue reading »
ゲノム第4版
冬休みに宿題として(一部)翻訳した本、ゲノム第4版 がamazonに。
英語版の章立て はあるものの、日本語のそれはまだ公開されていない模様(リクエストはした)。
翻訳担当した章はそのうち、
第5章 Genome Annotation (ゲノムアノテーション)
第6章 Identifying Gene Functions (遺伝子の機能を同定する)
実は、前版では元上司たちが担当していた章で、結果としてその後を引き継ぐ形となった。
11年ぶりの改訂ということで、ヒトゲノム解読後であっても新しい技術に関して加筆された部分が多く、CAGE法に関しても第5章で、CRISPR/Cas9を用いた機能解析に関しては第6章に詳細な記述がある。
原著はこちら。
Continue reading »
2018年7月を振り返って
出張が少なかった6月と打って変わって、7月は5月と同じ宿泊回数10日。
国内版バイオハッカソン@徳島がその半分以上の6泊。結果として、AOE関係の仕事はとても進んだのでよかったのだが。
あと、統合データベース講習会AJACS筑波4の講師業。広報活動にももちろん、寄与した。
DB利活用の広報活動的な外部講演 は、つくばと徳島のそれぞれの出張に併せて外部セミナーというものを実施したりで、AJACSも含めると7月は3件。出張に併せてやるというのは聞いてもらえる機会を増やすので、今後も積極的にやっていきたい。
公共DBを使いこなした研究も並行してやってきてはいるが、なかなか形にはなっていない。
色々な締め切りがヤマを越して時間が取れそうな来月以降、キッチリ形にしていきたい。
夏休みシーズンを迎えて、Dr.Bonoの生命科学データ解析 は細々と売れているようだが、実際に何冊売れたかは今のところ、不明。
Continue reading »
国内版バイオハッカソンBH18.7
徳島県徳島市の眉山にあるかんぽの宿で開かれた国内版バイオハッカソンBH18.7 に参加。公共発現データ目次AOEの開発維持管理を引き続き取り組む。
一つ目は、NCBI Gene Expression Omnibus(GEO) のより完全なメタデータをAOEで使えるように、GEOからsoft
形式のファイルを取得してくるスクリプト群書き。GEOデータのダウンロードの説明ページ を参考にしながら、eutilsの使い方 をよく知っている同僚に教えて貰いつつ。ダウンロードしてくるべきデータのIDのリストをウェブインターフェースで事前に取得してから100個づつまとめてゲットしてくるやりかたで進めたが、途中で一時停止したり。なかなか思うようにすぐには取得できず。
二つ目は、SRAには登録されているものの、GEOには登録されていないデータに関してもAOEから検索できるようにするというプロジェクト。以前にも数えてみたことがあったが、今回DBCLS SRA APIを使ったやり方に変更し、BioProjectのID単位で数えてみると2万を超えるエントリがあったので、それらがどういうエントリかを詳しくみる手前まで漕ぎ着けることができた。続きは次回以降のSPARQLthonにて。
という感じで、自らのプロジェクトを進めることが今回も出来た。有意義で充実した、素晴らしい五日間だった。セッティングしていただいた、オーガナイザーの皆さん、ありがとうございました。
Continue reading »
みんなのPython勉強会#37
前回に続いて、連続参加。おとなしく、聴衆に戻った。
第37回目の今回 はPython教育がテーマということで、社内で導入した例や勉強するためのさまざまなリソースの紹介。特に、最後の@terapyonさんの「Pythonの学びの段階を自覚し適切なステップアップ方法を見つけよう〜コミュニティやチュートリアルイベントを通じて感じたこと〜」 は普段講習会の講師をやっている自分にとっても参考になる点が多々あり、グッときた。単に本を紹介するという感じではなく、そのための心構えやイベントへの積極的な参加姿勢などを学び取ったつもり。
終了後のビアバッシュのじゃんけん大会で勝ち残ってしまい、azureなTシャツをゲットした。これまで持っていないいい色合い。大事にします。
次回は仕事の都合上無理っぽいが、またタイミングが合えば会場で参加したい。
Continue reading »
代謝ナビゲーション
Nature Metabolism が2019年1月に発刊されるらしい。約20年前に日本生化学会の代謝マップを元にKEGGのデータを作成するお手伝いをしていた私にとってみると大変驚きの事実である。当時はシグナル伝達全盛で、なぜそんな時代遅れの代謝なんてやっているのかわからんといわれたものである。
今、代謝がアツい。実は2017年にDr.Bonoの生命科学データ解析 と同じ出版社(メディカル・サイエンス・インターナショナル)から、代謝ナビゲーション という翻訳本がほぼ同時期に出版されている。
この本には、代謝パスウェイの知識をデータベース化していた90年代からの研究の進捗が加味されており、さらに深く代謝を知る上で大変参考になる。
例を挙げると、低酸素誘導因子(HIF)による代謝の調節がそれである。第10章「シグナル伝達と代謝」のp176辺りに「酸素とグルコースによる転写ネットワークの調節」の節で、2000年前後から解明が進んだこの分野の知見が綺麗にまとめられている。
原著はこちら。
より深く知りたい人のための文献として第3章「解糖系」ではKEGGのGlycolysis/gluconeogenesisのURL が紹介されているのは、感慨深いものがある。URLもこの種の教科書の重要なリファレンスとしてリストされるようになったのだ。
Continue reading »
DBCLS11年
この2018年7月で、2007年7月にDBCLSに移ってはや11年が過ぎた。
日本を代表する生命科学のデータベースセンターとしてやるべきだと思ったことを自分なりに自分のできる範囲でやり散らかしてきた。
その雑多な知識の体系として、ようやく2017年の9月に『Dr.Bonoの生命科学データ解析 』という形で書籍化することができ、一区切り。
プロジェクトを開始した当時は、動画でDBを紹介する ことなんて考えてなく、紙媒体の教科書としてそれをまとめて形にすることを目論んでいた。
一周回って、11年目にしてやっとそれが達成された、という考え方もできるかも。
そして、その次へ。そうやって構造化した知識(11年前当時流行っていたキーワードでいうと、「知の構造化」)を、実際のこれからの生命科学研究で活用していくこと、である。
多くの人に使ってもらいたいが、自らももちろんやる。
それを実現化するためのいろいろのため、日々奔走している今日このごろ。
これからも前向きに精進していきたい。
Continue reading »
エンジニアのための生命科学データ解析の勉強会@静岡に参加しての雑感
このブログの過去のエントリ にも書いたように、Shizuoka.ngs#1 が開催された。2017年の12月に拙著『Dr.Bonoの生命科学データ解析 』(通称Bono本)の読書会で得た雑感を元に、今回は生命科学ガチ初心でもできる!エンジニアのための生命科学データ解析の勉強会 Shizuoka.ngs#1 として企画。場所は、前回の読書会と同じ貸し会議室@静岡駅前で。
メインは、RNAの発現量を配列カウント数から推定するRNA-seqデータ解析のハンズオン。もっと手こずるかと思ったが、エンジニア向けということで参加者のコンピュータ・リテラシが高いのか、予想を遥かに上回るペースで進んだ。これは、主催者のOさんが貸出マシンやデータを予めダウンロードしてUSB外付けハードディスクに準備してくれたばかりか、jupyter notebookのファイルも用意してくれてて。参加者は、それを一行づつ追って確かめていけばよく、勉強になったからかと。
自分は、「エンジニアのための生命科学入門」と題して1時間弱話させていただいた。@no85jさんもライトニングトーク「遺伝子発現解析で何がわかるの?」をしてくださり、なぜそのようなデータ解析をしているのかがより明確にわかったのではないかと。
次世代シークエンサーDRY解析教本 に載っているやり方とは異なるalignment freeな方法によるハンズオンは今回が初めてだった。これまでのやり方だと時間内には絶対終わらず三分間クッキング方式で、すでに解析したファイルを見てもらうだけだったが、これならMacBookAirでも発現定量解析が一応自分のマシンで完了できた。今後はこちらでやると良いのかもしれない。
Continue reading »