BH18.7
国内版バイオハッカソンBH18.7
徳島県徳島市の眉山にあるかんぽの宿で開かれた国内版バイオハッカソンBH18.7に参加。公共発現データ目次AOEの開発維持管理を引き続き取り組む。
一つ目は、NCBI Gene Expression Omnibus(GEO) のより完全なメタデータをAOEで使えるように、GEOからsoft
形式のファイルを取得してくるスクリプト群書き。GEOデータのダウンロードの説明ページを参考にしながら、eutilsの使い方をよく知っている同僚に教えて貰いつつ。ダウンロードしてくるべきデータのIDのリストをウェブインターフェースで事前に取得してから100個づつまとめてゲットしてくるやりかたで進めたが、途中で一時停止したり。なかなか思うようにすぐには取得できず。
二つ目は、SRAには登録されているものの、GEOには登録されていないデータに関してもAOEから検索できるようにするというプロジェクト。以前にも数えてみたことがあったが、今回DBCLS SRA APIを使ったやり方に変更し、BioProjectのID単位で数えてみると2万を超えるエントリがあったので、それらがどういうエントリかを詳しくみる手前まで漕ぎ着けることができた。続きは次回以降のSPARQLthonにて。
という感じで、自らのプロジェクトを進めることが今回も出来た。有意義で充実した、素晴らしい五日間だった。セッティングしていただいた、オーガナイザーの皆さん、ありがとうございました。