SPARQLthon61
Written by bonohu in misc on 火 24 10月 2017.
台風直撃により、前日入り。いろいろ作業を進めて、それぞれそれなりに進捗があったのだが、SPARQLthonでメインでやるべきAOEまわりはほとんど進まず、無念。今年度の開発の仕 …
台風直撃により、前日入り。いろいろ作業を進めて、それぞれそれなりに進捗があったのだが、SPARQLthonでメインでやるべきAOEまわりはほとんど進まず、無念。今年度の開発の仕 …
今年も、セミナー企画ワーキンググループに入ってやらせてい …
(このエントリは、Mishima.syk#11のLightning Talkネタ)
職場では、GitHubを日常的に使っている。その実例を紹介する。
統合データベース講習会AJACSでは講習会資料が基本GitHubで管理している …
githubに復活したものの、実行が終わらないxenome。他の人も同様な状況らしく。1.0.1に関することとか書かれていたので、ちゃんと見て試そうと思っていたが。そのバー …
気がついたら今年度の後半戦。ちょっとした研究会ラッシュ。これから広報を開始するフェーズの研究会や、旅費の申 …
Dr.Bonoの生命科学データ解析と同じ出版社(メディカル・サイエンス・インターナショナル)から同時に出版された本の一つがこの代謝ナビ …
10月6日はトーロクの日。データを登録し、他の人に使ってもらう機会を増し、データの再利用性を高める機会にすると良い、ということでこ …
今年も巡ってきた10月5日。ということで、「トーゴーの日」シンポジウム。今年も東京大学弥生講堂にて2日間に渡って開催されたが、ポスター発表数が多 …
学会は、視野を広げて話を聞く良い機会であることを昨晩実感したので、それを更に実践。興味はあるものの、普段は聞 …
癌学会2日目は自分のポスター発表。デバネタで発表するのは今回が初めてだが、あくまでもDB再利用研究の実例として。張り付き義務時間になってポスターの前に行っ …
2017年9月28日からの3日間、パシフィコ横浜で開催された第76回日本癌学会学術総会に参加。今回のハイライトは、1年前からこの学会に照準を合わせて取り組んできたBono本の出版。
なんとか間に合ってよかった。
ArrayExpressがaspera経由でのmirrorできなくなっていた件。-Pでポート番号を指定するだけで復活。セキュリティのため、default以外のポート番号になった?
最終日は論文thonということで、今回取り組んだことをまとめて、BioHackathon2017論文のコンテンツをみんなでそれぞれに。参加者の皆さん、一週間おつかれさまでした。
4日目は、温泉インフォマティクス研究会はやはり朝夕の2回開催。修学旅行生が入るという情報もあって夕方早めに。
翌朝になっても計算終わらず。その周りでごちゃごちゃと。 お昼周りを散歩するも、食事できるところは、かつてあった …
温泉インフォマティクス研究会は、朝と夜の2回開催。AOE3にあたるプロジェクトを粛々と進めるも、計算終わらず。
2日に渡るシンポジウムが終わり、ハッカソン開始。 SPARQLthonの時にやってきていたDBCLS SRAとAOEまわりで仕事を進める予定。その前に、まずは温泉インフォマティクス研究会。1日目は、夜に1回の開催。
今年で10回目のBioHackathon。10回目記念ということもあって、いつもならシンポジウムは1日のところ、今年は2日間でしかも東京開催。FAIR Principles (FAIR原則: Findable, Accessible, Interoperable, and Re-usable)で有名なMark Wilkinsonさん曰く、
[The final version of FAIR Principles were crafted by participants of #BioHack15 , led by …
RefEx論文発表のその後の顛末。 論文に関するプレスリリースが、職場(DBCLS)と共同研究先の研究機関(遺伝研)から出され、マイナビや医学関係のニュー …
今回は理研和光にてSPARQLthon開催。諸事情により、今回は今日だけの参加。 サンプル方向の検索実装はBioHackathonで頑張ることを確認。 今回はArrayExpressのデータ更新をしこめなかったため、インデックス更 …
NBDC/DBCLSの遺伝子発現のデータベースというかウェブツール、RefExの論文が公表された。 これは2006年に文部科学省統合データベースプロジェクトが始まったときにすでにその原型があったサービスで、さまざまな測定手法による遺伝子発現データを並べてみるというコンセプトでデー …
2017年8月24日に大阪府枚方市の関西医科大学で統合データベース講習会AJACS河内に講師やTeaching Assistant (TA)として参加。講師としては、「遺伝子発現DBを含む公共オミックスDBの使い方」を担当。1日のみの講習で開始時間も朝早くからで(しかも学長から挨拶 …
生化学若い研究者の会九州支部夏のセミナーの講師に呼ばれたので話しに。5年前に同じく生化学若い研究者の会の夏の学校で話ししたときのものを現時点版にアップデートしてお話し …
xenome続き。indexができたので、それを使って分類。 [shell] xenome classify -T 12 -M 48 -P fuga_in_hoge -i fuga_RNAseq1.fq [/shell] FASTQファイルであるが、どうもbz2圧縮のままでは実行できない模様で、展開してから。
これまで、三島の国立遺伝学研究所で開催して来た中上級向けの講習会、統合データベース講習会AJACSadvancedを、初めて外部(つく …
xenome続き。indexの作成だが、以下のように。 [shell] xenome index -v -T 6 -P fuga_in_hoge -H hoge.fa -G fuga.fa [/shell] 最初この実行が終わらず、プログラムが暴走しているのかと思 …
xenograft サンプルを分類するツールのxenomeだが、一時期ダウンロードできない状態が続いていたが、githubで復活した模様。 git cloneして、ドキュメ …
Cufflinksパッケージに入っているコマンドgffreadは、以下のオプションでGFF3形式からGTFに変換してくれる。 [shell] gffread hoge.gff -T -o hoge.gtf [/shell] これまで知らなかったが、便利な局面がありそう、ということで。
これまた信じられない訃報。直接一緒に働いたことはないものの、間接的にいろいろお世話になってきたこの分野の …
どちらかというと、こちらが教える立場であったはずだが、自分的にもいろいろ刺激を受けてきた。それを実現する方 …
まず、昨晩飛び込んで来たproofの対処。 ArrayExpressにデータとして明に含まれなくなったINSTRUMENT_MODEL(Sequencerの情報)をSRAのmetadataから抜き出してくる実装をして、githubへpush。コードの整理しなきゃな…。
三島にてSPARQLthon。まずは、AOEの拡張で発現データmatrixと格闘。
分子系統樹の描画といえば、これまでJalviewで満足してきた。しかしながら、bootstrap値の計算など系統樹描画に限界を感じ、食わず嫌いはいかんと思い立ち、MEGA (Molecular Evolutionary Genetics Analysis …
今年からはこれでいく。土用の牛の日は、牛肉(うし)を食べる。
[caption id="attachment_3888" align="aligncenter" width="640"] 160gランチステーキ&190g極みがんこコンビ[/caption]
オミックスデータ目次となりつつあるAOEでシークエンサー情報の詳細が更新されなくなっている。いろいろ調べた …
統合TVを始めてから10年の月日が経った(「統合TVの歴史」参照)。その間、1,263件の動画を公開した。そのうち、554が講演動画、311が実習の動画。それ以外の約400がスクリーンキャプチャーによるチュートリアル動画ということに。
当初は、チュートリ …
統合TVで使い方チュートリアルを作成し、統合TVから公開したツールf-treeの論文が公開された。
f-treeGC: a questionnaire-based family tree-creation software for genetic counseling and genome cohort studies Tomoharu Tokutomi, Akimune Fukushima, Kayono Yamamoto, Yasushi Bansho, Tsuyoshi Hachiya and Atsushi Shimizu BMC Medical Genetics 20171 8:71 DOI: [10.1186/s12881-017-0433-4](http://doi …
かなりしばらくぶり(といっても約半年ぶり)に、いくつかの講習会の講師に指名された。そこで、またテキストを作るわ …
PerkinElmer Japan ヘルスケアITセミナー「病院に於ける医療ビッグデータの活用とその最新事例」に参加。結果として、異分野殴り込み。話題と …
標記の報告書が公開され、NBDCの事業推進に関する報告書等に追加された。 それに対する「ライフサイエンスデータベース …
DDBJ30周年を期に静岡新聞に毎週連載されていた「遺伝子バンク30年」という連載が完結した模様。 大学院生時代に所属していた京都大 …
IDがない場合にどう関連づけるか。生命科学系の遺伝子のデータの場合はそれを塩基配列の類似性検索でなんとかなるが、そうでない場合にそれを …
今回は沼津駅北口プラザヴェルデにて開催された Mishima.syk #10 に参加。 まずは、勉強会のページのお昼ガイドにあった沼津 …
(このエントリは、Mishima.syk #10のライトニングトークのネタです)
Biocondaとは、
Bioconda is a channel for the conda package manager specializing in bioinformatics software.
とのことで、Bioinformaticsソフトウェアに特化したconda package mangerのチャンネル(bioconda.github.io …
RSEMの計算、TPMやFPKMなどしか見ないだろうと思っていたが、やっぱりgenomeに対するアラインメントを見る必要が出てきて。もちろん、--output-genome-bam をつけて再計算すればそれで良いのだが、それはそれでまた時間がかかる。長い計算の時 …
IGVをいじっていたら、右クリックメニューにSashimi plotなるものを発見。'sashimi plot'でPubmed検索しても1件しかでてこなかったが、'sashimi plots'にすると3件出て来て、その一つ(Quantitative visualization of alternative exon expression from RNA-seq data)によると、
a quantitative visualization of aligned RNA-Seq reads that enables …
長年の懸案だったGeneChipのソレとRNA-seqのソレをついにjoinできた。これでさらに精度良く、目的の遺伝子群が抽出できるはず。 また、それ以外にもいい知らせが。2017年後半戦、ま …
RSEMの結果ファイルからFPKM値で複数のサンプルの結果を抜き出したいとき。current directoryすべての結果ファイルに対してそれをしたい場合、以下のようなシェルスクリプトで。実行する前にFPKMというdirectoryを作成して、そこに処理したファイル群が書き込まれるようにする。
#!/bin …
本日2017年7月1日で、ついにライフサイエンス統合データベースセンター(DBCLS)に来て丸10年が経った。あの日、まだプレハブの仮住まいだったDBCLSから歩いて本郷三丁目駅に向かい丸ノ内線に乗って東京駅に …
去年のこの日にも書いた振り返りエントリ。 2017年前半を振り返って。出張による外泊は、28泊と昨年前半の43泊より減少。出張を抑制、データ解析や物書きに取り組もうと …