Trinity前処理
Written by bonohu in misc on 火 02 1月 2018.
遠隔作業が可能なので、時間のかかる処理を仕込みつつ。
fastq-dump
でヘッダを変えたFASTQでは、Trim Galore!(cutadapt
)によるトリミングが失敗する …
遠隔作業が可能なので、時間のかかる処理を仕込みつつ。
fastq-dump
でヘッダを変えたFASTQでは、Trim Galore!(cutadapt
)によるトリミングが失敗する …
年頭恒例にしているその年の計。「2018年、かくありたい」
引き続き、ずっと取り組んでいるメインの仕事、公共DBの全レコードを対象としたデータ解析研究に力を注ぎ、懸案の仕事を …
2017年を振り返って。今年は収穫の年であった。
ここのところの懸案だったDBCLSでのメインの仕事の論文が2本出版された。quanto論文とRefEx論文である。それぞれGigaScience、Scientific Dataというデータジャーナルと呼ばれる雑誌形態の論文誌。我々の活動を報告する場として今後もお世話になりそう。
このぼうのブログで書 …
温泉インフォマティクス研究会を単独開催して、2017年の反省会。場所はいつものところに。頭の整理をするために、この温泉に度々来た2017年であった …
三島に勤務しだした2014年から数えている「仕事で外泊」した日数。本日(12月28日)で仕事納め、というわけで、2017年の日数確定。 去年と同数の77泊。2014年50泊、2015年65泊、と年々増加してきたので、今年は抑 …
前のエントリを書いたら、pfastq-dumpを作っている@iNutさんからまた別のFASTQファイルを生成するdockerコンテナを教えてもらった。
docker run --rm -v "$(pwd)":/data -w /data
inutano/sra-toolkit fastq-dump --split-files SRR1864696.sra
こちらの …
SRAデータの再利用で困っているのでよく聞くのが、FASTQファイルが得られないという声。FASTQファイルでの配布は新規にはされていないので、SRA(.sra)形式でのファイルを取ってきてfastq-dumpコマンドを実行する必要があるわけであるが、このコマンドのインストールが上手く行かなかったりする模様。
そ …
Trinityが動かない問題再燃。使っているバージョンは2.4.0。
以前に言及したFASTQヘッダの問題かと思ってfastq-dumpをいじってみた。
fastq-dump --defline-seq '@$sn[_$rn]/$ri' --split-files hoge.sra
が、そうして生成されたFASTQファイルは逆に、trimming …
RefExの論文を2017年8月末に出したが、その英語版プレスリリースを11月頭に出してもらった。
すると、英語版のそういったニュースにも取り上げてもらい、その種の …
しばらくブログをホストしているサーバーが落ちている間に、Bono本の第2刷が出回り始めていたり。
それにしても9月末の第76回日本癌学会学術総会での発売開始(=出版)から三ヶ月も経たないうちに …
今日のワンライナー。普通なら
cut -f1,3 hoge.txt
で済ますところだが、さらなる処理、IDのバージョン情報を取る(s/.d+//)とか必要な場合にPerlで処理したい場合、こんな風に …
ナショナルバイオリソースプロジェクト(National BioResource Project; NBRP)のシンポジウムに参加。今年度(2017年)から第4期が開始ということであったが、それは5年を1期とするプロジェクトが3回行われ、今年度から4期目が始まったという意味で …
@oec014さんの呼びかけで、静岡駅近くでBono本読書会が2017年12月16日(土)に開かれた。どういった人が、どれぐらい集まるか、心配な感じだったが、案ずるより産むが易 …
BH17.11の続き。NCBI GEOのメタデータをDBCLS SRAのAPIから取得してこれるよう、AOEのコードを追加。そしてそれらをGitHubにアップすべくまとめたり、ドキュメントを充実させたり。短いコードであってもそれらを書き散らすのは楽し …
普段日程が合えば参加しているみんなのPython勉強会(Start Python Club)が、Pythonオープンサイエンスシンポジウムをつくばで開催。これまたちょうど都合がよかったので参加。
いろんな研究分 …
最終日は、RefExとAOEの口頭発表。今回は@h_ono氏が発表をやってくれた。2年前に同じく神戸で(その時は自分が)口頭発表したときに比べて、disり質問もなく。(今は)公共データを再利用しよう、という流れを …
この日には夜に癌研究者の集まりに。毎度研究コミュニティーのsmall world感を感じながらも、初めて会った人にも統合TVすごく使っていた …
2日目はブース対応をメインのはずだったが、Bono本サイン会があったりして迷惑かけてしまった…。そちらのイベント自体は大成功だったのだが。
ConBio2017は初日の午前にいきなり主宰ワークショップ「いかにして『使える』データベースを維持し続けるか?」から開幕。以下のような豪華な演者陣でバイオなデータベース …
次の日朝イチで主宰ワークショップだったので、午前にミーティングに出てから午後に移動で、前日入り。それに乗じ …
2017年の国内版バイオハッカソンは熊本にて、11月26日〜12月1日まで。 AOEのコード群をDBCLS傘下のGitHubに移し、書き散らしていたコードをまとめたり、発現定量値を使ったソレを議論したり。その裏で、共同研究 …
今回で2回目のアノテーソン。ゲノム配列解読系の人が多かったような。自分の考えていた「アノテーション」とは違う世界に戸惑うものの …
遅ればせながら、kallistoを試す。日本語でブログに書いている人もいる模様だが、最新の情報は英語の本家のドキュメント …
Dr.Bonoの生命科学データ解析に関して、「この本を読んだら、(自分のやりたい配列データ解析)ができるのか?」という質問がちょっと気になっている。
まあ、中 …
日が変わってもなお議論。いつにも増してハードな会となった。
自分ですべての「データ」を出すだけでなく、公共データ …
今年は淡路夢舞台国際会議場にて。今年もhypoxia transcriptomeのメタ解析の続きをポスター発表。以前よりは関心持ってくれる人が増えたが、まだまだ。かつてのように …
無線LANのトラブルの中、いくつかのプロジェクトの打合せを進める。
2017年5月以来、半年ぶりに参加。期せずして3冊のPython本の著者の人が話される節目の勉強会30回目で、大変参考になった。その3冊とは、以下の通り。
日付変更線を越えてきたため、私にとっての今日の日は物凄く短く、すぐに終わってしまった。11月1日が37時間あった分のツケ。
カードキーがいきなり磁気が飛んで無反応になるやシャワーのお湯がなかなか温かくならない等、いろい …
日本は祝日らしいが、こちらはとくに祝日でもないので、普通にセッションが朝から晩まで。
最初だけかと思 …
twitterから得た、参加者らしき人のtweetによれば、229の発表があり、そのうち44が口頭発表で残り185がポスター発表とか。 参加者数は345とか。これもtwitter情報。
発表者のLast nameのアルファベット順にポスター番号が振られ、口頭発表も含めて分け …
2017/11/1-4まで Cold Spring Harbor Laboratory (CSHL) で開かれている Genome Informaticsに参加。 隔年でCSHLとWellcome Genome Campusとで開かれていて、今年は米国で。 実は、第1回目に出ていて口頭発表しているという最古参。 し …
セミナーから一夜明けて、また別の研究会の企画打合せ。「昆虫のゲノムデータベースとそれを活用したデータ解析」は …
セミナー企画ワーキンググループメンバーの担当と …
今日(2017/10/29)で出版から早一ヶ月。小規模な誤植は、有志のみなさんが報告してくれて大変感謝。正誤表としてまとめ、出 …
台風直撃により、前日入り。いろいろ作業を進めて、それぞれそれなりに進捗があったのだが、SPARQLthonでメインでやるべきAOEまわりはほとんど進まず、無念。今年度の開発の仕 …
実質アカデミックフリーになって、自分の共同研究者には便利なツールとして浸透しつつある。 その結 …
今年も、セミナー企画ワーキンググループに入ってやらせてい …
拙著の読書会の企画が公表され、参加者の募集が開始に。ConBio2017(第40回日本分子生物学会年会+第90回日本生化学会大会)の終わった次の週の2017年12月16日の土曜日に、場所は静岡駅前のビルの …
(このエントリは、Mishima.syk#11のLightning Talkネタ)
職場では、GitHubを日常的に使っている。その実例を紹介する。
統合データベース講習会AJACSでは講習会資料が基本GitHubで管理している …
githubに復活したものの、実行が終わらないxenome。他の人も同様な状況らしく。1.0.1に関することとか書かれていたので、ちゃんと見て試そうと思っていたが。そのバー …
気がついたら今年度の後半戦。ちょっとした研究会ラッシュ。これから広報を開始するフェーズの研究会や、旅費の申 …
Dr.Bonoの生命科学データ解析と同じ出版社(メディカル・サイエンス・インターナショナル)から同時に出版された本の一つがこの代謝ナビ …
原因不明だが、ブログをホストしている自宅サーバーがおちてて、ブログへのアクセスやアップデートがこの一週間 …
10月6日はトーロクの日。データを登録し、他の人に使ってもらう機会を増し、データの再利用性を高める機会にすると良い、ということでこ …
今年も巡ってきた10月5日。ということで、「トーゴーの日」シンポジウム。今年も東京大学弥生講堂にて2日間に渡って開催されたが、ポスター発表数が多 …
学会は、視野を広げて話を聞く良い機会であることを昨晩実感したので、それを更に実践。興味はあるものの、普段は聞 …
癌学会2日目は自分のポスター発表。デバネタで発表するのは今回が初めてだが、あくまでもDB再利用研究の実例として。張り付き義務時間になってポスターの前に行っ …
2017年9月28日からの3日間、パシフィコ横浜で開催された第76回日本癌学会学術総会に参加。今回のハイライトは、1年前からこの学会に照準を合わせて取り組んできたBono本の出版。
なんとか間に合ってよかった。