ぼうのブログ

SPARQLthon56 day1

Written by bonohu in misc on 月 15 5月 2017.

AOEの追加機能の計算をpythonでやろうとするが、データがでかすぎて思うようにできず。できる手段を探しつつ、データをまとめて減らすことも検討。メタデータの …

転置するUNIXコマンド

Written by bonohu in misc on 金 12 5月 2017.

きっとあるだろうと思ったら、やっぱりググって出て来たこのページを参考に。 transposeというコマンドもあるらしいが、ここは手堅くawkで。とおもったら、メモ …

みんなのPython勉強会#24

Written by bonohu in misc on 水 10 5月 2017.

みんなのPython勉強会に参加してきた。今回、奇しくも第24回目。月1回なので、ちょうど丸2年ということだった。内容的にはそれぞれの方の会社で開発されている …

Mishima.syk#10開催打ち合わせ

Written by bonohu in misc on 月 08 5月 2017.

Mishima.syk開催打ち合わせで、三島広小路のあの店へ。その際の写真はこちらに。個人的には、生姜まみれのホタルイカが圧巻 …

ぶらっとBLAT

Written by bonohu in misc on 日 07 5月 2017.

BLATはThe BLAST Like Alignment Toolで、UCSC Genome Browser のサイトにあるリファレンスゲノム配列に特化した配列類似性というか配列マッピングツール …

ゲゲゲのゲノム

Written by bonohu in misc on 土 06 5月 2017.

配列パターン検索はリファレンスゲノム中に探すのであれば、ゲゲゲのゲノムことGGGenomeでやるのが手っ取り早い。ゲノ …

曖昧配列パターン検索

Written by bonohu in misc on 金 05 5月 2017.

配列パターン検索はUNIX的にはgrepでできるが、バイオな配列に対してだと、パターン中に改行が入った場合やヘッダ行中の「誤爆」を防ぎたい …

非モデル生物での転写因子結合サイト予測

Written by bonohu in misc on 木 04 5月 2017.

もちろん、ChIP-seqのデータがあればそれを利用すればいいのだが、多くの場合そういったデータのない非モデル生物種では、転写因子の結合の有無を調べるのに、転写因子 …

UTRの抽出

Written by bonohu in misc on 水 03 5月 2017.

モデル生物ではきっちりアノテーションがなされ、UTR(UnTranslated Region)の配列抽出とか、EnsemblのBiomartを使えば簡単にできる。Ensemblにない生物種でも、Ensembl Genomesのそれを …

samtools indexも並列化

Written by bonohu in misc on 火 02 5月 2017.

割とすぐに終わるからこれまで特に気にしていなかったが。調べてみたら、やはりsamtools indexもスレッドオプションがあった。他のコマンドと同じで-@のあと …

samtools merge の並列化と sort へのパイプライン処理

Written by bonohu in misc on 月 01 5月 2017.

今日から5月。絶好のデータ解析日和ということで(^_^)。 TopHatの結果を処理するコマンドは以前はやっつけでinteractiveに処理していたが、バッチ化というか並列化というか。中間ファイルがかさばるの …

BAMからCRAMへのバッチ変換

Written by bonohu in misc on 金 28 4月 2017.

ファイル変換weekになってしまったので、BAMからCRAMへのバッチスクリプトも紹介しておく。 SAMBAM変換とは異なり、リファレンスゲノム配列が必要で、それは各環境で違う場所にあると思うので、それは自分の環 …

SAMからBAMへのバッチ変換

Written by bonohu in misc on 木 27 4月 2017.

SAMからBAMに変換して、そのまま中間ファイルを作らずにBAMをソートする。それをバッチで処理するには。 SAMファイルの置いてあるディレクトリに移動(cd)してから、以下のようなスクリプトを実行 …

FAST5からFASTQへの変換

Written by bonohu in misc on 水 26 4月 2017.

現在お世話になっている研究所でOxford Nanopore Technologies　のセミナーがあり、参加させていただいた。大変興味深く聞かせてもらった …

Quanto論文

Written by bonohu in misc on 火 25 4月 2017.

ぼうのブログによると、2009年の7月29日に初めてDBCLSに来てくれた当時M1の学生さんだった。その後、Research Assistantとして統合牧場でUNIXとしてのMacの使い方を身につけ、そして学んだことをブログや統合TVとしてまとめてくれた。その後、そのままDBCLSに残ってくれて、後輩RAの指導、とき …

満を持して

Written by bonohu in misc on 月 24 4月 2017.

ついにこの日がやってきた。各所に働きかけた末に。

That's one small step for (a) man, one giant leap for mankind.

ただの盛り上がったミーティングに …

背水の陣

Written by bonohu in misc on 金 21 4月 2017.

配列データ解析、頑張らないと。それを後押しする事象発生。折しもそれ関連の計算を始めていたのは、虫が知らせたか …

CRAMによる圧縮効率

Written by bonohu in misc on 木 20 4月 2017.

昨日のエントリの続きで、複数のBAMファイルをCRAMに変換し、そのサイズを比べてみた。

それぞれのファイルサイズを同一行に来るように1行ごとにデータを作って(cram …

アクセッション番号すら諸行無常

Written by bonohu in misc on 火 18 4月 2017.

dottupの説明を書くため、EMBOSSのチュートリアルを見ていたら、XL23808というアクセッション番号の配列が使われていた。チュートリアルに出ている配列だし、自分もこれで例を作ろうと、これが何かをDDBJ/ENA/GenBankで検索しても、ググって …

春の心の嵐

Written by bonohu in misc on 月 17 4月 2017.

直接は被っていないものの、それでも学生委員会の同窓会で最近も何回か会った、同学年の同志の訃報。そんな私にも …

Libraries of Life

Written by bonohu in misc on 土 15 4月 2017.

米国のアウトリーチ活動に関して、2016年9月のICE2016に参加した時に紹介してもらった Library of Life Collection Card が断舎離していたら出てきた …

SPARQLthon55 day1

Written by bonohu in misc on 木 13 4月 2017.

AOE2いよいよ公開へ。セキュリティ強化と停電のないサーバーでのサービスを、ということでAWS化を急遽。達人たちに教えてもらい、AWSでセットアップしてもらう。いろいろと …

EnsemblでもTrack Hubs

Written by bonohu in misc on 水 12 4月 2017.

これまで試したことなかったが、EnsemblでもTrack Hubsが使えるらしい。追加する際に見に行く先の Track Hub registry はかつてのDAS registryのように各ゲノムブラウザー(といってもUCSC Genome BrowserとEnsembl Genome …

国の機関サイトの5年残存率

Written by bonohu in misc on 火 11 4月 2017.

ショッキングな統計値を教えてもらった。国の機関サイトの残存率というもので、5年残存率は40% (2015年)というものである。つまり半分 …

Trinityを実行する際にFASTQのヘッダが問題となる事例。以前から同様の事が起きており、その場合は、 [shell] bzcat file.fq.bz2 | awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' | awk '{if(NR%4==1) $0=sprintf("'"@${index}%d"'",(1+i++)); print;}' | bzip2 …

諸行無常

Written by bonohu in misc on 日 09 4月 2017.

未来永劫続くプロジェクトやデータベースはないとはわかっていても、その継続を仮定してしまうのはなぜだろう …

国立遺伝学研究所一般公開2017年

Written by bonohu in misc on 土 08 4月 2017.

DBCLSが三島の国立遺伝学研究所に移転した2014年から毎年の参加で、これで4回目。しかしながら、雨になったのは初めてと。去年に引き続き、公開講演会の撮影補助。もちろん撮影にかかわる …

DBCLS10年の論文数

Written by bonohu in misc on 木 06 4月 2017.

とあるtweetがきっかけで、所属としてDatabase Center for Life Science (DBCLS)が載っているPubmedエントリを抽出してみた。

https://www.ncbi.nlm.nih.gov/pubmed?term=Database+Center+for+Life+Science[ad]

というURLでリストされる。2017年4月6日現在43本あって、1本を除いてすべてOpen Accessという徹底ぶりは凄い。みなさん、さすが …

転写因子のChIP-seqデータの可視化

Written by bonohu in misc on 水 05 4月 2017.

まずはChIP-Atlasで調べる。目的の転写因子があれば、ラッキー。ない場合は、"転写因子の遺伝子名"+"ChIP-seq"をqueryとしてNCBI GEOで検索。ヒットしてきたエン …

Data Authorship as an Incentive to Data Sharing

Written by bonohu in misc on 月 03 4月 2017.

The New England Journal of Medicine に掲載された論文(sounding board)、"Data Authorship as an Incentive to Data Sharing"　doi:10.1056/NEJMsb1616595。 Data Sharing に関わる Incentive として Data Authorshipを、というわかりやすい考 …

春の嵐

Written by bonohu in misc on 日 02 4月 2017.

三島も4年目に突入。年度頭から締め切りに追われているが、ブレインストーミングに温泉インフォマティクス研究会単独開催 …

パスワード付きzipファイルを作る

Written by bonohu in misc on 土 01 4月 2017.

個人情報保護ということで、電子メールで添付ファイルを送付する際もパスワードを付けて、と言われる時代に。早速 …

2017年第1四半期終了

Written by bonohu in misc on 金 31 3月 2017.

2017年も三ヶ月が終了した。その実感はやはりない。あっという間に終わってしまった感。本務の共同研究に関わる打合せが多かった他、科研費 …

深くゆっくり考えよう

Written by bonohu in misc on 木 30 3月 2017.

twitterのRT(ReTweet)で流れてきたとあるつぶやきにハッとする。

日中の仕事の大半が事務仕事を含む細々したルーチンワークになる場合、頭の働き方が仕事を短時 …

第61回日本応用動物昆虫学会大会3日目

Written by bonohu in misc on 水 29 3月 2017.

最終日。この日も朝からガッツリ口頭発表を聞く。その間に昨晩の仮説の検証を試みるも…。不審感だけが残る。この日は …

第61回日本応用動物昆虫学会大会2日目

Written by bonohu in misc on 火 28 3月 2017.

2日目は朝から夕方まで口頭発表。主に生理学・生化学方面を聞く。お昼を挟んで、ポスター発表。その合間に何回か共同研究打合せ。そして、日が暮れて …

第61回日本応用動物昆虫学会大会1日目

Written by bonohu in misc on 月 27 3月 2017.

アウェーの学会大会参加。のはずが、会場に着くなり知り合いに会うなど。そこでの議論で、来年度の講習会をどうやっ …

説明会、その後

Written by bonohu in misc on 金 24 3月 2017.

説明会。この種のそれは約十年勤めてきて初めて。わかったことは、現状今後のことはよくわからないということ。終了 …

命の洗濯

Written by bonohu in misc on 木 23 3月 2017.

有給休暇扱いにして、ホームワーク。所属はしていないが勤務先のある研究所で開催される公開セミナーを聞きに職 …

csvlookが使えない

Written by bonohu in misc on 月 20 3月 2017.

ある日、タブ区切りのデータを人に見せる必要があって、csvlookを使おうとしたら

zsh: /usr/local/bin/csvlook: bad interpreter: /usr/local/opt/python3/bin/python3.5: no such file or directory

というエラー …

JST OPERA「ゲノム編集による革新的な有用細胞・生物作成技術の創出」キックオフシンポジウム

Written by bonohu in misc on 金 17 3月 2017.

JST産学共創プラットフォーム共同研究推進プログラム（OPERA）研究領域「ゲノム編集による革新的な有用細胞・生物作成技術の創出」キックオフ・シンポジウムに呼んでいた …

SPARQLthon54

Written by bonohu in misc on 月 13 3月 2017.

三島開催。だが、急用で1日目だけの参加。引き続き、ArrayExpressにない、RNA-seqデータを回収する件。ArrayExpressのデータと同じようにTitle行をどう取得するか、悩みどころ。いろいろな不具合が見つかってバグ出しには貢献したものの、解 …

なんでブログやSNSをやっているのか?

Written by bonohu in misc on 日 12 3月 2017.

ブログを始めたのっていつからだろう?と考え込むぐらい日常的にブログを書いたり、他人のそれを読んだりな自分 …

丸6年経った今日

Written by bonohu in misc on 土 11 3月 2017.

黙祷。もう6年、つまり小学校を卒業するだけの年数が経ってしまったと考えると、本当に時が経つのは早いという印象 …

Written by bonohu in misc on 月 15 5月 2017.

Written by bonohu in misc on 金 12 5月 2017.

Written by bonohu in misc on 水 10 5月 2017.

Written by bonohu in misc on 月 08 5月 2017.

Written by bonohu in misc on 日 07 5月 2017.

Written by bonohu in misc on 土 06 5月 2017.

Written by bonohu in misc on 金 05 5月 2017.

Written by bonohu in misc on 木 04 5月 2017.

Written by bonohu in misc on 水 03 5月 2017.

Written by bonohu in misc on 火 02 5月 2017.

Written by bonohu in misc on 月 01 5月 2017.

Written by bonohu in misc on 金 28 4月 2017.

Written by bonohu in misc on 木 27 4月 2017.

Written by bonohu in misc on 水 26 4月 2017.

Written by bonohu in misc on 火 25 4月 2017.

Written by bonohu in misc on 月 24 4月 2017.

Written by bonohu in misc on 金 21 4月 2017.

Written by bonohu in misc on 木 20 4月 2017.

Written by bonohu in misc on 火 18 4月 2017.

Written by bonohu in misc on 火 18 4月 2017.

Written by bonohu in misc on 月 17 4月 2017.

Written by bonohu in misc on 土 15 4月 2017.

Written by bonohu in misc on 金 14 4月 2017.

Written by bonohu in misc on 木 13 4月 2017.

Written by bonohu in misc on 水 12 4月 2017.

Written by bonohu in misc on 火 11 4月 2017.

Written by bonohu in misc on 月 10 4月 2017.

Written by bonohu in misc on 日 09 4月 2017.

Written by bonohu in misc on 土 08 4月 2017.

Written by bonohu in misc on 金 07 4月 2017.

Written by bonohu in misc on 木 06 4月 2017.

Written by bonohu in misc on 水 05 4月 2017.

Written by bonohu in misc on 火 04 4月 2017.

Written by bonohu in misc on 月 03 4月 2017.

Written by bonohu in misc on 日 02 4月 2017.

Written by bonohu in misc on 土 01 4月 2017.

Written by bonohu in misc on 金 31 3月 2017.

Written by bonohu in misc on 木 30 3月 2017.

Written by bonohu in misc on 水 29 3月 2017.

Written by bonohu in misc on 火 28 3月 2017.

Written by bonohu in misc on 月 27 3月 2017.

Written by bonohu in misc on 日 26 3月 2017.

Written by bonohu in misc on 金 24 3月 2017.

Written by bonohu in misc on 木 23 3月 2017.

Written by bonohu in misc on 月 20 3月 2017.

Written by bonohu in misc on 金 17 3月 2017.

Written by bonohu in misc on 火 14 3月 2017.

Written by bonohu in misc on 月 13 3月 2017.

Written by bonohu in misc on 日 12 3月 2017.

Written by bonohu in misc on 土 11 3月 2017.