ぼうのブログ

Category: misc

SPARQLthon56 day2

Written by bonohu in misc on 火 16 5月 2017.

統合TVのコンテンツ(.movファイル)だけでなく、Togo Picture Galleryのコンテンツも生命科学系データベースアーカイブに移行。統合TV関連コンテンツの完全クラウド化が実現した。そしてついに、この日を持ってtdiary版統合TVウェブインターフェースが廃止となった。「togotv+キ …

Continue reading »

SPARQLthon56 day1

Written by bonohu in misc on 月 15 5月 2017.

AOEの追加機能の計算をpythonでやろうとするが、データがでかすぎて思うようにできず。できる手段を探しつつ、データをまとめて減らすことも検討。メタデータの …

Continue reading »

転置するUNIXコマンド

Written by bonohu in misc on 金 12 5月 2017.

きっとあるだろうと思ったら、やっぱりググって出て来たこのページを参考に。 transposeというコマンドもあるらしいが、ここは手堅くawkで。とおもったら、メモ …

Continue reading »

みんなのPython勉強会#24

Written by bonohu in misc on 水 10 5月 2017.

みんなのPython勉強会に参加してきた。今回、奇しくも第24回目。月1回なので、ちょうど丸2年ということだった。内容的にはそれぞれの方の会社で開発されている …

Continue reading »

Mishima.syk#10開催打ち合わせ

Written by bonohu in misc on 月 08 5月 2017.

Mishima.syk開催打ち合わせで、三島広小路のあの店へ。その際の写真はこちらに。個人的には、生姜まみれのホタルイカが圧巻 …

Continue reading »

ぶらっとBLAT

Written by bonohu in misc on 日 07 5月 2017.

BLATはThe BLAST Like Alignment Toolで、UCSC Genome Browser のサイトにあるリファレンスゲノム配列に特化した配列類似性というか配列マッピングツール …

Continue reading »

ゲゲゲのゲノム

Written by bonohu in misc on 土 06 5月 2017.

配列パターン検索はリファレンスゲノム中に探すのであれば、ゲゲゲのゲノムことGGGenomeでやるのが手っ取り早い。ゲノ …

Continue reading »

曖昧配列パターン検索

Written by bonohu in misc on 金 05 5月 2017.

配列パターン検索はUNIX的にはgrepでできるが、バイオな配列に対してだと、パターン中に改行が入った場合やヘッダ行中の「誤爆」を防ぎたい …

Continue reading »

非モデル生物での転写因子結合サイト予測

Written by bonohu in misc on 木 04 5月 2017.

もちろん、ChIP-seqのデータがあればそれを利用すればいいのだが、多くの場合そういったデータのない非モデル生物種では、転写因子の結合の有無を調べるのに、転写因子 …

Continue reading »

UTRの抽出

Written by bonohu in misc on 水 03 5月 2017.

モデル生物ではきっちりアノテーションがなされ、UTR(UnTranslated Region)の配列抽出とか、EnsemblのBiomartを使えば簡単にできる。Ensemblにない生物種でも、Ensembl Genomesのそれを …

Continue reading »

samtools indexも並列化

Written by bonohu in misc on 火 02 5月 2017.

割とすぐに終わるからこれまで特に気にしていなかったが。調べてみたら、やはりsamtools indexもスレッドオプションがあった。他のコマンドと同じで-@のあと …

Continue reading »

samtools merge の並列化と sort へのパイプライン処理

Written by bonohu in misc on 月 01 5月 2017.

今日から5月。絶好のデータ解析日和ということで(^_^)。 TopHatの結果を処理するコマンドは以前はやっつけでinteractiveに処理していたが、バッチ化というか並列化というか。中間ファイルがかさばるの …

Continue reading »

BAMからCRAMへのバッチ変換

Written by bonohu in misc on 金 28 4月 2017.

ファイル変換weekになってしまったので、BAMからCRAMへのバッチスクリプトも紹介しておく。 SAMBAM変換とは異なり、リファレンスゲノム配列が必要で、それは各環境で違う場所にあると思うので、それは自分の環 …

Continue reading »

SAMからBAMへのバッチ変換

Written by bonohu in misc on 木 27 4月 2017.

SAMからBAMに変換して、そのまま中間ファイルを作らずにBAMをソートする。それをバッチで処理するには。 SAMファイルの置いてあるディレクトリに移動(cd)してから、以下のようなスクリプトを実行 …

Continue reading »

FAST5からFASTQへの変換

Written by bonohu in misc on 水 26 4月 2017.

現在お世話になっている研究所でOxford Nanopore Technologies　のセミナーがあり、参加させていただいた。大変興味深く聞かせてもらった …

Continue reading »

Quanto論文

Written by bonohu in misc on 火 25 4月 2017.

ぼうのブログによると、2009年の7月29日に初めてDBCLSに来てくれた当時M1の学生さんだった。その後、Research Assistantとして統合牧場でUNIXとしてのMacの使い方を身につけ、そして学んだことをブログや統合TVとしてまとめてくれた。その後、そのままDBCLSに残ってくれて、後輩RAの指導、とき …

Continue reading »

満を持して

Written by bonohu in misc on 月 24 4月 2017.

ついにこの日がやってきた。各所に働きかけた末に。

That's one small step for (a) man, one giant leap for mankind.

ただの盛り上がったミーティングに …

Continue reading »

背水の陣

Written by bonohu in misc on 金 21 4月 2017.

配列データ解析、頑張らないと。それを後押しする事象発生。折しもそれ関連の計算を始めていたのは、虫が知らせたか …

Continue reading »

CRAMによる圧縮効率

Written by bonohu in misc on 木 20 4月 2017.

昨日のエントリの続きで、複数のBAMファイルをCRAMに変換し、そのサイズを比べてみた。

それぞれのファイルサイズを同一行に来るように1行ごとにデータを作って(cram …

Continue reading »

BAMからCRAMへの変換、そしてその逆

Written by bonohu in misc on 火 18 4月 2017.

BAMからCRAMへの変換を試してみた。samtoolsを使えば良いだけの模様。 [shell] samtools view -@ 4 -T hogenome.fa -C -o hoge.cram hoge.bam [/shell] 3,091,833,154byteあったファイルサイズが、2,325,565,061byteに。約75%になったとは、すごい!CPU時間的には

263.48s user 45.58s system …

Continue reading »

アクセッション番号すら諸行無常

Written by bonohu in misc on 火 18 4月 2017.

dottupの説明を書くため、EMBOSSのチュートリアルを見ていたら、XL23808というアクセッション番号の配列が使われていた。チュートリアルに出ている配列だし、自分もこれで例を作ろうと、これが何かをDDBJ/ENA/GenBankで検索しても、ググって …

Continue reading »

春の心の嵐

Written by bonohu in misc on 月 17 4月 2017.

直接は被っていないものの、それでも学生委員会の同窓会で最近も何回か会った、同学年の同志の訃報。そんな私にも …

Continue reading »

Libraries of Life

Written by bonohu in misc on 土 15 4月 2017.

米国のアウトリーチ活動に関して、2016年9月のICE2016に参加した時に紹介してもらった Library of Life Collection Card が断舎離していたら出てきた …

Continue reading »

SPARQLthon55 day2

Written by bonohu in misc on 金 14 4月 2017.

AWSに移設したAOE2の更新ができるように、いろいろと準備してもらいつつ。昨日やったことのまとめ。 AWSにsshできるように/Users/hoge/.ssh/configに以下の設定を追記。

host fuga
 user ec2-user
 hostname xxx.xxx.xxx.xxx
 identityfile /Users/hoge/.ssh/fuga.pem

そして [shell …

Continue reading »

SPARQLthon55 day1

Written by bonohu in misc on 木 13 4月 2017.

AOE2いよいよ公開へ。セキュリティ強化と停電のないサーバーでのサービスを、ということでAWS化を急遽。達人たちに教えてもらい、AWSでセットアップしてもらう。いろいろと …

Continue reading »

EnsemblでもTrack Hubs

Written by bonohu in misc on 水 12 4月 2017.

これまで試したことなかったが、EnsemblでもTrack Hubsが使えるらしい。追加する際に見に行く先の Track Hub registry はかつてのDAS registryのように各ゲノムブラウザー(といってもUCSC Genome BrowserとEnsembl Genome …

Continue reading »

国の機関サイトの5年残存率

Written by bonohu in misc on 火 11 4月 2017.

ショッキングな統計値を教えてもらった。国の機関サイトの残存率というもので、5年残存率は40% (2015年)というものである。つまり半分 …

Continue reading »

Trinity実行時のFASTQヘッダ問題

Written by bonohu in misc on 月 10 4月 2017.

Trinityを実行する際にFASTQのヘッダが問題となる事例。以前から同様の事が起きており、その場合は、 [shell] bzcat file.fq.bz2 | awk '{if(NR%4==3) $0=sprintf("'"+${index}%d"'",(1+i++)); print;}' | awk '{if(NR%4==1) $0=sprintf("'"@${index}%d"'",(1+i++)); print;}' | bzip2 …

Continue reading »

諸行無常

Written by bonohu in misc on 日 09 4月 2017.

未来永劫続くプロジェクトやデータベースはないとはわかっていても、その継続を仮定してしまうのはなぜだろう …

Continue reading »

国立遺伝学研究所一般公開2017年

Written by bonohu in misc on 土 08 4月 2017.

DBCLSが三島の国立遺伝学研究所に移転した2014年から毎年の参加で、これで4回目。しかしながら、雨になったのは初めてと。去年に引き続き、公開講演会の撮影補助。もちろん撮影にかかわる …

Continue reading »

遺伝研の論文 in Pubmed

Written by bonohu in misc on 金 07 4月 2017.

昨日のDBCLSの論文数の検索と同じことを遺伝研でやっていみると…。

https://www.ncbi.nlm.nih.gov/pubmed/?term=National+Institute+of+Genetics[ad]

遺伝研ほどヒット数が多いと、右上に …

Continue reading »

DBCLS10年の論文数

Written by bonohu in misc on 木 06 4月 2017.

とあるtweetがきっかけで、所属としてDatabase Center for Life Science (DBCLS)が載っているPubmedエントリを抽出してみた。

https://www.ncbi.nlm.nih.gov/pubmed?term=Database+Center+for+Life+Science[ad]

というURLでリストされる。2017年4月6日現在43本あって、1本を除いてすべてOpen Accessという徹底ぶりは凄い。みなさん、さすが …

Continue reading »

転写因子のChIP-seqデータの可視化

Written by bonohu in misc on 水 05 4月 2017.

まずはChIP-Atlasで調べる。目的の転写因子があれば、ラッキー。ない場合は、"転写因子の遺伝子名"+"ChIP-seq"をqueryとしてNCBI GEOで検索。ヒットしてきたエン …

Continue reading »

Overleaf

Written by bonohu in misc on 火 04 4月 2017.

ふとtwitterのタイムラインを見た時に「オンラインLaTeXエディター“Overleaf”：論文投稿プロセスを変革する共同ライティングツール」という日本語論文が情報管理に掲載 …

Continue reading »

Data Authorship as an Incentive to Data Sharing

Written by bonohu in misc on 月 03 4月 2017.

The New England Journal of Medicine に掲載された論文(sounding board)、"Data Authorship as an Incentive to Data Sharing"　doi:10.1056/NEJMsb1616595。 Data Sharing に関わる Incentive として Data Authorshipを、というわかりやすい考 …

Continue reading »

春の嵐

Written by bonohu in misc on 日 02 4月 2017.

三島も4年目に突入。年度頭から締め切りに追われているが、ブレインストーミングに温泉インフォマティクス研究会単独開催 …

Continue reading »

パスワード付きzipファイルを作る

Written by bonohu in misc on 土 01 4月 2017.

個人情報保護ということで、電子メールで添付ファイルを送付する際もパスワードを付けて、と言われる時代に。早速 …

Continue reading »

2017年第1四半期終了

Written by bonohu in misc on 金 31 3月 2017.

2017年も三ヶ月が終了した。その実感はやはりない。あっという間に終わってしまった感。本務の共同研究に関わる打合せが多かった他、科研費 …

Continue reading »

深くゆっくり考えよう

Written by bonohu in misc on 木 30 3月 2017.

twitterのRT(ReTweet)で流れてきたとあるつぶやきにハッとする。

日中の仕事の大半が事務仕事を含む細々したルーチンワークになる場合、頭の働き方が仕事を短時 …

Continue reading »

第61回日本応用動物昆虫学会大会3日目

Written by bonohu in misc on 水 29 3月 2017.

最終日。この日も朝からガッツリ口頭発表を聞く。その間に昨晩の仮説の検証を試みるも…。不審感だけが残る。この日は …

Continue reading »

第61回日本応用動物昆虫学会大会2日目

Written by bonohu in misc on 火 28 3月 2017.

2日目は朝から夕方まで口頭発表。主に生理学・生化学方面を聞く。お昼を挟んで、ポスター発表。その合間に何回か共同研究打合せ。そして、日が暮れて …

Continue reading »

第61回日本応用動物昆虫学会大会1日目

Written by bonohu in misc on 月 27 3月 2017.

アウェーの学会大会参加。のはずが、会場に着くなり知り合いに会うなど。そこでの議論で、来年度の講習会をどうやっ …

Continue reading »

日本生物工学会誌連載4回目「塩基配列データベースの現状とその有効活用方法」掲載

Written by bonohu in misc on 日 26 3月 2017.

日本生物工学会誌に「バイオインフォマティクスを使い尽くす秘訣教えます!」という連載を開始してからはや半年。と …

Continue reading »

説明会、その後

Written by bonohu in misc on 金 24 3月 2017.

説明会。この種のそれは約十年勤めてきて初めて。わかったことは、現状今後のことはよくわからないということ。終了 …

Continue reading »

命の洗濯

Written by bonohu in misc on 木 23 3月 2017.

有給休暇扱いにして、ホームワーク。所属はしていないが勤務先のある研究所で開催される公開セミナーを聞きに職 …

Continue reading »

csvlookが使えない

Written by bonohu in misc on 月 20 3月 2017.

ある日、タブ区切りのデータを人に見せる必要があって、csvlookを使おうとしたら

zsh: /usr/local/bin/csvlook: bad interpreter: /usr/local/opt/python3/bin/python3.5: no such file or directory

というエラー …

Continue reading »

JST OPERA「ゲノム編集による革新的な有用細胞・生物作成技術の創出」キックオフシンポジウム

Written by bonohu in misc on 金 17 3月 2017.

JST産学共創プラットフォーム共同研究推進プログラム（OPERA）研究領域「ゲノム編集による革新的な有用細胞・生物作成技術の創出」キックオフ・シンポジウムに呼んでいた …

Continue reading »

東京農工大学グローバルイノベーション研究院公開セミナー

Written by bonohu in misc on 火 14 3月 2017.

米国のKansas State Universityからお越しいただいた Prof. Michael R. Kanost と Dr. Neal T. Dittmer のセミナーを聴講しに東京農工大学へ。_Manduca sexta_のゲノム配列解読の話も聞けた。やはり遺伝子アノテーションの話と …

Continue reading »

SPARQLthon54

Written by bonohu in misc on 月 13 3月 2017.

三島開催。だが、急用で1日目だけの参加。引き続き、ArrayExpressにない、RNA-seqデータを回収する件。ArrayExpressのデータと同じようにTitle行をどう取得するか、悩みどころ。いろいろな不具合が見つかってバグ出しには貢献したものの、解 …

Continue reading »

なんでブログやSNSをやっているのか?

Written by bonohu in misc on 日 12 3月 2017.

ブログを始めたのっていつからだろう?と考え込むぐらい日常的にブログを書いたり、他人のそれを読んだりな自分 …

Continue reading »