Category: misc

2月は逃げる

Written by bonohu in misc on 火 28 2月 2017.

本当に今年2017年の2月はそんな感じだった。1月のうちは、それほど予定も詰まっておらずじっくり研究に取り組めると思っていたのだが…蓋を開けてみると、東京出張が合計7日分だから、ひとつきの1/4は東京だった、と。そして、(これも取り立てて記することでもなくなりつつあるが)論文投稿やreviseを並行して。またたく間に過ぎてしまった感。来年度以降じっくりと研究に取り組むために、今月はその仕込みをしたということにしておきたい。

Continue reading »


情報・システム研究機構シンポジウム2016

Written by bonohu in misc on 月 20 2月 2017.

現在所属しているセンターが属している大学共同利用機関法人 情報・システム研究機構(ROIS: Research Organization of Information and Systems)が毎年主催している機構シンポジウムに参加。今年は「分野を超えたデータサイエンスの広がり~自然科学から人文社会科学まで~」というテーマで。統合TVスタッフによるビデオ撮影も。後日統合TV化される予定。

生命科学以外の分野の「データサイエンス」がらみの取り組みを複数知ることができた他、Yahooの安宅さんによる刺激的なお話が聞けて大変良かった。これはたぶん統合TV化無理だろうな…。twitterのハッシュタグ(#roissympo)を追うとその一端をうかがい知ることができるかと…ハッシュタグ付けてつぶやいていたのはほぼオイラだけ!?

帰りに突発的な大雨で、ずぶ濡れに。

Continue reading »


出会いを大事に

Written by bonohu in misc on 土 18 2月 2017.

今回の東京連続出張の機会に複数の知り合いと再会。人との出会いの中から自分のアイデンティティを再確認。ちょっとやる気が薄れていたことに対して、結果として激励されたり。体力的にちょっとキツかったものの、とても良い機会だった。出会いを大事に。

Continue reading »


SPARQLthon53 day2

Written by bonohu in misc on 金 17 2月 2017.

昨日でデータは取ってこれるようになったので、それを整形して必要なデータだけ抽出できるように。

まずは、BioProject(PRJから始まるID)とGEO Series(GSEから始まるID)のIDを抽出して、後者はGSE以下の数字をE-GEODから始まるArrayExpressのそれに変換して。これまでのAOEに使っていたタブ区切りテキストに1カラム追加して、このBioProjectIDが付くものは付けたデータを作成。やっとAOE2.0用の入力ファイルが完成!

そして、ずっと取り組んできているArrayExpress(そしてGEO)に入っていない、RNA-seqなデータを追加する方。追加するために必要なメタデータの取得方法確立、そして重複エントリを削る判定基準を作成するなど、まだまだ越えるべきハードルがあって、すぐにはできないものの、見通しはついてきた感。次回も頑張ろう。

Continue reading »


SPARQLthon53 day1

Written by bonohu in misc on 木 16 2月 2017.

前回に引き続き、DBCLS SRAのAPIをいじる。AOE2.0に必要なデータを作成するパイプラインを作成するために。 前回上手くいかなかったREST APIによる大量データ取得を再度試みる。BioProjectのデータでGEO SeriesのIDを持つエントリとSRA中のRNA-seqエントリのメタ情報の取得ができるようになった。ポイントは1000件ごとのデータ取得。 ただ、取ってきた結果は改行を含んでいないため、そのままlessで見るのは一苦労なので、適当に置換コマンド使って改行を入れて素早くさばけるように。

Continue reading »


科学技術・学術政策研究所(NISTEP)講演会聴講

Written by bonohu in misc on 水 15 2月 2017.

予定されていた会議がなくなったため、科学技術・学術政策研究所(NISTEP)講演会「欧州のオープンサイエンス政策-その狙いと実際」に飛び入り聴講。久しぶりの文部科学省で、何気にNISTEPのあるフロワー(16F)は初。 演者は、昨日SPARC JAPANで講演していただいたRon Dekkerさんで、昨日のSPARC JAPANでのお題 Open Science in a European Perspective よりは政策に近いお話を伺うことが出来た。

Continue reading »


'第3回 SPARC Japan セミナー2016「科学的知識創成の新たな標準基盤へ向けて : オープンサイエンス再考」'

Written by bonohu in misc on 火 14 2月 2017.

2016年度SPARC JAPANセミナー3回目で今年度最後の今回は、セミナー担当を外れて、聴講者の一人として。

オープンデータやオープンサイエンスに対する考え方や温度は、分野によってさまざまであることを再認識できる良い機会であった。自分の専門分野である生命科学分野は、オープンデータに関してデータ登録が論文査読の前提であるなど先進的である部分もあるが、preprintが普及していないなどそうでない部分もあるとわかった。当然のことではあるが、自分の分野以外の周りを見渡してどうなっているか、定期的に参考にすべきであると痛感。図書館の人の役割として、複数の分野の研究者と関わりがある経験を活かして、分野を超えた提案を、自分の専門分野にタコツボ化した研究者にしてやれることが挙げられるのではないか、とふと思った次第。

twitterのハッシュタグは#sparcjp201603で、話や議論が追えるが、有志の方がtogetterにまとめてくれました。ありがとうございました。

Continue reading »


パスウェイ再構築

Written by bonohu in misc on 月 13 2月 2017.

中心となるデータベースがなく、信頼のおけるアノテーションがない場合、それを自ら付けないといけない。BLAST2GOを使うというやり方もあるが、やり方にも自らのこだわりを入れてそうしたいもの。単にAll vs AllのBLASTを実行する(reciprocal best hitを取る)よりも突っ込んだのやり方が必要となってきた。ついにこのフェーズになってきたな感。「機は熟した」

Continue reading »


歴史は繰り返す

Written by bonohu in misc on 火 07 2月 2017.

約20年前、大学院生だったころと全く同じ手順を、対象配列セットを換え、ツールを換え、やっていることにふと気づく。かつてはFTPサイトからダウンロードしてきた予測アミノ酸配列セットに対して、今はTrinity→Transdecoder実行して作成した配列セットに対して。

  1. インデックス作成して

  2. 必要な配列だけ抽出して

  3. 多重配列アラインメント実行

[shell] makeblastdb -in Trinity.fasta.transdecoder.pep -dbtype prot -hash_index -parse_seqids blastdbcmd -db Trinity.fasta.transdecoder.pep -entry_batch id_list.txt > orenoaa.txt clustalo -i orenoaa.txt -o orenoaa.fa [/shell]

最後に、配列アラインメントを可視化して分子系統樹を書いてみるところは、Jalviewを使っているのは変わらず。Jalview凄い。

かつては、自作のスクリプトや、某環境特異的なソレを使ったりして一連の作業を実現していたが、現在はすべて誰でも使えるソフトウェアを組み合わせでできる …

Continue reading »


RSEM (RNA-Seq by Expectation-Maximization)

Written by bonohu in misc on 月 06 2月 2017.
RSEM is a software package for estimating gene and isoform expression levels from RNA-Seq data.

というわけで、Trinityで遺伝子クラスターを作成した後に、Trinityがインストールされているディレクトリ(うちの環境だと /usr/local/Cellar/trinity/2.3.2/)中のutilディレクトリにある align_and_estimate_abundance.pl を実行する際に使うソフトウェア。しばらくチェックしていなかったらバージョンが上がって1.3.0になっていた。

http://deweylab.github.io/RSEM/のLatest versionのリンクからtarballをダウンロード。展開して、 [shell] make make install [/shell] でインストール完了。RSEMは直接実行するのではなく、上記のPerlスクリプトから呼び出されて使われる。

Continue reading »


WordPressテーマ変更

Written by bonohu in misc on 日 05 2月 2017.

鯖が復活して、WordPressの設定をいろいろいじっていて、気分転換にWordPressのテーマを変更してみた。バックアップ先"ぼうのブログ(Backup)"で使っていたテーマそのものだが、バナーの写真を伊豆バージョンにカスタマイズしたのと、「メニュー」を入れ子にして増えてきたAltmetrics関係の研究者系SNSなどへの直リンクを整理。 問題に思っていたsingle quoteが変換されたり、2つhyphenが続くと別の文字に変換されてしまうなどの問題点は、"SyntaxHighlighter Evolved"が有効になることで解決した模様。 CCライセンスも各エントリごとにきっちりついているし、一覧画面でも全文表示されているし、いい感じ。

Continue reading »


bonohu.jp鯖復旧

Written by bonohu in misc on 土 04 2月 2017.

マシンも老朽化しているので、別の例にもあったようにマシンリプレイスが必要となるかと思いきや、単にInternet connectionが切れていただけ。約2週間ほどダウンしていたわけだが、今回はわりと直前にバックアップしたWordpressなXMLがあったので、そのデータを元にbonohu.wordpress.comというバックアップサイトを急造して凌いでいた。本当、バックアップって重要

しかし、コードを綺麗に見せるためのプラグインを使っていたり、(これはテーマを選べば良いのかもしれないが)quoteやdouble hyphen等が別の文字に変換されて表示されて、結局のところ自分が一番不便。「雪解け」は待てず、というオチ。Wordpressの方は非公開に戻し、また今回みたいなことがあった時にactiveにして利用することに。

Continue reading »


GTExへのリンク

Written by bonohu in misc on 木 19 1月 2017.

human transcriptomeのデータベース The Genotype-Tissue Expression (GTEx) へリンク張るには、いわゆる遺伝子名(Gene Symbol)で、例えばEPAS1の場合、

http://www.gtexportal.org/home/gene/EPAS1

とすればいいが、これがEnsemblのGeneIDでもできるらしいことが、いろいろな種類のIDを試していて気づく。例えば

http://www.gtexportal.org/home/gene/ENSG00000116016

ってな具合に。実際にはENSG00000116016.9というバージョン(.9のこと)付きのIDに対するデータのようだが、それは付けていなくても大丈夫な模様。 こちらでID変換せずにすみ、リンクする手間が減って助かったが、なぜNCBI GeneIDやRefSeqIDじゃなくて、EnsemblなIDで?

Continue reading »


Papers using RefEx

Written by bonohu in misc on 火 17 1月 2017.

RefExを使ってくれている論文たちを、2017年1月現在でリストアップ。PMCの全文検索、Google Schalor、そして出版社提供のalertによる定点観測から得たデータを総合。6本あって、やはり医学系ばかりという特徴。思ったよりも多かった印象。

  • Murine colon proteome and characterization of the protein pathways. doi: 10.1186/1756-0381-5-11

  • Aberrant IDH3α expression promotes malignant tumor growth by inducing HIF-1-mediated metabolic reprogramming and angiogenesis. doi: 10.1038/onc.2014.411

  • Gene Expression Profiles of the Cochlea and Vestibular …

Continue reading »


Papers using RefEx

Written by bonohu in misc on 月 16 1月 2017.

RefExを使ってくれている論文たちを、2017年1月現在でリストアップ。PMCの全文検索、Google Schalor、そして出版社提供のalertによる定点観測から得たデータを総合。

  • Murine colon proteome and characterization of the protein pathways. doi: 10.1186/1756-0381-5-11

  • Aberrant IDH3α expression promotes malignant tumor growth by inducing HIF-1-mediated metabolic reprogramming and angiogenesis. doi: 10.1038/onc.2014.411

  • Gene Expression Profiles of the Cochlea and Vestibular Endorgans. doi: 10 …

Continue reading »


Identification of functional enolase genes of the silkworm Bombyx mori from

Written by bonohu in misc on 土 14 1月 2017.

public databases with a combination of dry and wet bench processes wordpress_id: 3081 categories:


2016年年末にacceptになったとブログエントリ「Pfamから得たプロファイルHMMでhmmsearch」で書いた論文、ついにpublish。

**Identification of functional enolase genes of the silkworm Bombyx mori from public databases with a combination of dry and wet bench processes** Akira Kikuchi, Takeru Nakazato, Katsuhiko Ito, Yosui Nojima, Takeshi …

Continue reading »


ArrayExpress mirror自動化

Written by bonohu in misc on 木 12 1月 2017.

移動中、ふと思い立って、これまで都度パスワードを入力しないといけなくなっていたascpの件を解決しようと。ちょっと調べたら、“Setting an environment variable” であっさり解決

[shell] export ASPERA_SCP_PASS=transfer-user-pw [/shell]

を実行するわけだが(transfer-user-pwは実際のパスワードに置き換えて)、シェルスクリプト中にパスワードを入力してしまうと、そのファイルのpermissionが問題となる。他のユーザーからそれが見られるからだ。それに伴い、スクリプト群をchmodする。

[shell] chmod 700 fuga.sh [/shell]

転送専用のパスワードだが、共用マシンなので、この辺気をつけてしっかり変更。 これで実行のたびにパスワードをきかれなくなり、人手がかからなくなった。

そこで、cronを仕込んで自動実行されるように。

15 17 * * 5 /home/hoge/fuga.sh

という具合にして、毎週金曜日の午後5時15分にスクリプトが実行されるように。

Continue reading »


DOIのすゝめ

Written by bonohu in misc on 火 10 1月 2017.

Nucleic Acids Research誌では、毎年年頭にデータベース特集号(Database issue)が刊行されている。いつからかは知らないが、私が大学院生の頃(20世紀末…)にはすでにそれがあった。今年(2017年)もそれが発刊され、先日ここにも書いたFANTOM5 web resourceに関する論文もそれに掲載され、巻名とページ番号、発行年が確定した。それにともない、先日まではAdvance accessの論文として扱っていたものが晴れてページ番号等がついて、引用する際の情報が得られたわけである。

実は、論文に付けられたDOI(Digital Object Identifier)は、最初から変わっていない。つまり、Advance accessであっても、ページ番号がついた後からでも、同じID(DOI)でアクセスできる。今回の場合だとそのIDはdoi: 10.1093/nar/gkw995で、このIDの前にhttp://doi.org/とつけたURL、すなわち、 http://doi …

Continue reading »


macOS Sierraにアップデート

Written by bonohu in misc on 土 07 1月 2017.

年末に予約できるようになって速攻予約していて、やっと届いたAirPods。自分へのクリスマスプレゼントのつもりだったが、やはり発送遅れ、結果として「お年玉」になってしまった。iPhone7にして充電しながらイヤホンが使えなくなってしまったのが解消され、大変快適。また、マイクも内蔵されており電話にも便利。 さらに、macOSをSierraにするとMacBookProでもイヤホン(+マイク)としても使えるということで。これまで年末であったことや互換性の問題がよくわからんのでSierraへのアップデートを渋っていたものの、さらなる利便性のため、思い切ってアップデート。何か不具合もあるかもしれぬが…。 もちろん、MacBookProでアップデートするまえにデモ機でアップデートして必要なアプリケーションが動くか、チェックはしたものの、日常的に使うマシンまではチェックできておらず。さっそくあったのが、「インターネット共有」の不具合。ずっと使っていると、コケることがある模様。

Continue reading »


2017 NBDC 新年会

Written by bonohu in misc on 木 05 1月 2017.

日頃から共同研究先としてお世話になっているNBDC (National Bioscience Database Center:バイオサイエンスデータベースセンター)の新年会に呼んでいただいたので、参加させていただく。大変貴重な、美味しい日本酒をいただいたり、関係者の皆様と話する機会をもてたり。こういう機会でもないとなかなかお話できないので、こちらも大変貴重。ありがとうございました。

講師として登壇したこともあるNGSハンズオン講習会、JST内部で表彰されていたということを知る。すべての講義が統合TV化されていることも寄与しているのだとしたら、それはそれで大変喜ばしい。やはり参加させていただいてよかった。

そういえば、DBCLSに来て&統合TVを始めて今年で丸10年。何かイベントやりますかねえ。

Continue reading »


2017年の計

Written by bonohu in misc on 日 01 1月 2017.

年末に書いた2016年を振り返って、につづいて、年頭恒例にしているその年の計を。

2017年は、大学院に入って研究を本格的に始めてからの年数がついに産まれてきてからの年数の半分を越える年ということで、ある意味節目の年。ここ数年の懸案で継続して取り組んでいるメインの仕事、公共DBの全レコードを対象としたデータ解析研究にさらに力を注ぎ、まとめたい。

節目の年、という意味では、2017年でDBCLSに移って丸10年ともなる。今後の方向性を議論しているが、その中で自分のやるべきことをしっかり方向付け、実行に移していきたい。

ここ数年単調増加している出張外泊数は抑えめに、その時間を本務の研究活動に回したい。

文章を書くことをさらに習慣づけ、考えていることの情報発信を、twitter以外の手段で行っていきたい。

Continue reading »


2016年を振り返って

Written by bonohu in misc on 水 28 12月 2016.

2016年を振り返って。

職場であるDBCLSの一部が三島に移って3年目。「連携していない」とお叱りを受けてきたDDBJとの連携に重点を置いた。5月にINSDCのミーティングに参加して、その際に同時に行ったDDBJとEBI ArrayExpressチームとのcollaborationにも。手始めとして、ArrayExpressデータのミラーリング実務を担当。その結果、DDBJにネットワーク的に近い人達にArrayExpressのデータ取得が楽に短くなったわけだが、DBCLS的にもAOEの更新が無駄なく実行できるように。結果として連携強化されただけでなく、オマケ付き。

DDBJ以外の遺伝研の研究者との連携も、これまで種を撒いてきいるが、その中で「双葉」が出てきたものがあった。なんらかの形で「実」を結んでくれるといいな。

オープンアクセス、オープンサイエンスに関連して、前年(2015年)から文科省の担当官からヒアリング等を受けるようになっていたが、それに関連したSciREXにも関わるように。その季刊誌、SciREX Quarterly にリレーエッセイを書かせてもらった。それとは別だが、似たメンバーの集まる国立情報学研究所の国際学術情報流通基盤整備事業(SPARC …

Continue reading »


2016年出張外泊数

Written by bonohu in misc on 火 27 12月 2016.

一昨年から数えだしている「仕事で外泊」した日数。明日(12月28日)で2016年仕事納め、というわけで、2016年の日数確定。 なんと77泊。 1年は365日なので、単純に計算しても5日に1日は外泊している。2014年50泊、2015年65泊だったので、年々増加している。 もうちょっとやるべきことの「選択と集中」すべきだな。

Continue reading »


Trim Galore! のインストール

Written by bonohu in misc on 月 26 12月 2016.

Trim Galore! (trim_galore)を使うためにはfastqcとcutadaptのインストールが必要となる。cutadaptはpipでインストールできるのだが、そのpipはデフォルトでは入っていない。 pipのインストールには、いくつかのやり方があるが、ここではhomebrewでpython3を入れて、その際に入るpip3を利用する方法をとる。ここでpython3,pip3と末尾に3が付いているのは、pythonのバージョン3のそれ、ということで、デフォルトで入っているバージョン2のそれらと区別するためにそうなっている。

[shell] brew install -v python3 [/shell]

homebrewでのインストールを推奨しているのは、通常使う(rootでない)ユーザーでのインストールができるからで、permissionの問題で後に困る可能性を軽減するため、である。

余談だが、ここで使っているシェル(bashとか)によってはrehashを実行しないと、以下のコマンドを続けて入力した時に

command not found: pip3

と言われるので、忘れずに実行する。シェルを再度起動し直す場合には不要である。

そして、いよいよpip3を使ってcutadaptをインストールする。

[shell] pip3 install cutadapt [/shell]

trim_galoreは、zipをダウンロードしてきて展開、/usr/local …

Continue reading »


倉廩実ちて礼節を知る

Written by bonohu in misc on 日 25 12月 2016.

今月(2016年12月)は、AJACSadvanced講習会や共同研究関係で、次世代シークエンサーから得られたデータを自ら直接解析することに関わる事が多く。1サンプルあたり数Gb-数十Gbの大きな配列データを直接データ解析する際に強く思ったこと。 解析環境がきちんとしていれば、UNIX経験者でなくたってちゃんと出来るという動かぬ事実。多くの困難は、それを実行する環境(メモリとストレージのケースが多い)に起因している。ある程度良い解析環境があれば、多くの人が漠然と持っている「困難」は軽減され、乗り越えられるものなのだ。 次世代シークエンサーDRY解析教本の最初にも書かせてもらったことだが、メモリはケチってはいけない。ストレージはUSB3経由であとから足せるが、こればっかりは後から変更するのは困難である。CPUクロック数は時間を待てば解決できるが、メモリがないのはどうしようもない。「安物買いの銭失い」にならぬように。

Continue reading »


bashのバッチスクリプト

Written by bonohu in misc on 金 23 12月 2016.

ワイルドカードによるファイル指定でそのコマンドに一括で引数で指定できず、数多くのファイルに対して同じ処理を繰り返したい時。もしくはそのファイルの数が数万とか多く、引数指定するには数が多くなりすぎて無理な時。シェルスクリプトでバッチ処理が有効。ファイル一つづつに対して、シーケンシャル(sequential)にバッチ処理したい時にbashのシェルスクリプトで対処する場合には、

1
2
3
4
#!/bin/sh
for f in *.bz2 ; do
     bunzip2 $f  #command to execute here.
done

てな具合にfor f in * ; do ... done定型句を使う。

ただ、この場合、 [shell] bunzip2 *.bz2 [/shell] でも可だが。そうはできないような処理の場合に役立つ場合も。

Continue reading »


バックアップツールとしてのrsync

Written by bonohu in misc on 金 23 12月 2016.

卒論、修論、追い込みの方も多い今日このごろ、バックアップは重要。大事なデータほどきっちりとバックアップを。もちろん、簡便にフォルダのコピーだけでもよいのだが、何回もコピー続けていると何回も同じファイルを重複してコピーすることになって煩雑になるかと。そこで、rsyncコマンド。rsyncを使うと差分コピーが可能に。

その解説は、次世代シークエンサーDRY解析教本p35に。ここでは同一のコンピュータ上でrsyncコマンドでコピーする方法が説明されている。つまり [shell] rsync -av --exclude '/' /Users/bono/Documents/ /Volumes/USBHDD [/shell] のようにすると、/Users/bono/Documents以下のファイルとフォルダ(ディレクトリ)を/Volumes/USBHDD以下にコピーすることになる。1回目はフルバックアップなので時間がかかるが、2回目以降は同じファイルはコピーされず、差分のファイルだけがコピーされるため、ファイル転送が高速化される。定期的なミーティング終了後に実行するなど、週1回や月1回など習慣づけて行うことをお勧めする。

実はこのコマンド、ネットワーク越しのコンピュータに対しても実行可能である。受け側のコンピュータにsshでアクセスできるように設定されていればだが、以下のようなコマンドで。 [shell] rsync -av -e ssh --exclude …

Continue reading »


Pfamから得たプロファイルHMMでhmmsearch

Written by bonohu in misc on 木 22 12月 2016.

カイコ(Bombyx mori)のEnolaseに関する論文がacceptになりました。研究成果としてすでに公開されている配列情報データベースから候補をドライ解析(in silico)で探し出してきて、それらをウェットベンチで精査し、実際に確認したところに新規性がある研究です。この論文で使用した候補の探し方を紹介します。

まずはhmmerをインストールします。

brew install -v hmmer

で簡単に入ります。

そして、タンパク質ファミリーのデータベースPfamから利用するタンパク質ファミリーを検索します。今回の場合はEnolase_CとEnolase_Nがそれで、どれが利用すべきエントリかを選ぶところで生物学的な知識が発揮されます。Curation & model タブ中のHMM informationにあるdownloadからタンパク質配列のプロファイル(profile HMM)をダウンロード、ダウンロードしたファイルをEnolase_N.hmmと名前を変更し、以下のようにhmmsearchを実行します。

hmmsearch Enolase_N.hmm Bombyx_mori.GCA_000151625.1.30.pep.all.fa

Enolase_C.hmmに関しても同様に実行し、ヒットしてきた=このドメインを含むとみなされる候補のcDNA(or 予測遺伝子 …

Continue reading »


PGXユーザー勉強会#1

Written by bonohu in misc on 火 20 12月 2016.

Oracle Labs PGX(Parallel Graph Analytics) というグラフに対するクエリや分析のためのフレームワークのユーザー勉強会にお誘いいただいたので、参加。かつては専用のプログラムを書いてKEGGの代謝経路の最短経路とかを計算していたものだが、これを使うとそういうのだけでなく、グラフ構造に基づく解析がいろいろとできる模様。やってみたいことが簡単にできそうなので、今後もちょっといじってみたい。

Continue reading »


Trinityの結果をtransdecoderでアミノ酸配列に翻訳する

Written by bonohu in misc on 月 19 12月 2016.

先日のAJACSadvanced講習会で、Trinityで得た結果をアミノ酸配列に翻訳するプログラムをここで言及していないのに気がついたので。Trinityで得られるのは塩基配列レベルの情報で、それをアミノ酸配列に翻訳してくれるのがこのtransdecoder。 [shell] brew install -v transdecoder [/shell] でインストールされる。 [shell] TransDecoder.LongOrfs -t Trinity.fasta TransDecoder.Predict -t Trinity.fasta [/shell] のように実行する。 実行したディレクトリにTrinity.fasta.transdecoder.pepというファイルができて、それにアミノ酸配列がFASTA形式で記録されている。詳しくはtransdecoderの本家ウェブサイト参照

Continue reading »