Genomic Expression Archive debut
Genomic Expression Archive (GEA) に登録してみた
DDBJがメンテナンスから戻ってきた。 メンテナンスの前に投げてあった遺伝子発現データのアーカイブ、Genomic Expression Archive (GEA)から正式にアクセッション番号が発行されて戻ってきた。
- GEAとは何か。その論文が2019年のNucleic Acids Research (NAR)のDB issueに出ています。 DDBJ update: the Genomic Expression Archive (GEA) for functional genomics data.
これまでSequence Read Archive (SRA; DDBJではDRAともいうが)にすでに登録しているのであれば、それほど大変な手続きではない。 すでに登録したDRAの番号を入れれば、多くの情報が自動でGEAに書いてもらえるし、ヒトやマウスなどメジャーな実験動物をやっている場合は特に手間は少ないかと。 メタデータもSRAよりはサンプルやRNAの抽出方法など少々詳しく書かないといけないところはあるものの、それほど大変な分量ではなかった。
発現定量値のファイルフォーマットも特に決まっているわけでないようだし。 ここの定量結果を別々のファイルにしてもいいし、それらをまとめてexpression matrixにしてもいいし。 ただ、それらのファイルのMD5をメタデータとしてカラム中にそれを書いて登録しないといけないというのはさすがに気がつかなかったが。
SRAに配列は登録したものの、論文査読の時に発現定量値も公開する様に言われて論文のsupplemental materialとして載せるよりは、GEAにも登録すると公式なデータベースのエントリとして扱われ、再利用性も高い。
どうしてもGene Expression Omnibus (GEO) に登録しないといけないのなら仕方がないが、DRAとGEAに登録しても国際的には同等に流通するように関係者が頑張っておりますので。 日本でせっかくそういうサービスをやっているのだから、是非ご利用いただきたく。