データベースのID番号

かつては塩基配列を解読したらそれをINSDC(International Nucleotide Sequence Database Collection; DDBJ/EMBL(ENA)/GenBankのこと)に登録してから論文を投稿するという流れで研究が進んでいました。例えば、AB016472とかがそのアクセッション番号と呼ばれるもので、バージョン付きのAB016472.1という形のそれを見ることも多いでしょう。これらのデータベースエントリはDDBJのgetentryやNCBIのNucleotideのページなどから閲覧できます。 また、NCBIのNucleotideからは、RefSeqというNCBIでまとめられたReference Sequenceのデータベースエントリも検索可能です。例えばNM_117704.6などがそうで、mRNAの配列はNMから始まるエントリ番号を持ちます。これらのRefSeqの配列検索や閲覧にはDBCLSで開発維持管理しているGGRNAが便利です(上述の例の検索結果)。 さらに、最近では上記の公的な塩基配列データベースではなく、独自に作成したデータベースにのみ登録されている配列情報も増えてきております。そういった独自のデータベースIDも流布しており、そのようなIDでインターネット検索(Google検索)するとそれぞれのデータベースエントリに行き着けることもままあります。しかしながら、論文報告する際には上述のINSDCに登録することが必要なのは、次世代シーケンサーが出てきてものすごい量の塩基配列が一度に読めるようになった今となっても全く変わっておりません。すでにそのようなデータベースに入っているものであっても論文報告で「主役級」の遺伝子であれば、登録しましょう。きっと読み直しもしたのだろうし。


Written by bonohu in misc on 木 20 3月 2014.