Python de Text Mining
Pythonで学ぶテキストマイニング入門
徳島大学の石田基広先生によるPythonで学ぶ テキストマイニング入門をご恵送いただいた。 約10年前はRからMeCabを動かすやり方だったが、今は昔Pythonからそうするやり方を実際のコマンドとともに解説されている。 第9章の「テキストの分類」では、教師なし学習で使う統計手法、特に遺伝子発現(トランスクリプトーム)解析したサンプルの分類の際によく使うクラスター分析についても解説が。 正直、これまでこの分析をPythonベースでやったことがなかったので、とても参考になった。
上述のように、かつてはRでMeCabを動かしており、そのRでテキストマイニング、の本も石田先生が出されていた。
この石田先生のRでテキストマイニング本がきっかけで、分野は異なるがテキストマイニングに興味の持つ複数の大学院生が、かつての職場にRA(Research Assistant)として出入りしてくれることとなった。 そして、その知り合いたちがRAとして集まってきて、「統合牧場」に。
今回も同様にテキストマイニングに興味の持つ学生がうちのラボに出入りしてくれて、新たな「牧場」となるきっかけになったらいいなあ。