データ科学研究力養成プログラムについて

早稲田大学データ科学センターでは「専門性」と「データ科学の知識」を兼ね備えた人材育成を進めるにあたり、専門分野における修士課程を修めることに加え、「データ科学そのものの研究(データ科学手法に関する研究、データ科学を応用したシステムの開発、など)」ができる人材の育成を目的として、データ科学研究力養成プログラムを提供しています。これは、所属研究科の研究とは別に、データ科学センター教員の指導のもとでデータ科学に関する研究演習・論文作成を行い、データ科学そのものの研究ができる人材の育成を目指すプログラムです。認定条件を満たす学生に対しては、プログラム認定証明書を発行します。プログラムの詳細についてはこちらをご参照ください。

所属研究科の修士論文に関する研究と並行してデータ科学に関する研究を行うことになりますので、学生の皆さんにとっては負担の大きいものになると思いますが、データ科学のエキスパートを目指したい方は積極的にチャレンジしてほしいと思います。受入定員やマッチングの事前確認のために、プログラム参加希望者には事前相談が推奨されています。事前個別相談を希望する学生はこちらからお申し込みください。

堀井研究室における研究の進め方

その時点での研究室の研究テーマや、プログラムを履修する学生の希望にもよりますが、堀井研究室では概ね以下のような方針で進めたいと考えています。

  • 研究の進め方について
    • 原則として毎週打合せ(ゼミ)を通して進捗確認をします。
  • 研究テーマについて
    • 研究室のテーマについてはある程度理解した上でプログラムに参加していると思います。
    • 特に希望する研究テーマがない学生に対しては教員からいくつかの候補のテーマを提示します。
  • 研究の進め方について
    • 開始時に基礎ゼミ(機械学習、ベイズ統計学)を実施し、必要な基礎知識について復習します。ゼミでは、学生自身が教科書を読み、発表資料(レジュメ)を作成した上で、発表を行います。ゼミの準備の仕方については例えばこちらのページを参照してください。(リンク先は数学に関するセミナーの準備に関するものですが、基本的な考え方は同様となります。)
    • 選択されたテーマに関する論文(英語)を調査し理解する。
    • 必要に応じてプログラムを作成し、実験を行い、従来手法について理解を深める。
  • 研究の目標について
    • 原則として、新しい手法を提案し、その手法をコード実装し、提案手法の数値実験及び評価を行います。
    • 新しい手法というのは言葉の通り、それまでには世の中の誰も考えていない手法ということですが、新しければ何でも良いというわけではなく、またそのような手法を考えるのは簡単なことではありません。教員は新しい手法を考える手助けをしますが、教員の言うとおりにやっていれば必ずできるということが保証される訳ではありません。
    • 最終的には学会発表や論文投稿など、対外的に研究内容を発表することを目標とします。
    • 学会発表に対する発表練習・学会参加・出張、論文投稿に対する論文執筆・論文投稿については支援します。

参考図書

プログラムに参加する前に勉強をしておきたい学生向けにいくつか参考書を提示しておきます。

データ科学に関する基礎知識:

  • 早稲田大学データ科学教育チーム著、「データ科学入門Ⅰ」、サイエンス社
  • 早稲田大学データ科学教育チーム著、「データ科学入門Ⅱ」、サイエンス社

機械学習に関する基礎知識:

  • G. Games, D. Witten, T. Hastie, R. Tibshirani 著、落海浩、首藤信通訳、「Rによる統計的学習入門」、朝倉書店
  • K. P. Murphy, F. Bach著、「Machine Learning: A Probabilistic Perspective」、MIT Press

ベイズ統計学に関する基礎知識:

  • ピーター・D・ホフ著、入江薫、菅澤翔之助、橋本真太郎訳、「標準ベイズ統計学」、朝倉書店

統計的因果推論に関する基礎知識:

  • 宮川雅巳著、「統計的因果推論ー回帰分析の新しい枠組みー」、朝倉書店
  • Judea Pearl、Madelyn Glymour、Nicholas P. Jewell著、落海浩訳、「入門統計的因果推論」、朝倉書店
  • 黒木学著、「構造的因果モデルの基礎」、共立出版