研究内容
私が現在従事する主な研究分野は、一般に「IR(Institutional Research)」や「ラーニングアナリティクス」と呼ばれる分野です。いずれも、「データをもとにした教育改善」という共通した目的がある領域です。私にとって、IRは研究分野でもあり、業務上実践している領域でもあります。 より根本的には、
(大規模な)データをもとにして、
「よりよく生きること」を支援・促進する
ということが私の志向する研究の基本的な方向性だと考えています。
これが射程とするのは、本来的には医療、ビジネス、エンターテインメントと幅広いですが、なかでも、とくに「教育/学習における実践的な研究」が、現在の主たるテーマになっており、それが「IR」や「ラーニングアナリティクス」といった分野につながっています。
以下、現在行っている研究を簡単に紹介します。
hr.icon
■主体的学びを促進するための学習評価の可視化と共有に関する研究
(科研費基盤(C)22K02832「主体的学びを促進するための学習評価の可視化と共有に関する研究」(2022~2024年度))
(作成中)
hr.icon
■学びのミクロ・マクロデータの統合的なモデル化手法の開発
(科研費基盤(C)19K03005「教学IR高度化に向けた学びのミクロ・マクロデータの統合的なモデル化手法の開発」(2019~2021年度))
こうした統合的なモデルに基づき、従来より深いレベルで学びの成果とプロセスを関連づけることが可能な、高度な教学IR活動について検討、提案することをめざしています。
https://gyazo.com/04134a7eb4066c98cd9716cc9823b81a
hr.icon
■機械学習による修学状態予測モデルの構築と修学支援
(科研費若手(B)16K16331「機械学習による学生の修学状態モデルの構築と学習支援への展開」(2016~2018年度))
教学IRの重要な役割のひとつとして、多様な学生の個に応じた適時的な修学支援を行うために、学士課程における学生の修学状況を把握し分析することがあります。本研究では、学士課程を通して蓄積される大規模な修学データから、学生の学士課程にわたる修学状態を数理的にモデル化し、これを修学支援へ活用することについて検討しています。 大学には入学前から学士課程を通してさまざまなタイプのデータが存在しますが、本研究では、こうした学内に散在する大規模なデータを一元集約し時系列に整理したライフログを考えます。このようなデータのうち、学士課程のある時点までのデータと経年後の修学状態(「在籍/退学」や「成績」「進路決定状況」など)について着目し、これらの間の非線形写像関係を機械学習の手法を用いてモデル化することを考えています。 https://gyazo.com/a569c5b84895ea1ec8207b0485008018
hr.icon
■確率モデルを用いた修学状態のモデル化
(科研費若手(B)16K16331「機械学習による学生の修学状態モデルの構築と学習支援への展開」(2016~2018年度))
下図はベイジアンネットワークを用いたモデル化のイメージです。時系列に整理した特徴量の間の確率構造を、有向リンクと条件付き確率表で表しています。このモデルでは、確率推論により修学状態のシミュレーションを柔軟に行うことが可能だと考えられます。「いま、このような状態になった原因はどこにあるのか?」「これからこのようにふるまったら、状況はどのように変化するか?」といったことを確率的に可視化することが想定され、これによる修学支援へと結びつけることを検討しています。 https://gyazo.com/4e5a1709048c49d91f410c61e02d30b0
ベイジアンネットワークの構築にはNTTデータ数理システムのBayoLinkを使用しています。以下のページにて、本研究成果についての論文をBayoLink活用論文として紹介いただいています。
また別のアプローチとして、大規模な学習上のデータから、状態空間モデルを用いて「修学意欲」のような潜在的な状態を推定することを考えています。具体例として、LMS(Learning Management System)の操作ログから、隠れマルコフモデルを用いて潜在的状態をモデル化することなどを数値的に検討しています。 https://gyazo.com/544c0bdb07fac44de31e43c8e5219368
hr.icon
ちなみに。。。
上は現在のテーマの一例ですが、もともとは(主に修士~博士課程を通して)機械学習・統計的学習におけるモデルの構造選択について研究していました。以下がその概要です。 博士論文(2007年):「モデルの精度と複雑さを考慮した進化的機械学習に関する研究」
■精度と複雑さに関する進化的機械学習
機械学習・統計的学習では、あるモデル構造のもとで、データからそのパラメータが一定のアルゴリズムにしたがって学習されます。その際、下図のように、モデルが簡単すぎると、データの背景にあるシステムの構造を十分に表現できません。逆にモデルが複雑すぎると、誤差を含む学習用のデータに「合わせすぎ」てしまい、未知のデータに対する誤差が大きくなります(過学習)。これがモデルの精度と複雑さのトレードオフ(ジレンマ)です。 https://gyazo.com/7f8dba9e57846283562966c2e7aa8465
https://gyazo.com/5ae99f6ee6f77aec58d67f1bc5e7100a