研究内容
私が現在従事する主な研究分野は、一般に「IR(Institutional Research)」や「ラーニングアナリティクス」と呼ばれる分野です。いずれも、「データをもとにした教育改善」という共通した目的がある領域です。私にとって、IRは研究分野でもあり、業務上実践している領域でもあります。
より根本的には、
数理的手法(数理モデル)により、
(大規模な)データをもとにして、
「よりよく生きること」を支援・促進する
ということが私の志向する研究の基本的な方向性だと考えています。
これが射程とするのは、本来的には医療、ビジネス、エンターテインメントと幅広いですが、なかでも、とくに「教育/学習における実践的な研究」が、現在の主たるテーマになっており、それが「IR」や「ラーニングアナリティクス」といった分野につながっています。
以下、現在行っている研究を簡単に紹介します。
hr.icon
■共同体として有機的な学びを実現するデータサイエンス教育プラットフォームの創出
(科研費基盤(B)25K00843「共同体として有機的な学びを実現するデータサイエンス教育プラットフォームの創出」(2025~2028年度))
(作成中)
https://gyazo.com/57103c4f7b6ce8a06e5e65c84269ec0e
hr.icon
■主体的学びを促進するための学習評価の可視化と共有に関する研究
(科研費基盤(C)22K02832「主体的学びを促進するための学習評価の可視化と共有に関する研究」(2022~2024年度))
(作成中)
https://gyazo.com/5b4384cb59c575933e915017a4240931
hr.icon
■学びのミクロ・マクロデータの統合的なモデル化手法の開発
(科研費基盤(C)19K03005「教学IR高度化に向けた学びのミクロ・マクロデータの統合的なモデル化手法の開発」(2019~2021年度))
本研究では、教学IRの高度化に向けたラーニングアナリティクスと教学IRの統合的運用のひとつの形を提案することをめざし、機械学習および統計的モデリングを用いた学生のミクロな学習行動とマクロな学習成果を関連づけた統合的なモデル化の手法を開発し、これを用いた教学IRの方略を策定することをめざしています。
学習行動のモデル化には、学びに関するミクロなデータ(学習管理システムのログデータ)を使用し、状態空間モデルをはじめとする統計的モデリングにより学生の学習特性や潜在的状態などを推定できるような数理モデル化の手法を考えます。さらにこの学習行動のモデルを学びに関するマクロなデータ(成績やアンケートなどの学習成果に関するIRデータ)とあわせ、機械学習のアルゴリズムにより予測モデルベースで統合的に分析する手法を開発することを考えます。
こうした統合的なモデルに基づき、従来より深いレベルで学びの成果とプロセスを関連づけることが可能な、高度な教学IR活動について検討、提案することをめざしています。
https://gyazo.com/04134a7eb4066c98cd9716cc9823b81a
hr.icon
■機械学習による修学状態予測モデルの構築と修学支援
(科研費若手(B)16K16331「機械学習による学生の修学状態モデルの構築と学習支援への展開」(2016~2018年度))
教学IRの重要な役割のひとつとして、多様な学生の個に応じた適時的な修学支援を行うために、学士課程における学生の修学状況を把握し分析することがあります。本研究では、学士課程を通して蓄積される大規模な修学データから、学生の学士課程にわたる修学状態を数理的にモデル化し、これを修学支援へ活用することについて検討しています。
大学には入学前から学士課程を通してさまざまなタイプのデータが存在しますが、本研究では、こうした学内に散在する大規模なデータを一元集約し時系列に整理したライフログを考えます。このようなデータのうち、学士課程のある時点までのデータと経年後の修学状態(「在籍/退学」や「成績」「進路決定状況」など)について着目し、これらの間の非線形写像関係を機械学習の手法を用いてモデル化することを考えています。
https://gyazo.com/a569c5b84895ea1ec8207b0485008018
hr.icon
■確率モデルを用いた修学状態のモデル化
(科研費若手(B)16K16331「機械学習による学生の修学状態モデルの構築と学習支援への展開」(2016~2018年度))
ベイジアンネットワーク、隠れマルコフモデルなどの確率モデルにより修学状態の推移を表現するアプローチの可能性を探っています。
下図はベイジアンネットワークを用いたモデル化のイメージです。時系列に整理した特徴量の間の確率構造を、有向リンクと条件付き確率表で表しています。このモデルでは、確率推論により修学状態のシミュレーションを柔軟に行うことが可能だと考えられます。「いま、このような状態になった原因はどこにあるのか?」「これからこのようにふるまったら、状況はどのように変化するか?」といったことを確率的に可視化することが想定され、これによる修学支援へと結びつけることを検討しています。
https://gyazo.com/4e5a1709048c49d91f410c61e02d30b0
ベイジアンネットワークの構築にはNTTデータ数理システムのBayoLinkを使用しています。以下のページにて、本研究成果についての論文をBayoLink活用論文として紹介いただいています。
https://www.msi.co.jp/bayolink/cases.html
また別のアプローチとして、大規模な学習上のデータから、状態空間モデルを用いて「修学意欲」のような潜在的な状態を推定することを考えています。具体例として、LMS(Learning Management System)の操作ログから、隠れマルコフモデルを用いて潜在的状態をモデル化することなどを数値的に検討しています。
https://gyazo.com/544c0bdb07fac44de31e43c8e5219368
hr.icon
ちなみに。。。
上は現在のテーマの一例ですが、もともとは(主に修士~博士課程を通して)機械学習・統計的学習におけるモデルの構造選択について研究していました。以下がその概要です。
博士論文(2007年):「モデルの精度と複雑さを考慮した進化的機械学習に関する研究」
■精度と複雑さに関する進化的機械学習
機械学習・統計的学習では、あるモデル構造のもとで、データからそのパラメータが一定のアルゴリズムにしたがって学習されます。その際、下図のように、モデルが簡単すぎると、データの背景にあるシステムの構造を十分に表現できません。逆にモデルが複雑すぎると、誤差を含む学習用のデータに「合わせすぎ」てしまい、未知のデータに対する誤差が大きくなります(過学習)。これがモデルの精度と複雑さのトレードオフ(ジレンマ)です。
https://gyazo.com/7f8dba9e57846283562966c2e7aa8465
この問題を、モデルの精度と複雑さに関する多目的最適化問題ととらえ、ニューラルネットワークの構造およびパラメータをコード化した多目的遺伝的アルゴリズムによって、多目的の意味で優れたモデル集合を獲得するというのが本研究の概略です。パターン認識や非線形システム同定への適用についての数値実験を通して有用性を検討しています。
https://gyazo.com/5ae99f6ee6f77aec58d67f1bc5e7100a
おまけ:Javaアプレットによる機械学習デモ