ASDiv
ASDiv(Academia Sinica Diverse MWP Dataset)は、数学のワードプロブレム(MWP)に特化したデータセット。
このデータセットは、多様な数学の問題を集めたもので、特に自然言語処理(NLP)や機械学習の分野での研究やアプリケーション開発に使用される。 基本的な算数問題:
例: 「リンダはりんごを7個持っています。彼女の友達がさらに5個のりんごを持ってきました。リンダは合計でいくつのりんごを持っていますか?」
割合と比率に関する問題:
例: 「クラスには男の子が15人、女の子が10人います。男の子と女の子の比率はいくつですか?」
幾何学的問題:
例: 「正方形の一辺の長さが4cmです。この正方形の面積はいくつですか?」
代数的問題:
例: 「ある数に3を足すと11になります。その数はいくつですか?」
実践的な応用問題:
例: 「ジョンは時速40キロメートルで2時間運転しました。彼は合計で何キロメートル運転したでしょうか?」
我々はASDiv (Academia Sinica Diverse MWP Dataset)を発表する。ASDivは、様々なMWPソルバーの能力を評価するための、多様な(言語パターンと問題タイプの両方において)英語数学単語問題(MWP)コーパスである。AIの進歩を研究するための既存のMWPコーパスは、言語使用パターンや問題タイプのいずれにおいても限定的である。そこで我々は、より多くのテキストパターンと小学校で習うほとんどの問題タイプをカバーする2,305のMWPからなる新しい英語MWPコーパスを提示する。各MWPには問題の種類と学年(難易度を示す)が注釈されている。さらに、我々は与えられたMWPコーパスの語彙使用の多様性を測定する指標を提案し、ASDivが既存のコーパスよりも多様であることを実証する。実験により、我々の提案するコーパスはMWPソルバーの真の能力をより忠実に反映していることが示された。