MathQA
MathQAは、数学的な問題解決能力と自然言語処理(NLP)を組み合わせたタスク。 このデータセットは、AQuA-RATデータセットの問題に新しい表現言語を注釈することで収集された。 AQuA-RATは問題、選択肢、理由、正しい選択肢を提供しているが、この理由はしばしば不完全で時に不正確。
MathQAは、これらの理由を修正し、AQuA-RATの一部に段階的な解決策を提供した。
MathQAの問題には、以下のような要素が含まれる:
問題:たとえば、「48km/時の速度で走る列車がポールを9秒で通過する。列車の長さはどれくらいですか?」
理由:この問題を解くための計算の手順。例えば、スピードの計算や列車の長さの計算など。
選択肢:複数の答えの中から正しいものを選ぶ。例:a) 140、b) 130、c) 120、d) 170、e) 160。
正しい選択肢:この場合は「C」。
MathQAの問題は、数学的な問題を文章形式で表現し、解決するために必要な計算手順をAIが理解し、適切な計算を行い、正解を導き出す能力を評価するために使用される。このデータセットは、AIが現実世界の問題に基づいた数学的な問題をどの程度正確に解決できるかを測るのに役立つ。