帰納的に多様な巨大論理推論コーパスによりLLMの汎用論理推論能力を向上させる
言語モデルの推論能力の低さは, これら文章中に推論のサンプルが十分数含まれていなかった可能性を示唆する (1で先行研究を引いて)
推論サンプルを別途大量に作成し LLM に学習させることで,推論能力を向上させることができると考えられる
テンプレートを埋めるようにデータを作る(自動生成)
テンプレートの例 (2.1)
「ぴよぴよがある」「もしぴよぴよがあれば、ぽよぽよもある」 -> 「ぽよぽよもある」
(IMO:LLMに形式論理の記号操作を学習させたいと理解した)
LLMは知識は豊富だけれど、推論は苦手だよ。
これを克服するため、高品質な論理推論サンプルを大量に自動生成し、LLMを追加学習したよ。
広汎なベンチマークで大きな性能向上を得た‼️