AddSub
AddSubは、大規模言語モデル(LLM)の推論能力を評価する際に使用されるデータセットの一つ。
このデータセットは、LLMが算術的推論タスクをどのように処理するかをテストするために使用される。
具体的には、AddSubは単純な足し算と引き算の問題を含むデータセットで、これらのタスクを解決するためにLLMの能力を評価するのに役立つ。
SingleEqはより一般的な単一計算問題(足し算、引き算、掛け算、割り算など)を含むのに対し、AddSubは特に足し算と引き算の問題に焦点を当てたデータセット 具体例
https://scrapbox.io/files/659fe3f71e04c10026552f70.png