ReAct
ReAct は、reasoning と acting を交互に行わせる枠組みを明示的に打ち出した代表的な概念です。この枠組みでは、モデルは reasoning trace を生成して方策や仮説を更新し、そのあと action を生成して外部環境に働きかけ、さらに observation を受けて次の reasoning に進みます。したがって、ここで interleave されるのは、推論と読解過程ではなく、推論と行為、そして行為を通じて得られる観測です。この意味で ReAct は、interleaved thinking を tool use を含む実践的な agent 形式へ押し広げた先行的枠組みとして位置づけられます。とくに「途中で考える」とは何かを、静的な scratchpad ではなく、環境との循環のなかで定義した点に意義があります。
参考:ReAct: Synergizing Reasoning and Acting in Language Models https://arxiv.org/abs/2210.03629