Self-Notes
Self-Notes は、「読み終えてから考える」のではなく、「読みながら考え、その考えを書き残す」ことを前面に出した概念です。この論文では、通常の scratchpad や chain-of-thought が文脈を読み終えたあとで reasoning tokens を追加するのに対し、Self-Notes ではモデルが任意の時点で文脈から逸れて明示的 reasoning tokens を生成でき、それを working memory としても使えるとされます。ここで interleave されるのは、推論とツール行為ではなく、推論と読解過程です。したがって、interleaved thinking をより広い認知的観点で捉え直す際の重要な補助概念になります。
参考:Learning to Reason and Memorize with Self-Notes https://arxiv.org/abs/2305.00833