Toolformer
言語モデル (LM) は、特に大規模な場合、ほんの数例またはテキストの指示から新しいタスクを解決する優れた能力を発揮します。逆説的に、彼らは算術や事実の検索などの基本的な機能にも苦労しています。このホワイト ペーパーでは、LM がシンプルな API を介して外部ツールを使用する方法を学習し、両方の長所を活用できることを示します。どの API を呼び出すか、いつ呼び出すか、どの引数を渡すか、結果を将来のトークン予測に最適に組み込む方法を決定するようにトレーニングされたモデルである Toolformer を紹介します。これは自己管理型の方法で行われ、必要なのは各 API のほんの一握りのデモンストレーションだけです。電卓、Q&A システム、2 つの異なる検索エンジン、翻訳システム、カレンダーなど、さまざまなツールが組み込まれています。