LLMが人間を使って試行錯誤するシステムの設計
おもろそうblu3mo.icon
探索したいことの木を、dfs的に探索させていく
試行錯誤ログは圧縮して全体コンテキストに積む
正直最初は非現実的なことをやらせてくる(じゃがりこをメルカリで転売)
けど、これを繰り返していくうちに現実のモデルが育ってくるのでは
適宜抽象的思考もさせつつこれをずっとやっていると、そのうち成果が上がりそう
LLMの弱みを解消できそう
人間への指示は可能な限りわかりやすく
タスクの細分化はo1とは別のAIにやらせると良さそう。コンテキストがもったいない
イメージ
https://gyazo.com/6d6ec5de8ca53c6dcee79cf50065f043https://gyazo.com/b085c695c646ad9149519b9cec95c848