LLMが人間を使って試行錯誤するシステムの設計

おもろそうblu3mo.icon

探索したいことの木を、dfs的に探索させていく

試行錯誤ログは圧縮して全体コンテキストに積む

正直最初は非現実的なことをやらせてくる（じゃがりこをメルカリで転売）

けど、これを繰り返していくうちに現実のモデルが育ってくるのでは

適宜抽象的思考もさせつつこれをずっとやっていると、そのうち成果が上がりそう

LLMの弱みを解消できそう　

人間への指示は可能な限りわかりやすく

タスクの細分化はo1とは別のAIにやらせると良さそう。コンテキストがもったいない

イメージ

https://gyazo.com/6d6ec5de8ca53c6dcee79cf50065f043https://gyazo.com/b085c695c646ad9149519b9cec95c848