AlfWorld
https://scrapbox.io/files/65bae5d2a418660025a5d403.png
「ALFWorld」とは、人工知能(AI)の分野で使われる用語で、特にエージェントやAIシステムが現実世界のタスクを理解し、実行する能力を訓練し評価するためのフレームワークを指す。
ALFWorldはテキストベースのインタラクション(例えば、テキストアドベンチャーゲームのような環境)と実際の物理的な操作(例えば、ロボットが物体を動かすなどのタスク)を組み合わせたシミュレーションを提供する。これにより、AIエージェントは現実世界の複雑さを模倣した環境で学習し、実際の物理的な操作においてもその学習を適用することができる。
ALFWorldは、AIがより複雑で現実的なシナリオで効果的に機能するためのステップとして重要です。これは、AIの学習と決定過程を現実の環境に近づけ、より実用的で適応性のあるシステムの開発を目指しています。
https://scrapbox.io/files/65bae4d13f77d2002696fa85.png
論文
「キッチンの冷蔵庫に洗ったリンゴを入れてくれ」という単純な要求があれば、人間は純粋に抽象的な言葉で推論し、動作シーケンスを想像し、成功の可能性、プロトタイプ性、効率性を採点することができる。問題のキッチンを見れば、そのシーンに合わせて抽象的な計画を更新することができる。具現化されたエージェントも同じ能力を必要とするが、既存の研究は、抽象的な推論と具体的な実行の両方に必要なインフラをまだ提供していない。我々は、エージェントがTextWorld (Côté et al., 2018)で抽象的なテキストベースの方針を学習し、次にALFREDベンチマーク(Shridhar et al., 2020)の目標を豊かな視覚環境で実行することを可能にするシミュレータであるALFWorldを導入することで、この制限に対処する。
ALFWorldは、TextWorldで学習された抽象的な知識が、具体的で視覚的に根拠のある行動に直接対応する、新しいBUTLERエージェントの作成を可能にする。その結果、我々が経験的に実証しているように、これは視覚に基づいた環境のみで訓練するよりも優れたエージェントの汎化を促進する。BUTLERのシンプルでモジュール化された設計は、研究者がパイプラインの全ての部分(言語理解、計画、ナビゲーション、視覚的情景理解)を改善するためのモデルに集中することを可能にする。