MiniWoB++
https://scrapbox.io/files/668e1fa9d45072001d666f21.png
強化学習のためのWebインタラクションベンチマーク
MiniWoB++(Miniature World of Bits++)は、ウェブタスクの自動化と強化学習の研究に使用される拡張版環境。
この環境は、元のMiniWoBベンチマークを基にしており、ブラウザ上で実行される様々なタスクが含まれている。
これらのタスクは、単純なボタンクリックから複雑なフォーム入力まで多岐にわたる。
主な特徴
多様なタスクセット
MiniWoB++には、100以上のウェブインタラクション環境が含まれており、エージェントがさまざまなタスクを学習および実行することができる
プログラム的なインタラクション
MiniWoB++はJavaScriptとPythonのインターフェースを提供しており、プログラム的にタスクを実行および制御することが可能。
PythonインターフェースはGymnasium APIに従い、Selenium WebDriverを使用してブラウザ内での操作を行なう。
柔軟な強化学習のサポート
各タスクにはプログラム的な報酬が設定されており、標準的な強化学習技術を使用してエージェントの学習をサポートする。
利用例
例えば、エージェントが特定のボタンをクリックするタスクを学習する場合、エージェントはSelenium WebDriverを使用してブラウザ内のボタンを特定し、クリック操作を行なう。
この過程で報酬が与えられ、エージェントは試行錯誤を通じてタスクを効率的に完了する方法を学習する。
わかりやすい解説記事
https://walkingmask.hatenablog.com/entry/2018/03/01/153348
論文:
https://arxiv.org/abs/1802.08802
公式:
https://miniwob.farama.org/index.html
GitHub:
https://github.com/Farama-Foundation/miniwob-plusplus