マルチエージェント強化学習
public.icon
マルチエージェント強化学習(Multi-agent reinforcement learning: MARL)は、複数のエージェントが同時に学習し、互いに影響しながら環境内で目標を達成するための学習手法です。各エージェントは、自身の行動による環境からのフィードバック(報酬)を基に最適な行動戦略を学習していきますが、MARLでは複数のエージェントが同時に学習を進めるため、他のエージェントの行動も学習の対象となります