多腕バンディット問題
どれを選択すれば期待利得を最大化できるかを解く問題
たとえば: スロットマシンがいくつかあって、試行によって得られた統計量だけでなく、信頼区間を使ってどのマシンを選択すれば良いかを判断する
https://ja.wikipedia.org/wiki/多腕バンディット問題
一定の限られた資源のセットを競合する選択肢間で、期待利得を最大化するように配分しなければならない問題
#機械学習
#統計学