バンディット問題の理論とアルゴリズム
https://gyazo.com/478780289217f7353fd0a54f759bf34e
バンディット問題
の理論とアルゴリズム-
機械学習プロフェッショナルシリーズ
本多 淳也
(著),
中村 篤祥
(著)
Amazon
7章で
ロジスティック回帰
の上での
トンプソンサンプリング
が語られているらしい
http://nbviewer.jupyter.org/github/hagino3000/notebooks/blob/master/MLP_bandit/Chap7_binary_reward.ipynb