マルコフ決定過程
MDP
:
Markov decision process
動的計画法
ベルマン方程式
強化学習
Q学習
https://ja.wikipedia.org/wiki/マルコフ決定過程