強化学習参考
最近話題になった強化学習技術のまとめ
https://twitter.com/npaka123/status/1603361170093912066?s=20&t=2mWBQBiMOKCNZVoGQ5ujZA
AGIRobots
https://agirobots.com/
良いブログ
ほぼ、POMDPの設計に掛かってる気がするけど…。行動空間と観測空間と報酬関数を適切にやれるならネットワークは割と何でも良いと思うのよね。(もちろんいじって向上はあるだろうけど)
https://twitter.com/ML_deep/status/1631949568257687553?s=20
Generative Adversarial Imitation Learning
https://arxiv.org/abs/1606.03476
ChatGPT 人間のフィードバックから強化学習した対話AI
https://www.slideshare.net/ShotaImai3/chatgpt-254863623/ShotaImai3/chatgpt-254863623
強化学習100問
https://koki0702.github.io/dezero-p100/