【技术创作101训练营】从强化学习到学界前沿DQN,你需要了解这些
大家好,我是大鹅,本次演讲会介绍强化学习RL的基础知识,基本方法,以及如何推导到DQN,和关于DeepMind的Playing Atari with Deep Reinforcement Learning(DQN学习打砖块游戏)这篇论文的一些理解,后续改进方向,还有一些具体实现。
演讲大纲:
- 强化学习基础
- MDP马尔科夫决策过程
- Value Function 价值函数
- Bellman方程
- Action-value Function 动作价值函数
- Optimal Value Function 最优价值函数
- Q-learning
- DQN
- 后续的Improvement方向
- 参考文献
(演讲内容主要是公式推导的与算法介绍,PPT里都有)
Ref
http://www0.cs.ucl.ac.uk/staff/D.Silver/web/Teaching.html (David Silver的课程PPT)
https://zhuanlan.zhihu.com/p/21547911
http://www.cnblogs.com/wangxiaocvpr/p/5601972.html
http://www.cnblogs.com/jinxulin/p/3526542.html
http://blog.csdn.net/buyulian/article/details/79209338
DeepMind, Playing Atari with Deep Reinforcement Learning,2013
周志华,机器学习西瓜书