强化学习的入门资料太多,但讲得清楚又实用的不多。《第 9 课:强化学习与 DQN.pdf》就是个还不错的选择,思路清晰,还穿插了多应用案例。比如从 Atari 游戏的像素画面学会玩 Breakout,这事听着就挺炸裂的吧。

强化学习的核心问题像是credit assignmentexploration-exploitation dilemma,说白了,就是到底要多大胆去尝试,学到的到底是对是错。文里还提到用Q-learning来估未来收益,状态多了还可以接入深度神经网络搞定高维空间。嗯,蛮贴近实战的。

比较有意思的一点是它不是死讲算法,比如讲到“重演”策略,顺带提了自动驾驶、广告推荐这些落地场景,讲得挺通透。要是你之前只是刷过几个教程,这份资料能帮你理理整个强化学习的框架。

想深入点?推荐你一起看看下面几个资源:
- 从马尔可夫决策过程到深度强化学习
- 强化学习概览
- 强化学习应用解析
- 深度强化学习 matlab 程序源码

如果你在找一份比较系统又接地气的入门读物,可以先把这份 PDF 看一遍,记得多动手,多跑几个例子,会更有感觉。