强化学习的博客及配套代码 记录自己强化学习由浅入深的学习过程,目前主要参考的资料是David Silver的公开课,下面提到的代码有部分源于网络。 目录 强化学习博客与代码 强化学习博客与代码: 博客 代码 强化学习-术语和数学符号 无 强化学习(一)简介 无 强化学习(二)马尔科夫决策过程 无 强化学习(三)动态规划寻找最优策略 无 强化学习(四)不基于模型的预测 无 强化学习(五)不基于模型的控制 无 强化学习实践(一)Tic-Tac-Toe游戏 代码 强化学习实践(二)迭代法评估4*4方格世界下的随机策略 代码 强化学习实践(三)理解gym的建模思想 无 强化学习实践(四)编写通用的格子世界环境类 代码 强化学习实践(五)Agent类和SARSA算法实现 代码 强化学习实践(六)SARSA(λ)算法实现 代码 强化学习(六)价值函数的近似表示 无 强化学习实践(七)给Agent添加记忆功能 代码 强化学习(七)策略梯度 无 强化学习(八)整合学习与规划 无 强化学习(九)探索与利用 无 强化学习实践(八)DQN的实现 代码