68分钟
强化学习:Q-learning与DQN算法
强化学习系列课程主要包括DQN算法原理讲解、实例演示、改进与应用技巧三大部分。第一部分解读了Q-learning和DQN算法;第二部分演示了DQN算法整体任务流程:探索、获取、计算、训练与更新;最后补…
强化学习系列课程主要包括DQN算法原理讲解、实例演示、改进与应用技巧三大部分。第一部分解读了Q-learning和DQN算法;第二部分演示了DQN算法整体任务流程:探索、获取、计算、训练与更新;最后补充了DoubleDQN的问题解决、DuelingDQN的整体架构和改进方法、MultiSetp策略和连续动作处理方法。
整体风格通俗易懂,每章节开头用一张图、一个视频、或者一句话解读核心知识点,课程附有详细的demo和公式,适合准备入门强化学习并进阶提升的同学们。
一、Q-learning与DQN算法
- 1.算法原理通俗解读
- 2.目标函数与公式解析
- 3.Qlearning算法实例解读
- 4.Q值迭代求解
- 5.DQN简介
二、DQN算法实例演示
- 1.整体任务流程演示
- 2.探索与action获取
- 3.计算target值
- 4.训练与更新
三、DQN改进与应用技巧
- 1.DoubleDQN要解决的问题
- 2.Dueling-DQN改进方法
- 3.Dueling整体网络架构分析
- 4.MultiSetp策略
- 5.连续动作处理方法
唐宇迪
同济大学硕士,华东理工大学博士