68分钟

强化学习：Q-learning与DQN算法

强化学习系列课程主要包括DQN算法原理讲解、实例演示、改进与应用技巧三大部分。第一部分解读了Q-learning和DQN算法；第二部分演示了DQN算法整体任务流程：探索、获取、计算、训练与更新；最后补…

登录查看更多信息

课程分类: 人工智能 | 技术开发
适用人群: 分析师, 工程师, 研究员
课程标签: 强化学习,Q-learning,DQN算法

强化学习系列课程主要包括DQN算法原理讲解、实例演示、改进与应用技巧三大部分。第一部分解读了Q-learning和DQN算法；第二部分演示了DQN算法整体任务流程：探索、获取、计算、训练与更新；最后补充了DoubleDQN的问题解决、DuelingDQN的整体架构和改进方法、MultiSetp策略和连续动作处理方法。整体风格通俗易懂，每章节开头用一张图、一个视频、或者一句话解读核心知识点，课程附有详细的demo和公式，适合准备入门强化学习并进阶提升的同学们。

一、Q-learning与DQN算法 - 1.算法原理通俗解读 - 2.目标函数与公式解析 - 3.Qlearning算法实例解读 - 4.Q值迭代求解 - 5.DQN简介二、DQN算法实例演示 - 1.整体任务流程演示 - 2.探索与action获取 - 3.计算target值 - 4.训练与更新三、DQN改进与应用技巧 - 1.DoubleDQN要解决的问题 - 2.Dueling-DQN改进方法 - 3.Dueling整体网络架构分析 - 4.MultiSetp策略 - 5.连续动作处理方法

唐宇迪

同济大学硕士，华东理工大学博士