68分钟

强化学习:Q-learning与DQN算法

强化学习:Q-learning与DQN算法

强化学习系列课程主要包括DQN算法原理讲解、实例演示、改进与应用技巧三大部分。第一部分解读了Q-learning和DQN算法;第二部分演示了DQN算法整体任务流程:探索、获取、计算、训练与更新;最后补…

课程分类
人工智能 | 技术开发
适用人群
分析师, 工程师, 研究员
课程标签
强化学习,Q-learning,DQN算法
强化学习系列课程主要包括DQN算法原理讲解、实例演示、改进与应用技巧三大部分。第一部分解读了Q-learning和DQN算法;第二部分演示了DQN算法整体任务流程:探索、获取、计算、训练与更新;最后补充了DoubleDQN的问题解决、DuelingDQN的整体架构和改进方法、MultiSetp策略和连续动作处理方法。 整体风格通俗易懂,每章节开头用一张图、一个视频、或者一句话解读核心知识点,课程附有详细的demo和公式,适合准备入门强化学习并进阶提升的同学们。
一、Q-learning与DQN算法 - 1.算法原理通俗解读 - 2.目标函数与公式解析 - 3.Qlearning算法实例解读 - 4.Q值迭代求解 - 5.DQN简介 二、DQN算法实例演示 - 1.整体任务流程演示 - 2.探索与action获取 - 3.计算target值 - 4.训练与更新 三、DQN改进与应用技巧 - 1.DoubleDQN要解决的问题 - 2.Dueling-DQN改进方法 - 3.Dueling整体网络架构分析 - 4.MultiSetp策略 - 5.连续动作处理方法
唐宇迪

唐宇迪

同济大学硕士,华东理工大学博士