228分钟
AI Agent智能体的基础技术原理
你是否在AI技术浪潮中感到这些困惑? 了解众多Agent框架,却不知如何结合实际业务设计落地? 知道大模型很重要,但不清楚如何将其转化为自主决策的智能系统? 面对GRPO、A2A、MCP等技术概念,缺…
你是否在AI技术浪潮中感到这些困惑?
了解众多Agent框架,却不知如何结合实际业务设计落地?
知道大模型很重要,但不清楚如何将其转化为自主决策的智能系统?
面对GRPO、A2A、MCP等技术概念,缺乏系统的代码实现与调优经验?
这些问题直接影响AI项目从原型到产品的转化效率。Agent技术正在成为构建下一代智能应用的核心,但如何系统掌握其架构与方法,仍是许多开发者与团队面临的挑战。
本课程由互联网大厂高级算法专家数知客导师亲授,她拥有:
多项智能体、广告算法领域发明专利
北京市人工智能中级职称认证
《基于NLP内容理解》等畅销书作者经验
课程三大核心模块
1. Agent基础与架构设计
Agent的定义、分类及与传统程序的差异
基于大模型的Agent技术框架(感知-决策-执行)
典型架构剖析:记忆模块、规划能力与工具调用机制
2. 核心算法与训练方法
演员-评论员算法(Actor-Critic)原理与实现
DeepSeek的GRPO算法解读与代码实战
使用Verl框架进行SFT与RLHF训练
3. 组件实现与系统集成
Function Calling机制与外部工具调用
Memory模块实现:短期记忆与长期记忆管理
RAG与Agent结合:实现“记忆”与“规划”能力
MCP模型与控制流程实战
无论你是AI工程师、算法研究者,还是技术负责人,本课程都将提供从Agent理论基础到系统实现的完整路径。通过强化学习实战、任务分解、自定义管理器构建、GRPO训练等实例,你不仅能掌握Agent开发的关键技术,更能搭建可复用、可迭代的智能体系统。
立即加入,系统构建你的Agent开发能力,让智能体真正为你所用。
第一章 基于大模型的Agent技术框架
第二章 Agent破局的意义
第三章 Agent架构
第四章 演员—评论员算法
第五章 Deepseek的RL算法GRPO解读
第六章 Function Calling
第七章 MCP
第八章 A2A
第九章 Agent中的memory
第十章 Agent中RAG的作用和案例
- 10.1 Agent中RAG的作用和案例(上)
- 10.2 Agent中RAG的作用和案例(下)
第十一章 Verl框架训练
数知客
知名大厂高级工程师