349分钟

AI大模型核心技术全景解析

AI大模型核心技术全景解析

你是否面临这些AI技术挑战? 面对大模型技术快速发展,难以系统掌握从基础到前沿的核心原理? 在NLP任务中,对分词、注意力机制等关键技术理解不深入,影响模型效果? 缺乏对GPT、DeepSeek等主流…

课程分类
人工智能 | 技术开发
适用人群
工程师, 专家, 研究员
课程标签
大模型,NLP,Transformer
你是否面临这些AI技术挑战? 面对大模型技术快速发展,难以系统掌握从基础到前沿的核心原理? 在NLP任务中,对分词、注意力机制等关键技术理解不深入,影响模型效果? 缺乏对GPT、DeepSeek等主流模型的实践指导,难以高效调参和应用? 这些问题直接关系到AI项目的开发效率与效果,而本课程将帮你系统解决这些问题​。 本课程由互联网大厂高级算法工程师“数知客”导师亲授,她拥有: 智能体、广告算法、搜索推荐等多领域实战经验 5项发明专利及北京市人工智能中级职称 畅销书《基于NLP内容理解》作者,人民邮电出版社专家顾问 课程三大核心模块 1. 大模型基础技术解析 Tokenization原理与实践:BPE、WordPiece、SentencePiece算法对比 Transformer架构详解:Self-Attention、多头注意力机制实现 位置编码演进:从绝对位置编码到RoPE的数学推导 2. 生成模型调优与应用 GPT技术原理:预训练、微调与提示工程实践 生成参数调优:Top-K、Top-P采样及Temperature参数联合调控 行业场景适配:代码生成、创意写作、对话系统的Prompt设计技巧 3. 前沿模型架构剖析 DeepSeek-V3混合专家模型(MoE):稀疏激活与动态路由实现 逻辑推理优化:奖励模型与排序模型的协同训练方法 开源生态实践:Qwen模型的中文优化与多模态扩展 无论你是算法工程师、技术负责人,还是AI研究者,这门课程都将通过代码实现、参数调优案例,帮助你掌握大模型技术的核心方法论与落地工具。 现在加入,完成从理论到实战的跨越,真正掌握驱动AI革命的核心技术!
先导课 第一章 分词 第二章 自注意力机制 第三章 Transformer原理以及实现 第四章 GPT技术原理与应用解析 - 4.1 GPT技术概述 - 4.2 GPT的工作原理 - 4.3 GPT的实现技术 - 4.4 GPT的应用场景 - 4.5 GPT的实践指南 第五章 Top-K采样原理详解 - 5.1 Top-K采样概述 - 5.2 Top-K采样的数学原理 - 5.3 Top-K采样的关键参数 - 5.4 Top-K采样的优缺点分析 - 5.5 Top-K采样的实际应用 第六章 Top-p采样原理与应用 - 6.1 Top-p采样概述 - 6.2 Top-p采样的工作原理 - 6.3 Top-p采样的参数设置 - 6.4 Top-p采样的优势与局限性 - 6.5 Top-p采样与其他采样方法的比较 - 6.6 Top-p采样的实际应用案例 第七章 Prompt撰写方法与技巧 - 7.1 Prompt基础概念 - 7.2 Prompt设计原则 - 7.3 结构化Prompt技巧 - 7.4 行业场景应用 - 7.5 进阶优化策略 第八章 Temperature参数解析与应用指南 - 8.1 Temperature参数基础概念 - 8.2 参数作用机制 - 8.3 不同温度值效果对比 - 8.4 参数应用场景指南 - 8.5 实战调参技巧 第九章 GPT生成参数调优 - 9.1 参数调优策略 - 9.2 实际调优步骤 - 9.3 典型应用场景与参数组合 - 9.4 常见问题与解决方案 - 9.5 总结与最佳实践 第十章 手把手带你从零推导旋转位置编码RoPE 第十一章 DeepSeek-R1 技术全景解析 第十二章 DeepSeek-v3 中MOE架构解析 - 12.1 MOE发展历程 - 12.2 MOE核心原理 - 12.3 DeepSeek-V3中的MOE实现 - 12.4 MOE关键技术挑战 - 12.5 MOE模型性能优势 第十三章 不同模型的对比 第十四章 qwen架构解读
数知客

数知客

知名大厂高级工程师