1天(6小时/天)

DeepSeek与大模型全技术解析

DeepSeek与大模型全技术解析

本课程围绕最新的大模型算法原理、RAG检索增强技术、Agent智能体开发、微调训练路径以及AI赋能研发效率的实战路径展开,旨在帮助参训人员系统掌握大模型应用的核心逻辑与工程落地路径。课程融合了Deep…

课程分类
人工智能 | 技术开发
行业分类
互联网IT
课程标签
DeepSeek,大模型,RAG,Agent,微调,AI研发效率

课程介绍

本课程围绕最新的大模型算法原理、RAG检索增强技术、Agent智能体开发、微调训练路径以及AI赋能研发效率的实战路径展开,旨在帮助参训人员系统掌握大模型应用的核心逻辑与工程落地路径。课程融合了DeepSeek、Dify、llama factory、Ollama等先进工具与平台的使用方法,涵盖从知识库构建、提示词工作流、模型微调到研发自动化的全过程,特别强调“从理解到交付”的闭环技能训练。通过本课程,学员将理解核心算法与创新点,掌握Agent开发实操能力,学会模型微调与训练路径,实现研发效率跃升,并建立完整工具链视角。课程内容深入浅出,结合大量案例和实践操作,适合希望将大模型技术落地到研发与运维环节的技术管理人员,以及正在搭建私有化大模型能力或智能体产品的实战团队。

课程背景

随着大模型技术的广泛应用,企业面临“用不好”“落不下”的现实挑战。本课程围绕最新的大模型算法原理、RAG检索增强技术、Agent智能体开发、微调训练路径以及AI赋能研发效率的实战路径展开,旨在帮助参训人员系统掌握大模型应用的核心逻辑与工程落地路径。

课程目标

理解核心算法与创新点:掌握DeepSeek算法解析、RAG技术原理及检索模块优化策略;具备Agent开发实操能力:掌握Dify的部署、智能体五要素及MCP场景调用;掌握模型微调与训练路径:理解llama factory的使用方法,熟悉多模态与强化微调技术;实现研发效率跃升:通过AI辅助代码生成、测试、Review、CI/CD接入等,显著提升团队交付能力;建立完整工具链视角:了解主流大模型工具如Ollama、Cursor、Jenkins、MCP的实际应用路径。
AI大模型的能力边界 1.1 AI基础知识:基本概念、发展历程、工作原理、关键技术 1.2 主流AI模型介绍及应用:ChatGPT、Claude、Gemini、Deepseek、千问 1.3 AI模型本地化部署:服务器部署,移动端部署 1.4 数据安全和隐私保护策略 1.5 大模型能力利用:意图识别、ICL(上下文学习)、COT(思维链)、IF(指令遵循) 1.6 大模型能力局限:缺乏领域知识,缺乏复杂多步推理 1.7 大模型及应用安全专题:架构安全、网络安全、数据安全 1.8 周边影响:核心硬件+AI数据中心建设+云计算给AI带来的影响 基于大模型的Agent开发 2.1 Agent概念和应用 Dify的本地化部署 Dify搭建智能化工作流 常见插件解析 工作流解析 MCP概念和应用 【案例】调用MCP案例 实践:智能体的五大元素-模型、插件、知识库、工作流、提示词 2.2 提示词介绍 1. Prompt的一个本质 2. Prompt的二个心法 3. Prompt的三项沟通要点 4. Prompt的四项chat法则 5. Prompt的五个业务法则 6. Prompt的六条咒语 7. Prompt的七项注意 8. Prompt的天龙八部 9. Prompt的追问法则 10. Prompt的继续法则 三、大模型训练与微调实践 1、微调与RAG应用场景对比大模型微调算法概述 2、微调工具llama factory概述微调方法和检查点路径 3、主要训练参数调整:量化等级、量化方法、加载方式、学习率、训练轮数、最大梯度范数、最大样本数、计算类型、截断长度、批处理大小、梯度累积、验证集比例、学习率时间器验证和预测模型导出 【案例】使用llama factory进行模型微调 【案例】微调前后效果对比 【案例】多模态模型微调方法 强化微调技术 大模型部署工具Ollama应用 大模型调用的几种方式 【案例】一键式调用大模型 大模型赋能研发效率提升实践 基于大模型的agent开发 AI大模型技术在研发全流程中的应用 大模型需求文档评审与理解 【案例】大模型理解需求并生成代码 【案例】利用Cursor自动生成代码 【案例】大模型进行自动化code review 【案例】白盒测试代码生成并集成至CI流水线 【案例】接口自动化测试代码生成 【案例】大模型实现提交代码分布等级质量评估反馈 【案例】大模型生成Jenkins groovy脚本构建CI pipeline 【案例】大模型根据历史数据做流量预测 【案例】大模型智能路由 【案例】大模型生成网络关系分析 【案例】大模型智能故障诊断 【案例】大模型智能恢复障碍
李家贵

李家贵

常住地:广东省 深圳市

李老师是一位资深的数字化和人工智能专家,在大数据、AI、数据中台、用户画像、BI等领域有深厚造诣。他不仅精通传统的数字化工具,还在人工智能的前沿领域有丰富的实践经验。 在人工智能方面,李老师主导了多个创新项目: 1. 深圳市南山区政务AI项目,开发了AI生成PPT、AI日志和AI图库等智能应用。 2. 联通-清华产学研合作的AI Agent平台开发项目,推动了智能代理技术的应用。 3. 罗湖教育局招生AI项目,利用AI技术优化教育资源分配。 4. 威海智慧谷AI项目,探索AI在智慧城市建设中的应用。 李老师在大数据和AI融合方面有独到见解,曾主导实施: - CEM系统从0到1的搭建,整合客户体验管理与AI分析。 - 数字百色系列化项目,包括大数据湖项目,实现了数据与AI的深度结合。 - 长沙空港实业运行控制中心(IOCC)BI项目,将AI决策支持引入航空管理。 - 深圳空管站CDM大数据项目,利用AI提升空中交通管理效率。 在数据中台和AI结合方面,李老师主导了多个标志性项目: - 珠海机场数据中心及服务总线使能平台项目 - 宁波国际会议中心数据中台服务系统项目 - 长沙城发共性支撑平台项目 - 广东省消防救援总队智慧队务系统建设项目 李老师还积极推动AI在智慧园区和智慧城市中的应用: - 红土创新广场智能化系统集成系统(含AI驱动的BI) - 上基智慧园区设计项目(融合AI分析的BI系统) - 广西移动大厦总部数字化项目(AI赋能的BI平台) - 中移物联网OnePark智慧园区项目(AI+IoT的创新应用) 作为教育者,李老师开设了多门融合AI技术的课程,如《职场局中局,AI剧本杀》、《AIGC赋能各行各业》等,培养了大批AI+大数据复合型人才。 在咨询领域,李老师帮助多家企业实现AI驱动的数字化转型,如四方监理、深高速等,将AI技术与传统行业深度融合。 李老师的职业生涯横跨技术、销售、管理和创业多个领域,在每个阶段都将AI技术作为核心竞争力。他不仅是技术专家,更是数字化转型的战略家,善于将AI技术与商业价值紧密结合。 作为连续创业者,李老师多次从0到1创立原生数字化企业,并持续引入AI技术推动企业创新。他在产业互联网、智慧城市、数据中台等领域建立的企业,都以AI作为核心竞争力。 李老师在华为、腾讯、阿里、商汤等平台建立的ISV生态体系中,始终将AI技术作为重要纽带,推动产业链的智能化升级。