1天(6小时/天)
以数据分析和数据应用为目标的机器学习和人工智能应用实战
本课程是一门专注于机器学习和人工智能在数据分析和数据应用领域的实战培训。课程从机器学习的基础概念和历史出发,系统讲解机器学习与人工智能、深度学习的关系,并通过丰富的应用案例展示其实际价值。内容涵盖数据…
课程介绍
本课程是一门专注于机器学习和人工智能在数据分析和数据应用领域的实战培训。课程从机器学习的基础概念和历史出发,系统讲解机器学习与人工智能、深度学习的关系,并通过丰富的应用案例展示其实际价值。内容涵盖数据预处理、监督学习算法(如线性回归、逻辑回归、决策树、随机森林、支持向量机、神经网络)、无监督学习算法(如聚类分析、主成分分析、关联规则学习)、模型评估与选择(包括交叉验证、性能指标、超参数调优),以及深度学习入门(深度神经网络、卷积神经网络、循环神经网络)。此外,课程还涉及强化学习、生成对抗网络等前沿技术,并重点介绍开源库实战,如Scikit-learn用于机器学习算法实现、Jieba用于中文文本分词、Gensim用于主题建模和文档相似性分析。在数据分析部分,课程覆盖数据分析基础、数据建模、工具使用(R语言、Python及Pandas、NumPy、Matplotlib等库)和实战应用,包括业务数据分析案例、数据可视化技巧和数据驱动决策。最后,课程深入探讨ChatGPT技术原理和应用,包括其发展历程、原理解读、AIGC同类产品、应用场景(如Office Copilot、动态定价、客户服务连接器)以及垂直领域的生成式AI应用,旨在帮助学员掌握从基础理论到实战技能的完整知识体系,提升在数据分析和人工智能领域的实际应用能力。
机器学习介绍:
机器学习的定义与历史
机器学习与人工智能、深度学习的关系
机器学习的应用案例
数据预处理:
数据收集与清洗
特征工程
数据集划分
监督学习算法:
线性回归、逻辑回归
决策树、随机森林、支持向量机
神经网络基础
无监督学习算法:
聚类分析
主成分分析(PCA)
关联规则学习
模型评估与选择:
交叉验证
模型性能指标
超参数调优
深度学习入门:
深度神经网络
卷积神经网络(CNN)
循环神经网络(RNN)
特殊主题与前沿技术:
强化学习
生成对抗网络(GAN)
机器学习在大数据中的应用
开源库实战:Sklearn, Jieba, Gensim使用
Scikit-learn (Sklearn): 这是一个Python编程语言的开源机器学习库,它支持各种机器学习算法的实现,包括分类、回归、聚类和降维。Scikit-learn以其清晰的API、丰富的文档和易于理解的结构而受到广泛的欢迎
Scikit-learn (Sklearn)监督学习和无监督学习实战
Jieba: Jieba是一个用于中文文本分词的Python库,广泛应用于中文自然语言处理领域。它支持三种分词模式:精确模式、全模式和搜索引擎模式,同时也支持繁体分词和关键词提取。
Jieba中文分词实战
Gensim: Gensim是一款专注于主题建模和文档相似性分析的Python库。它能够处理大型文本集合,使用算法如Latent Dirichlet Allocation (LDA)和Term Frequency-Inverse Document Frequency (TF-IDF)来发现文档之间的主题和相似性
Gensim 应用实战
数据分析和数据建模
数据分析基础
数据分析概述
数据类型和数据收集
数据清洗和预处理
探索性数据分析(EDA)
基本统计分析
数据建模
回归分析(线性回归、多项式回归)
分类算法(决策树、随机森林、逻辑回归)
聚类分析(K-means、层次聚类)
主成分分析(PCA)
时间序列分析和预测
数据分析工具
R语言和RStudio简介
Python编程基础
使用Python进行数据分析(Pandas、NumPy、Matplotlib)
实战应用
业务数据分析案例研究
数据可视化技巧
数据报告和解释
数据驱动决策
ChatGPT技术原理和应用
人类语言模型和CHATGPT类技术发展历程
人类语言模型
机器学习,神经网络CNN/RNN/GAN
对人脑学习过程进行模拟:Transformer
GPT-1,GPT-2,GPT-3,ChatGPT,GPT4
T5,BART,M2M100,Bigbird
BERT,RoBERTa,XLM,ALBERT,ELECTRA
CHATGPT的原理解读
大参数语言模型
预训练模型,Award模型
人类认知,真相,模型的结论的差异
用户多轮互动数据(提示学习),互动学习,高质量输出
AIGC的同类们
AI生成式产品设计
AI生成式绘画
AI生成式视频
多模态生成式AI
生成式智能还能干什么
AIGC的应用场景
Office Copilot,AIGC集成WORD,Powerpoint,Excel等办公软件
ChatGPT数据模型连接器:ChatGPT培训,用于分析大量销售、交易和其他财务绩效指标的数据,以识别客户行为的趋势和模式。它们有助于丰富模型,添加来自不同内容来源的见解,帮助识别交叉销售机会。
用于动态定价的ChatGPT连接器:旨在根据实时市场分析和竞争对手数据帮助设定更准确和有竞争力的价格,并根据市场变化自动推荐价格调整。这有助于通过平衡供需和提高利润率来最大化收入。
客户服务的ChatGPT连接器:提供实时客户支持,通过使用Open AI接口对最终消费者的问题提供实时回复,帮助更快、更高效地解决问题。这可以提高客户满意度和忠诚度,随着时间的推移,收入会增加。
GitHub Copilot 高效编程做应用开发
垂直领域的大参数与训练生成式AI:AI培训老师,AI服务助理,AI导购,AI领域专家模型
CHATGPT的领域预训练模型会带来千倍的效能提升
AIGC 在产品设计领域的应用
新闻撰写的广泛引用
图像,文案和音视频生成:蓝色光标停止一切内容外包服务
大参数模型训练,人机协同解决大参数决策难题
辛玉军
常住地:北京 北京市
辛玉军老师是兼具工学与管理学背景的数字化转型与智能制造实战专家,拥有24年企业咨询经验,专注制造业智能化、信息化规划与落地。作为工信部数字化转型赋能中心首席专家及专精特新冠军联盟数字化转型首席专家,他深度服务中车、航天科工、海尔、美的、华为、西门子等数百家头部企业,并在清华、北大等多所顶尖高校担任总裁班客座教授。其独特优势在于融合TOC(约束理论)方法论与智能工厂实践,擅长将复杂问题本质化,助力企业高效实现数字化升级,广受航空航天、汽车、轨道交通、电子、钢铁等行业客户高度认可。