810分钟
R语言数据挖掘实战教程
在大数据时代,数据挖掘已经成为企业和组织获取竞争优势的关键。R语言以其强大的统计计算和数据可视化能力,成为了数据挖掘领域的热门工具。本课程将带领您深入了解R语言在数据挖掘领域的实际应用,帮助您掌握从数…
在大数据时代,数据挖掘已经成为企业和组织获取竞争优势的关键。R语言以其强大的统计计算和数据可视化能力,成为了数据挖掘领域的热门工具。本课程将带领您深入了解R语言在数据挖掘领域的实际应用,帮助您掌握从数据准备、模型构建到结果解读的全过程。课程将涵盖数据挖掘的基本概念、常用算法以及R语言的实现方法。通过丰富的实战案例,我们将重点讲解分类、聚类、关联规则挖掘、时间序列预测等常见的数据挖掘任务。同时,课程还将介绍如何利用R语言进行特征选择、模型评估和优化,以提升数据挖掘的准确性和效率。此外,本课程还将分享实际项目中数据挖掘的应用场景,包括市场分析、客户细分、推荐系统等。通过案例分析,您将了解如何将理论知识与实际业务相结合,为企业提供有针对性的数据挖掘解决方案。
课程导读
一、数据挖掘必要性
- 章节导读
- 1、大数据资产的利用
- 2、数据挖掘的方向及商业定义
- 3、数据挖掘流程介绍
- 4、合格数据挖掘工程师必备技能
- 5、大数据挖掘技术
- 章节总结
二、模型效果评估
- 章节导读
- 6、模型效果评估常用方法
- 7、混淆矩阵指标详解
- 8、混淆矩阵案例详解
- 9、ROC曲线基本原理
- 10、利用excel讲解各种评估曲线指标统计原理
- 11、利用R计算tpr、fpr、lift各指标值详解
- 12、利用plot函数绘制ROC、KS、LIFT曲线
- 13、利用ggpot函数绘制ROC、KS、LIFT曲线
- 14、自定义绘制各种评估曲线函数
- 15、利用ROCR和pROC包绘制ROC曲线
- 16、等频分箱基本原理及价值解读
- 17、PSI基本原理介绍及案例演示
- 章节总结
三、经典线性回归模型
- 章节导读
- 18、经典线性回归模型理论介绍
- 19、线性回归模型最小二乘法的数学原理
- 20、线性回归模型的判定系数
- 21、自定义函数求回归系数和判定系数拟合度
- 22、构建test数据集验证自定义函数
- 23、lm函数及其他函数介绍
- 24、lm函数案例详解
- 25、对 cars数据集进行线性回归模型构建及结果可视化
- 26、对cars数据集进行指数变换后建模并 对比效果
- 27、利用MASS包的boxcox函数寻找指数(对数)变换的最优值
- 28、多个数值自变量的线性回归模型构建
- 29、利用逐步回归选择最有模型
- 30、当自变量有定性变量情况下的模型讲解
- 31、通过鸢尾花数据集解释为什么需要做逻辑回归
- 32、逻辑回归基本原理介绍
- 33、逻辑回归案例演示
- 章节总结
四、决策树模型
- 章节导读
- 34、决策树的基本原理及R语言实现
- 35、ID3算法举例
- 36、决策树案例演示:数据清洗及分区
- 37、利用C5.0算法构建分类模型
- 38、利用rpart和party包实现决策树算法
- 章节总结
五、聚类分析
- 章节导读
- 40、常用距离知识介绍
- 41、常用聚类算法及R语言实现
- 42、应用案例—iris数据集:K-均值聚类
- 43、应用案例-汽车数据集—K-均值聚类
- 44、案例:洛杉矶街区数据—层次聚类
- 45、应用案例:汽车数据集—层次聚类
- 章节总结
六、关联规则
- 46、关联规则的基本理论及R语言实现
- 47、关联规则可视化包arulesViz介绍
- 48、关联规则案例演示
- 章节总结
章节导读
课程总结
课程资料
谢佳标
2017-2024 微软MVP