1153分钟
Python数据分析实战:统计模型
系统介绍方差分析模型、回归模型、logistic回归等各种经典统计模型,以及树模型、神经网络、支持向量机、最近邻方法等各种现代数据挖掘模型的算法原理,模型优缺点,适用条件及考查方式,并学习这些模型在s…
系统介绍方差分析模型、回归模型、logistic回归等各种经典统计模型,以及树模型、神经网络、支持向量机、最近邻方法等各种现代数据挖掘模型的算法原理,模型优缺点,适用条件及考查方式,并学习这些模型在sklearn和statsmodels中的具体实现方法。
本课程为统计原理与操作并重,在详细阐明各种模型算法特点的基础上,再对这些方法的python实现进行学习。
学习完本课程后,学员将能够独立使用sklearn和statsmodels拟合各种统计模型,满足实际研究工作或数据挖掘项目中的建模需求。
第1章 统计模型课程概述
- 1-1 课程内容介绍
- 1-2 statsmodels基本操作入门
- 1-3 使用sklearn的样本数据集
- 1-4 sklearn基本操作入门
第2章 方差分析模型
- 2-1 一般线性模型概述
- 2-2 简单一般线性模型的拟合
- 2-3 均数两两比较方法的选择
- 2-4 均数两两比较法的实现
- 2-5 多因素方差分析模型的基本框架
- 2-6 多因素方差分析的实现
- 2-7 模型框架下的自定义检验
第3章 线性回归模型
- 3-1 线性回归模型概述
- 3-2 线性回归模型的适用条件
- 3-3 线性回归标准建模步骤
- 3-4 用statsmodels拟合回归模型
- 3-5 残差分析
- 3-6 回归模型的多变量筛选方法
- 3-7 多变量筛选的具体操作
- 3-8 最小角回归
- 3-9 线性回归的sklearn实现
第4章 线性回归衍的生模式
- 4-1 曲线直线化
- 4-2 多项式回归
- 4-3 强影响点的识别与处理
- 4-4 稳健回归
- 4-5 共线性的识别与处理
- 4-6 岭回归
- 4-7 LASSO回归与弹性网络
- 4-8 方差不齐的识别与处理
- 4-9 加权最小二乘法
- 4-10 残差非独立的识别与处理
- 4-11 自回归模型
第5章 logitsic回归
- 5-1 Logistic回归模型的基本概念
- 5-2 Logistic回归模型的适用条件
- 5-3 两分类logit的statsmodels实现
- 5-4 logistic模型中的检验方法
- 5-5 哑变量的使用-1
- 5-6 哑变量的使用-2
- 5-7 多分类因变量的Logistic回归模型
第6章 决策树模型
- 6-1 树模型的基本概念
- 6-2 树模型的信息量计算
- 6-3 树模型的各种算法
- 6-4 树模型的sklearn实现
- 6-5 随机森林
- 6-6 Aboost方法
- 6-7 GBDT方法介绍
第7章 神经网络
- 7-1 神经网络的基本原理
- 7-2 神经网络的算法实质
- 7-3 神经网络的sklearn实现
- 7-4 RBFN、RNN、LSTM与与CNN网络
- 7-5 SOM与RBM网络
- 7-6 神经网络的超参数调整
第8章 支持向量机
- 8-1 SVM的基本原理
- 8-2 SVM的核函数设定
- 8-3 SVM的分类操作
- 8-4 SVM回归
- 8-5 异常值检测的基本理论
- 8-6 新奇值发现
- 8-7 模型参数的优化
第9章 主成分分析与因子分析
- 9-1 主成分分析的基本原理
- 9-2 主成分分析的statsmodels实现
- 9-3 主成分分析的sklearn实现
- 9-4 因子分析的基本原理
- 9-5 因子分析的statsmodels实现
- 9-6 因子旋转
第10章 聚类分析
- 10-1 聚类分析概述
- 10-2 聚类分析的方法分类
- 10-3 聚类分析的注意事项
- 10-4 K均值聚类
- 10-5 均值偏移聚类
- 10-6 层次聚类
- 10-7 birch聚类
- 10-8 DBSCAN聚类
- 10-9 聚类结果的验证
第11章 最近邻分析
- 11-1 KNN的基本原理
- 11-2 KNN分类的操作
- 11-3 KNN回归与无监督KNN
第12章 生存分析
- 12-1 生存分析的基本概念
- 12-2 生存率的计算与曲线绘制
- 12-3 生存曲线的比较
- 12-4 风险函数与风险比
- 12-5 Cox模型的基本概念
- 12-6 Cox比例风险模型的实现
- 12-7 生存分析中的分层变量
第13章 关联分析
- 13-1 关联分析的基本概念
- 13-2 关联分析的数据格式与结果格式
- 13-3 Apriori算法的原理与实现
- 13-4 Apriori算法分析实例
- 13-5 FP-Growth算法
- 13-6 关联分析的参数调整与具体应用
张文彤
博士,数据分析与挖掘专著的作者