1153分钟

Python数据分析实战:统计模型

Python数据分析实战:统计模型

系统介绍方差分析模型、回归模型、logistic回归等各种经典统计模型,以及树模型、神经网络、支持向量机、最近邻方法等各种现代数据挖掘模型的算法原理,模型优缺点,适用条件及考查方式,并学习这些模型在s…

课程分类
数字技术 | 数据分析
适用人群
分析师, 工程师, 研究员
课程标签
Python分析,统计模型,数据挖掘
系统介绍方差分析模型、回归模型、logistic回归等各种经典统计模型,以及树模型、神经网络、支持向量机、最近邻方法等各种现代数据挖掘模型的算法原理,模型优缺点,适用条件及考查方式,并学习这些模型在sklearn和statsmodels中的具体实现方法。 本课程为统计原理与操作并重,在详细阐明各种模型算法特点的基础上,再对这些方法的python实现进行学习。 学习完本课程后,学员将能够独立使用sklearn和statsmodels拟合各种统计模型,满足实际研究工作或数据挖掘项目中的建模需求。
第1章 统计模型课程概述 - 1-1 课程内容介绍 - 1-2 statsmodels基本操作入门 - 1-3 使用sklearn的样本数据集 - 1-4 sklearn基本操作入门 第2章 方差分析模型 - 2-1 一般线性模型概述 - 2-2 简单一般线性模型的拟合 - 2-3 均数两两比较方法的选择 - 2-4 均数两两比较法的实现 - 2-5 多因素方差分析模型的基本框架 - 2-6 多因素方差分析的实现 - 2-7 模型框架下的自定义检验 第3章 线性回归模型 - 3-1 线性回归模型概述 - 3-2 线性回归模型的适用条件 - 3-3 线性回归标准建模步骤 - 3-4 用statsmodels拟合回归模型 - 3-5 残差分析 - 3-6 回归模型的多变量筛选方法 - 3-7 多变量筛选的具体操作 - 3-8 最小角回归 - 3-9 线性回归的sklearn实现 第4章 线性回归衍的生模式 - 4-1 曲线直线化 - 4-2 多项式回归 - 4-3 强影响点的识别与处理 - 4-4 稳健回归 - 4-5 共线性的识别与处理 - 4-6 岭回归 - 4-7 LASSO回归与弹性网络 - 4-8 方差不齐的识别与处理 - 4-9 加权最小二乘法 - 4-10 残差非独立的识别与处理 - 4-11 自回归模型 第5章 logitsic回归 - 5-1 Logistic回归模型的基本概念 - 5-2 Logistic回归模型的适用条件 - 5-3 两分类logit的statsmodels实现 - 5-4 logistic模型中的检验方法 - 5-5 哑变量的使用-1 - 5-6 哑变量的使用-2 - 5-7 多分类因变量的Logistic回归模型 第6章 决策树模型 - 6-1 树模型的基本概念 - 6-2 树模型的信息量计算 - 6-3 树模型的各种算法 - 6-4 树模型的sklearn实现 - 6-5 随机森林 - 6-6 Aboost方法 - 6-7 GBDT方法介绍 第7章 神经网络 - 7-1 神经网络的基本原理 - 7-2 神经网络的算法实质 - 7-3 神经网络的sklearn实现 - 7-4 RBFN、RNN、LSTM与与CNN网络 - 7-5 SOM与RBM网络 - 7-6 神经网络的超参数调整 第8章 支持向量机 - 8-1 SVM的基本原理 - 8-2 SVM的核函数设定 - 8-3 SVM的分类操作 - 8-4 SVM回归 - 8-5 异常值检测的基本理论 - 8-6 新奇值发现 - 8-7 模型参数的优化 第9章 主成分分析与因子分析 - 9-1 主成分分析的基本原理 - 9-2 主成分分析的statsmodels实现 - 9-3 主成分分析的sklearn实现 - 9-4 因子分析的基本原理 - 9-5 因子分析的statsmodels实现 - 9-6 因子旋转 第10章 聚类分析 - 10-1 聚类分析概述 - 10-2 聚类分析的方法分类 - 10-3 聚类分析的注意事项 - 10-4 K均值聚类 - 10-5 均值偏移聚类 - 10-6 层次聚类 - 10-7 birch聚类 - 10-8 DBSCAN聚类 - 10-9 聚类结果的验证 第11章 最近邻分析 - 11-1 KNN的基本原理 - 11-2 KNN分类的操作 - 11-3 KNN回归与无监督KNN 第12章 生存分析 - 12-1 生存分析的基本概念 - 12-2 生存率的计算与曲线绘制 - 12-3 生存曲线的比较 - 12-4 风险函数与风险比 - 12-5 Cox模型的基本概念 - 12-6 Cox比例风险模型的实现 - 12-7 生存分析中的分层变量 第13章 关联分析 - 13-1 关联分析的基本概念 - 13-2 关联分析的数据格式与结果格式 - 13-3 Apriori算法的原理与实现 - 13-4 Apriori算法分析实例 - 13-5 FP-Growth算法 - 13-6 关联分析的参数调整与具体应用
张文彤

张文彤

博士,数据分析与挖掘专著的作者