489分钟
Python数据分析行业案例:欺诈检测
欺诈现象遍及商业社会的各个领域,欺诈检测(Fraud Detection,也称反欺诈)则是数据分析与挖掘的一个典型应用领域,同时又具有非常强的行业特征。本课程使用医疗保险欺诈和Kaggle的金融欺诈数…
欺诈现象遍及商业社会的各个领域,欺诈检测(Fraud Detection,也称反欺诈)则是数据分析与挖掘的一个典型应用领域,同时又具有非常强的行业特征。本课程使用医疗保险欺诈和Kaggle的金融欺诈数据这两个案例数据,完整介绍了欺诈检测的基本思想,以及各类数据分析模型在欺诈检测领域中的构建和实施流程。整个案例可作为分析模板供学员在欺诈检测相关的分析项目中直接套用。
本课程还在案例分析中很好的展示了如何基于业务理解,灵活的将聚类分析、Benford定律、关联规则等模型用于欺诈检测有学员在实践中更好的拓展数据挖掘建模思路。
课程内容完全基于真实业务分析场景构建,可直接作为同类业务场景中的分析模板加以使用。
第1章 欺诈检测概述
- 1-0 课程介绍
- 1-1 欺诈检测概述
- 1-2 欺诈检测的难点所在
- 1-3 欺诈检测模型和信用评分模型的差异
- 1-4 欺诈检测的三种分析思路
第2章 医疗保险欺诈案例的数据理解
- 2-1 医疗保险欺诈案例概述
- 2-2 结合业务背景对案例做数据理解
- 2-3 特征工程概述
- 2-4 数据探索概述
- 2-5 数据探索:代码实现
- 2-6 极端值与异常值的处理
- 2-7 连续特征的处理思路
- 2-8 分类特征的处理思路
- 2-9 数据衍生的基本思路
第3章 用比对法发现欺诈
- 3-1 异常值发现
- 3-2 异常值发现的代码实现
- 3-3 比对法发现欺诈
第4章 用比较法发现欺诈
- 4-1 什么是Benford定律
- 4-2 聚类分析概述
- 4-3 聚类分析的方法分类
- 4-4 K均值聚类
- 4-5 Benford定律的实现
- 4-6 投保人细分发现欺诈
- 4-7 投保人细分发现欺诈的实现
- 4-8 发现医疗保健机构行为异常
第5章 用模型法发现欺诈
- 5-1 发现共用投保人信息
- 5-2 发现共用投保人信息的实现
- 5-3 发现异常诊断和处理过程
- 5-4 发现异常诊断和处理过程的实现
第6章 监督学习方法的欺诈检测实例
- 6-1 数据概括
- 6-2 数据理解
- 6-3 数据准备
- 6-4 类别预测模型概述
- 6-5 类别预测模型的实现原理
- 6-6 类别预测模型的种类
- 6-7 树模型的基本原理
- 6-8 随机森林
- 6-9 模型加权拟合
- 6-10 数据不平衡问题
- 6-11 加权后模型拟合
课程资料
张文彤
博士,数据分析与挖掘专著的作者