682分钟
Python数据分析行业案例:推荐系统
推荐系统在当今的互联网行业中正在起到不可或缺的作用,本课程基于实际案例,由推荐系统的概念、框架、评估体系等入手,完整实现了推荐系统中应用的各类算法,包括协同过滤、矩阵分解、基于内容的推荐算法、结合文本…
推荐系统在当今的互联网行业中正在起到不可或缺的作用,本课程基于实际案例,由推荐系统的概念、框架、评估体系等入手,完整实现了推荐系统中应用的各类算法,包括协同过滤、矩阵分解、基于内容的推荐算法、结合文本挖掘(词频矩阵、TF-IDF、word2vec)的推荐算法、关联分析、聚类分析在推荐算法中的应用方式等,相关代码可作为分析模板供学员在工作中直接套用。
【课程特色】
可作为业务分析模板:课程内容完全基于真实业务分析场景构建,提供全部编写的函数工具和源代码,可直接作为同类业务场景中的业务分析模板加以使用。
双案例课程结构:充分考虑到案例代表性和分析需求上的差异化,精选电影评分和云音乐歌单数据这两个业务案例,分别代表rating和non-rating这两类推荐系统将会面对的典型数据类型,更有利于拓展学员的分析能力。
第1章 推荐系统综述
- 1-1 课程介绍
- 1-2 为什么会出现推荐系统
- 1-3 推荐系统的常见形式
- 1-4 推荐系统算法的基本思路
- 1-5 推荐系统评测的三大步骤
- 1-6 怎样才能算一个好的推荐系统?
- 1-7 推荐系统模型评估:准确率
- 1-8 推荐系统模型评估:其他指标
- 1-9 推荐系统常用的相似度指标
- 1-10 推荐系统中的一些基础模型
- 1-11 电影评分数据集简介
- 1-12 网易云音乐数据集简介
- 1-13 云音乐数据集的预处理
第2章 Suprise包使用入门
- 2-1 suprise包简介
- 2-2 suprise包实战:读取数据
- 2-3 suprise包实战:数据拆分
- 2-4 suprise包实战:模型的拟合与评估
- 2-5 suprise包实战:模型的拟合与评估将模型结果用于推荐
第3章 协同过滤
- 3-1 协同过滤概述
- 3-2 ItemCF方法
- 3-3 UserCF方法
- 3-4 ml100k案例:筛选算法框架
- 3-5 ml100k案例:模型参数调优
- 3-6 ml100k案例:将模型结果用于推荐
第4章 矩阵分解
- 4-1 SVD的基本原理
- 4-2 如何将SVD用于推荐系统
- 4-3 VDpp与NMF
- 4-4 SVD案例
第5章 基于内容的推荐算法
- 5-1 CB方法的基本原理
- 5-2 词袋模型
- 5-3 用sklearn生成文档-词条矩阵
- 5-4 ml案例:基于词频矩阵
- 5-5 关键词提取的基本思路
- 5-6 TF- IDF算法
- 5-7 ml案例:基于TF-IDF实现
第6章 结合文本挖掘进行推荐
- 6-1 如何将文本挖掘技术和内容推荐相结合
- 6-2 分词原理讲解
- 6-3 结巴分词的基本用法
- 6-4 使用自定义词典和搜狗细胞词库
- 6-5 去除停用词
- 6-6 云音乐案例:基于词袋模型进行推荐
- 6-7 从词袋模型到N-gram模型
- 6-8 文本信息的分布式表示
- 6-9 共现矩阵
- 6-10 NNLM模型的突破
- 6-11 Word2vec一出,满座皆惊
- 6-12 文档相似度的doc2vec实现
- 6-13 云音乐案例:基于词向量模型进行推荐
第7章 基于列表序列进行推荐
- 7-1 如何基于列表序列进行推荐
- 7-2 云音乐案例:基于关联分析进行推荐
- 7-3 云音乐案例:基于Word2vec进行推荐
第 8章 聚类方法在推荐系统中的应用
- 8-1 聚类分析概述
- 8-2 聚类分析的方法分类
- 8-3 BIRCH聚类
- 8-4 聚类分析在推荐系统中的应用思路
- 8-5 云音乐案例:聚类分析的数据准备
- 8-6 云音乐案例:具体建模操作
第9章 冷启动问题
- 9-1 冷启动概述
- 9-2 用户冷启动的实现案例
- 9-3 物品冷启动的实现案例
课程资料
张文彤
博士,数据分析与挖掘专著的作者