掌握大数据领域中的推荐系统
适用人群
有Spark基础的同学
课程简介
本课程的目的是使得同学们掌握大数据领域中的推荐系统
课程内容从两部分讲解推荐系统:
第一部分讲解的是推荐系统需要的算法及其推导,内容如下:
1、基于内容的推荐系统
2、协同过滤的核心概念
3、基于用户的协同过滤和基于产品的协同过滤
4、相似度的计算
5、隐语义模型的讲解
6、Spark支持的推荐算法的介绍
7、交替最小二乘法(ALS)的推导
第二部分讲解的是Spark代码实现的推荐系统,内容如下:
1、隐式类型数据的推荐的实现
2、显示类型数据的推荐的实现
3、冷启动问题
4、Spark中ml包和mllib包的比较
第1章Spark中的推荐算法
1-1推荐系统概述
1-2基于内容的推荐算法
1-3CF和核心概念
1-4User-Based_CF和Item-Based_CF
1-5相似度计算
1-6隐语义模
1-7正则化
1-8Spark支持的推荐算法
1-9交替最小二乘算法讲解
第2章推荐代码实现
2-1隐式模型vs显示模型
2-2数据集准备
2-3数据解析
2-4构建第一个模型
2-5模型评估
2-6选择合理的超参数
2-7显示类型数据的推荐的实现
2-8交叉验证
2-9冷启动问题
2-10Spark中mllib中的ALS的使用
2-11Spark中的ml包和mllib包 |