主题 |
授课内容 |
引子 |
本次培训主要结合电商的实际应用,阐述了自然语言处理(NLP),数据挖掘(DM)和机器学习(ML)算法的落地和产出过程,对于在大数据处理方面的技巧和变现能力会有很大的提升。 |
第一单元
关联规则(Apriori)算法在实际应用中的优化 |
该单元介绍基本关联规则算法在电商实际订单数据中的问题,以及对于问题空间预估保证提升空间的前提下,优化关联规则模型的过程。 |
1、 传统关联规则算法
2、“最佳拍档”中的关联规则
讲述了基本的关联规则算法
3、问题发现与分析
(1)订单数据反作弊
(2)数据+算法融合的角度
(3)badcase实例印证
4、效果空间预估
5、算法改进
6、效果的衡量
(1)上线前:Debug工具
(2)上线:ABtest系统
7、ROI分析
8、案例启示&下一步尝试 |
第二单元
商品评论排序对于用户购买的影响
|
该单元介绍了如何处理用户产生的商品评论,将其按照价值由大到小进行排序,评论的价值取决于影响用户快速决策购买商品的信息量。 |
1、背景介绍
2、评论排序因素
3、内容相关性计算
(1)商品内容表示
(2)评论内容表示
(3)商品和评论的相似性计算
4、排序模型
5、效果评估
(1)测试方法
(2)衡量指标
(3)效果对比及分析
6、作弊与反作弊
7、评论智能排序-ROI分析 |
第三单元
商品“冷启动” -基于语义主题的新品推荐
|
该单元以电商商品推荐为例,讲述了在没有用户行为的情况下,如何将小众或新上市的商品进行准确的展现,提高用户体验的同时带来更多的流量。 |
1、马太效应
2、商品的冷启动
3、基于内容的主题特征抽取
(1)语义主题特征
(2)特征关联
4、正负样本形成
5、CTR预估模型
6、效果衡量与分析 |
第四单元
用户行为分析
|
根据不同场景的用户行为,挖掘潜在有价值信息或者用户意图。 |
1、商品互补类识别
2、 优质用户挖掘
3、 品牌相似性计算
4、 用户点击商品行为建模
5、 用户新闻兴趣建模
6、 长尾query的智能纠错 |