大数据下的分布式
数据挖掘方法(训练单机型+分布式的预测: 传统机器学习算法+Mapreduce 分布式预测,)
Apache Spark MLlib
推荐与广告精准投放:
自然语言的部分
文本聚类,文本分类(标签),同义词
用户profile还原,标签体系
推荐算法的策略
类之间的lift, 类内的lift, 如何精准
如何构建推荐算法的闭环
逻辑回归,RankingSVM,
特征识别:(深度学习与图形的自动特征识别)
自然语言
中文分词
主题模型(文本聚类)
文本分类
提取关键词
语义分析 sementic parser, word2vec到词向量
RNN Long short-term memory (TSTM) Architecture
|