第一部份:Spark生态和安装部署
Spark概述
Spark现状
安装部署
Spark安装简介
Spark的源码编译
Spark Standalone安装
Spark Standalone HA安装
Spark工具
Spark交互式工具spark-shell
Spark应用程序部署工具spark-submit
第二部份:Spark编程模型和解析
Spark的编程模型
RDD的特点、操作、依赖关系
缓存策略
广播变量和累加器
Spark编程环境搭建
Spark编程实例
第三部份:Spark运行架构和解析
Spark的运行架构
基本术语
运行架构(DAGScheduler、TaskSeduler、Task、容错性、推测机制、数据本地性)
Spark on Standalone运行过程
Spark on YARN 运行过程
第四部份:hive入门
hive的运行架构
hive的安装
hive的实例演示
第五部份:SparkSQL原理和实践
Spark的运行架构
Catalyst
sqlontext
hiveContext
ThriftServer和CLI
ThriftServer
CLI
SparkSQL的实例演示和编程
spark-shell实例演示
spark-sql实例演示
SparkSQL的编程
第六部份:SparkStreaming原理和实践
SparkStreaming原理
SparkStreaming的原理
SparkStreaming的运行方式
DStream的特点和操作
SparkStreaming实例演示
网络数据演示
文本实例演示
Window操作演示
第七部份:MLlib入门
什么是机器学习
MLlib的架构
Mllib实例演示
聚类算法演示
推荐系统演示
第八部份:GraphX入门
图论基础
GraphX的架构
GraphX实例演示
图的基本操作
PageRank演示
第九部份:Spark运维
Spark On YARN
history server
job server
Spark的监控
Spark UI监控
第十部份:Scala on Spark
spark常用的scala基础
如何阅读spark源代码
如何构建spark项目
第十一部份:Spark编程
RDD的编程
Spark综合实例(SparkSQL+sparkMlib+R)
第十二部份:Spark源码研读
Spark源码总体介绍
SparkCore源码细解
Spark Examples介绍
第十三部份:杂谈
Spark相关项目
BlinkDB简介
SparkR的安装和实例
Techyon