阶段三:Hadoop离线计算
学习内容:
Hadoop生态环境介绍、Hadoop云计算中的位置和关系、国内外Hadoop应用案例介绍、Hadoop 概念、版本、历史、Hadoop 核心组成介绍及hdfs、mapreduce 体系结构、Hadoop 的集群结构、Hadoop 伪分布的详细安装步骤、通过命令行和浏览器观察hadoop、HDFS底层工作原理、HDFS datanode、namenode详解、Hdfs shell、Hdfs java api 、Mapreduce四个阶段介绍、Writable、InputSplit和OutputSplit、Maptask、Shuffle:Sort,Partitioner,Group,Combiner、Reducer......
学习目标:
此部分带领大家了解hadoop的用途,在大数据中的用途,以及快速搭建一个hadoop的实验环境,在本过程中不仅将用到前面的Linux知识,而且会对hadoop的架构有深入的理解,并为你以后架构大数据项目打下坚实基础。