班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
每个班级的人数限3到5人,互动授课, 保障效果,小班授课。 |
上间和地点 |
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山学院/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦 最近开间(周末班/连续班/晚班):2019年1月26日 |
实验设备 |
◆小班教学,教学效果好 ☆注重质量☆边讲边练 ☆合格学员免费推荐工作 ★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听; 2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供课后答疑。 3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,端海学员的能力得到大家的认同,受到用人单位的广泛赞誉,端海的证书受到广泛认可。 |
部份程大纲 |
|
-
1,系统架构师、系统分析师、高级程序员、资深开发人员。
2,牵涉到数据挖掘和统计分析的数据中心运行、规划、设计负责人。
3,政府机关,金融保险、移动和互联网等大数据来源单位的负责人。
4,高校、科研院所牵涉到数据挖掘与统计分析处理的项目负责人。
【培训目标】
1、全面了解大数据前沿技术的相关知识。
2、学习大数据前沿技术平台、方法以及应用特征。
3、学习使用大数据挖掘和分析中的使用。
4、了解Hadoop、Spark等技术的融合使用。
【课程大纲】
第一讲 大数据技术基础
1)大数据应用需求及潜在价值分析
2)大数据与数据库解决方案的对比
3)国内外主流的大数据解决方案
4)开源的大数据生态系统平台剖析
5)大数据下的技术选型与架构设计
第二讲 批处理大数据平台Hadoop
1)Hadoop及其运行架构
2)HDFS分布式文件系统
3)MapReduce计算模型
4)HBase大表管理技术
5)Hadoop平台使用和实操
第三讲 实时大数据平台Spark
1)Spark实时处理技术
2)弹性分布式数据集RDD
3)Spark分布式计算框架
4)Spark的BDAS生态系统
5)Spark平台使用和实操
第四讲 流式大数据平台Storm
1)流式大数据处理架构
2)Storm在企业应用介绍
3)Storm拓扑及流分组
4)Spout和Bolt详解
5)分布式DPRC和Trident
6)Storm平台使用和实操
第五讲 Python网络爬虫
1)网络爬虫基础
2)urllib和urllib2库的用法
3)Python 正则表达式
4)Beautiful Soup使用
5)用Scrapy采集示例实操
第六讲 大数据日志采集工具Flume
1)日志采集及Scribe介绍
2)Flume-NG数据流模型
3)Flume平台架构
4)Flume集群部署配置
5)Flume应用案例实操
第七讲 分布式消息订阅工具Kafka
1)Kafka应用介绍
2)Kafka平台架构
3)Kafka集群部署与配置
4)Kafka应用案例实操
第八讲 NoSQL云数据处理工具
1)NoSQL技术及云数据库介绍
2)HBase列数据存储及处理机制
3)HBase高并发读/写实现及案例
4)MongoDB文档数据存储及处理
5)MongoDB操作实现及案例
第九讲 大数据中的SQL工具
1)大数据中的类SQL工具
2) Hive设计目标和数据模型
3) Hive关键性技术和案例
4) SparkSQL设计目标和数据模型
5) SparkSQL关键性技术和案例
第十讲 大数据分析挖掘工具
1)大数据挖掘及知识模型的发现
2)大数据挖掘工具Mahout和MLlib
3)推荐方法及MLlib电影推荐案例
4)分类方法及Mahout新闻分类案例
5)聚类方法及K-Means聚类案例
第十一讲 资源虚拟化工具Docker
1)虚拟化和容器技术
2)LXC和Docker的发展
3)Docker架构及特性
4)镜像、容器和仓库
5)Docker的执行及其案例实操
第十二讲 大数据技术展望
1)大数据分析技术展望
2)大数据平台的发展展望
3)大数据挖掘的应用展望
|