班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
每个班级的人数限3到5人,互动授课, 保障效果,小班授课。 |
上间和地点 |
上部份地点:【上海】同济大学(沪西)/新城金郡商务楼(11号线白银路站)【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院【北京分部】:北京中山学院/福鑫大楼【南京分部】:金港大厦(和燕路)【武汉分部】:佳源大厦(高新二路)【成都分部】:领馆区1号(中和大道)【沈阳分部】:沈阳理工大学/六宅臻品【郑州分部】:郑州大学/锦华大厦【石家庄分部】:河北科技大学/瑞景大厦 最近开间(周末班/连续班/晚班):即将开课,详情请咨询客服! |
实验设备 |
◆小班教学,教学效果好 ☆注重质量☆边讲边练 ☆合格学员免费推荐工作 ★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听; 2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。 3、培训合格学员可享受免费推荐就业机会。☆合格学员免费颁发相关工程师等资格证书,提升职业资质。专注高端技术培训15年,曙海学员的能力得到大家的认同,受到用人单位的广泛赞誉,曙海的证书受到广泛认可。 |
部份程大纲 |
|
第一部份 Hive与Hadoop
(1) Hadoop和MapReduce
(2) Hadoop生态中的Hive
(3) Hive与关系型数据库的差异
(4) Hive安装
第二部份 Hive的特性1
(1) 内部表与外部表
(2) insert与insert overwrite
(3) mapjoin
(4) group by/order by/partition by/sort by/cluster by
第三部份 Hive的特性2
(1) 动态分区、静态分区
(2) streaming转换数据
(2) 一次读取多次插入
(3) 文件压缩格式
第四部份 Hive的特性3
(1) UDF
(2) UDAF
(3) UDTF
第五部份 Hive调优
(1) Hive优化通用思路
(2) 执行计划
(3) Hive调优常用方法
(3) Hive调优案例
第六部份 Hive实战
(1) 某电商网站,按平台、版本、城市维度统计PV、UV
(2) 某电商网站,按平台、版本、城市多种维度组合,统计PV、UV
(3) 某电商网站,按平台、版本、城市多种维度组合,统计PV、UV、下单量、下单用户数
第七部份 数据仓库概要
(1) 数据仓库起因
(2) 数据仓库发展
(3) 数据仓库定义
(4) 数据仓库与数据库的区别
第八部份 数据仓库架构
(1) Inmon 与 Kimball
(2) 混合架构 与 DataVault架构
(3) 数仓架构选型的思考
(4) 数据仓库分层
第九部份 数据仓库建模
(1) 什么是数据模型
(2) 为什么需要数据模型
(3) 如何创建数据模型
(4) 数仓建模的方法介绍
第十部份 维度建模
(1) 维度建模基本概念
(2) 维度建模技术
(3) 维度建模过程
(4) 维度建模常见问题
第十一部份 从0到1搭建Hive数仓(上)
(1) 根据业务特点和需求,选型数据仓库架构
(2) 基于数仓架构和业务处理综合考虑,设计合理的数据仓库分层
(3) 梳理整体的业务ER图,选择要建设的业务和数据范围
(4) 确立数仓总线架构,站在较高的抽象业务分析主题
第十二部份 从0到1搭建Hive数仓(下)
(1) 按主题思想设计完整的数据仓库模型
(2) 根据主题优先级划分,分阶段设计数据流和数据模型
(3) 数据模型落地:Hive开发->测试>数据验证->上线
(4) 数仓建设过程中的数据质量和元数据管理
|