班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上课时间和地点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服! |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
|
云计算分布式大数据Hive数据仓库最佳实践培训
云计算分布式大数据Hive数据仓库最佳实践培训
课程大纲:
第一部分:
第1个主题:云计算的四大核心技术
HDFS、MapReduce、HBase、Hive
第2个主题:Hive集群与管理
1、Hadoop集群的搭建
2、Hadoop集群的监控
3、Hadoop集群的管理
4、集群下运行MapReduce程序
5、安装并启动Hive
6、测试Hive
第3主题:Hive的命令、数据类型和文件格式
1、Hive的CLI
2、Hive的集合数据类型
3、编码和模式
第4主题:开发Hive
1. 连接Java调试器到Hive
2. 通过Eclipse来开发Hive代码
3. Hive的单元测试
第5题:HQL
1. HQL的数据定义
2. 使用HQL操作数据
3. 深入HQL查询
第6题:HQL的视图和索引
1、HQL的视图:降低查询的复杂度和限定特定的条件
2、HQL的索引:索引的创建和管理、定制索引
第二部分:
第1个主题:Hive中的函数
1. 使用Hive中已有的函数
2. 自定义聚合函数
3. 自定义表生成函数
4. 在自定义函数中访问缓存
第2个主题:Hive的存储过程
1、为何需要Hive中的存储过程
2、 在后台中运行的存储过程
3、HiveStorageHandler
4、 存储过程的具体编写和使用
第3个主题:Hive架构优化
1、 降低IO负载
2、 表的分区、动态分区
3、 压缩
4、分布式缓存
第4个主题:彻底优化HQL
1、 HQL优化的具体策略和方式
2、 Map和Reduce
3、数据倾斜
4,执行计划
第5个主题:在AWS上使用Hive
1. 使用并管理EMR Hive集群
2. EMR集群的详细配置
3.持久层、元数据
4.集群中的HDFS和S3(配置、日志等)
第6个主题:Hive的Thrift
1. 配置、启动、使用Thrift
2. Thrift的管理
3. 管理Hive Server
4.ThriftMetaStore
|