班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上课时间和地点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服! |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
|
- Hadoop EDW 数据库管理员培训
Hadoop EDW 数据库管理员培训
课程目标:
此课程面向公司系统管理员、数据库管理员,希望转型的DBA 等。以及对Hadoop感兴趣的各类技术人员。通过此课程的培训,学员可以深入理解Hadoop技术架构,对Hadoop
运作机制有清晰全面的认识,可以独立规划及部署生产环境的Hadoop集群,掌握Hadoop基本运维思路和方法,对Hadoop集群进行管理和优化。
目标学员:软件工程师、高级软件工程师、数据库开发人员、互联网服务后台开发人员、运维人员
培训大纲
一、集群安装和管理
模块一、Hadoop的来源和动机
·传统大规模系统存在的问题
· 对一种新的解决方案的需求
模块二、EasyHadoop安装和部署准备
·Hadoop系统模块组件概述
·Hadoop试验集群的部署结构
·Hadoop 安装依赖关系
·Hadoop 生产环境的部署结构
模块三、EasyHadoop集群安装和部署
·Red hat Linux基础环境搭建 上机实验
·Hadoop 单机系统版本 安装配置 上机实验
·Hadoop 集群系统版本 安装和启动配置 上机实验
·Hadoop 集群异常Debug 方法
·Hadoop 集群简单测试方法
·使用 Hadoop MapReduce Streaming 快速测试系统
模块四、Hadoop组件详解
·Hadoop HDFS 基本结构
·Hadoop HDFS 副本存放策略
·Hadoop NameNode 详解
·Hadoop SecondaryNameNode 详解
·Hadoop DataNode 详解
·Hadoop JobTracker 详解
·Hadoop TaskTracker 详解
模块五、EasyHadoop集群配置详解
·Hadoop core-site,hdfs-site,mapred-site 配置详解
·Hadoop 高可用配置方法
二、集群优化和管理
模块六、EasyHadoop集群配置:机架感知,开启压缩和任务均衡
·Hadoop 集群安装和开启LZO压缩 上机实验
·Hadoop 配置集群具备机架感知 上机实验
·Hadoop 集群开启公平任务调度器 上机实验
·Hadoop 集群开启能力任务调度器 上机实验
模块七、Hadoop 集群维护与管理
·查看集群状态
·HDFS数据管理
·Mapreduce 任务管理
·HDFS安全模式
·模拟集群Namenode,jobtrack失效
·添加删除节点
·数据平衡
·文件数据跨集群拷贝
·集群升级
模块八、Hadoop 集群规划和测试
·集群规划(硬件,系统,网络)
·集群性能测试"
模块九、Hadoop 集群监控和运维
·使用Ganglia 监控Hadoop集群
·使用Cacti 监控操作系统"
模块十、Hadoop HDFS高可用
·Hadoop 元数据NFS备份方案
·Hadoop SecondaryNameNode备份方案
·Hadoop CheckpointNode备份方案
·Hadoop BackupNode备份方案
·Hadoop Cloudera HA Namenode 方案
三、EasyHive EasyPig 数据仓库
模块一、EasyHive仓库集群
·Hive的作用和原理说明
·Hadoop仓库和传统数据仓库的协作关系
·Hadoop/Hive仓库数据数据流
·Hive 部署和安装
·Hive Cli 的基本用法
·HQL基本语法
模块二、EasyHive仓库集群高级
·使用JDBC 连接Hive进行查询和分析
·使用正则表达式加载数据
·HQL高级语法
·编写UDF函数
·编写UDAF自定义函数"
模块三、EasyHive仓库优化
·使用Hive分区优化查询
·使用Lzo压缩优化数据存储容量
·HiveServer HA (使用haproxy提高HiveServer可用性)
·编写Hive自定义MapReduce脚本优化查询
·Hive数据倾斜和查询性能优化"
模块四、EasyHive仓库外围系统
·使用Sqoop进行数据分析
·使用oozie配置工作流
·phpHiveAdmin 安装和使用
"
|