曙海教育集团
全国报名免费热线:4008699035 微信:shuhaipeixun
或15921673576(微信同号) QQ:1299983702
首页 课程表 在线聊 报名 讲师 品牌 QQ聊 活动 就业
 

数据仓库与大数据挖掘分析培训课程

 
   班级规模及环境--热线:4008699035 手机:15921673576( 微信同号)
       坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。
   上课时间和地点
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服!
   实验设备
     ☆资深工程师授课
        
        ☆注重质量 ☆边讲边练

        ☆合格学员免费推荐工作
        ★实验设备请点击这儿查看★
   质量保障

        1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
        2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
        3、培训合格学员可享受免费推荐就业机会。

课程大纲
 
 
一、 课程背景概述
大数据分析处理平台技术已经给新兴互联网企业(如电子商务网站、搜索引擎、社交网站、互联网广告服务提供商等)、银行金融证券企业、电信运营商行业、高端装备制造企业、IT基础设施提供商等带来了巨大的商业机遇,大数据平台在整个企业的价值增值链中发挥着至关重要的决定性作用。互联网+大数据时代的到来,一方面为企业带来了潜在的巨大发展机遇,能有效推动企业的信息化转型升级和科学决策分析;另一方面由于企业缺乏大数据技术专业人才和大数据平台建设实施经验,对企业实行大数据发展战略也带来了较大的挑战。本次课程带大家领略大数据分析应用技术的魅力和广阔前景,系统地讲解基于Hadoop和Spark处理平台的大数据分析算法,以及分布式并行分析处理技术的应用实践,业界主流的大数据分析处理平台、核心组件、关键技术、平台架构、大数据分析应用解决方案以及案例集锦。结合业界使用最广泛的主流大数据平台技术,重点剖析基于Hadoop和Spark大数据技术生态圈的大数据分析处理技术,大型数据仓库平台(HIVE)的技术架构和分析应用、大数据分析挖掘处理平台(Mahout,MLib)的分析算法应用与实战,基于ELK架构的大规模日志数据的分析处理以及用户行为分析处理和电商数据挖掘推荐系统项目应用案例。
通过本次课程培训让学员掌握基于主流的Hadoop与Spark大数据平台的数据分析技术,以及大数据分析项目的有效实施,培训过程中穿插着已经落地的成功大数据分析项目实施应用案例,分享互联网行业大数据分析应用的项目经验,让学员掌握如何构建可行的大数据分析挖掘处理平台解决方案。
二、 授课人群
1. 集团企业大数据处理平台技术架构师
2. 集团企业大数据分析项目工程师
3. 集团企业数据仓库工程师


三、 培训目标
本课程通过培训使学习者达到如下目标:
1. 本课程让学员充分掌握大数据分析处理平台技术架构、业界常用的大数据分析挖掘算法、大数据分析应用实战技能、国内外主流的大数据分析处理技术在不同行业的解决方案,并以银行金融业、电商行业、互联网精准营销行业的为例子阐述大数据分析算法及其技术平台的实际应用案例,以及对比剖析主流的大数据分析产品。
2. 让学员掌握基于主流的大数据Hadoop平台和Spark实时处理平台的大数据分析处理平台的技术架构和实际分析挖掘处理应用,并用结合实际的信息化业务系统案例进行教学,讲解利用Hadoop+Spark对行业大数据进行存储管理和分析挖掘的技术应用,掌握基于Hadoop大数据平台的并行挖掘处理技术和数据仓库应用。深入讲解包括大数据ETL处理、大数据仓库HIVE、大数据分布式并行挖掘处理平台Mahout,基于Spark内存计算的实时挖掘处理平台MLib, 互联网行业常用的ELK(ElasticSearch,Logstash,Kibana)日志分析系统解决方案,以及电商数据挖掘与推荐系统Oryx,并基于这些平台展开大数据分析挖掘与精准推荐处理平台在金融行业的实践应用。
3. 本课程采用技术原理与项目实战相结合的方式进行教学,在讲授原理的过程中,穿插实际的系统操作,本课程讲师也精心准备的实际的应用案例供学员动手训练。
四、培训特色
定制授课+ 实战案例训练+ 互动咨询讨论,共1天,6课时.


五、详细大纲(讲解和实验各占一半时间)
(注明:本次培训使用的基础软件,包括Linux操作系统,Hadoop集群软件和Spark集群软件,讲师在课前一周会公布讲义资料和实验平台,请学员自备笔记本,参考配置CPU在i5及以上,内存4GB及以上,硬盘可用存储空间40GB及以上)
时间 授课内容 动手实验安排
第一天 1. 大型数据仓库HIVE集群平台的应用案例,Hive文件与记录存储格式、Hive大数据统计分析技术、Hive功能操作实践,以及云计算数据中心的Hive大型数据仓库集群在电商数据、搜索引擎、日志分析、用户行为分析、客户分析,以及互联网金融数据分析中的案例剖析
2. 大数据分析的数据整理、数据集成、数据抽取、转换、加载,ETL工具平台的应用实践与案例分享
3. 在互联网电商平台、互联网金融平台中针对用户行为分析、客户分析、个性化推荐、广告精准投放、产品营销应用场景下常用的数据建模方法、建模过程、匹配算法、并行数据挖掘算法、原理、以及技术应用。
4. 基于大数据集的机器学习算法,以及大数据的分类挖掘算法、聚类挖掘、统计学习、关联分析挖掘和链接分析挖掘算法与技术在电商个性化推荐营销和银行客户分析中的实践应用
5. 业界常用的数据挖掘与分析算法及其应用实践,重点讲解七大类算法的实现技术与应用实践:分类算法、聚类算法、关联规则挖掘算法、回归算法、进化算法、协同过滤与推荐算法。
6. 针对互联网金融、网络银行和电商等不同业务场景的数据分析需求,讲解决策树分类(C4.5)挖掘、K均值聚类(K-means)挖掘、支持向量机分类(SVM)挖掘、关联规则挖掘(Apriori)、最大期望(EM)挖掘、链接分析(PageRank)挖掘、集成(AdaBoost)挖掘、K近邻(KNN)分类挖掘、贝叶斯分类(Naïve Bayes)挖掘、分类和回归(CART)挖掘算法、基于Item的协同过滤算法和基于用户的协同过滤算法的基本原理、应用场景、实现技术、以及面向问题解析的组合挖掘构造方法,并结合业务需求剖析算法应用以及大数据挖掘中间件系统。
7. 基于Hadoop平台的分布式并行数据挖掘平台Mahout的系统架构、关键技术、核心组件的工作原理、安装部署、配置调优、二次应用开发实践,Mahout大数据协同过滤分析、频繁模式挖掘分析、聚类分析、分类分析、推荐分析应用的实现方式,以及Hadoop+Mahout大数据挖掘平台的应用实践案例,分别在电商日志分析、电商平台商品推荐、电商平台用户推荐、金融与银行理财产品的客户流失预测、客户分类分级挖掘、客户属性关联挖掘业务中的应用。
8. 互联网用户行为分析实践案例,对客户进行360°刻画,客户分类分析,精准广告营销定位分析的实训案例。银行信用卡客户的分类分析,以及客户流失预测分析,消费行为分析的实践案例
9. Spark大数据实时处理平台的系统集群架构、关键技术、核心组件的工作原理,Spark分布式集群的安装部署、配置调优、Spark SQL和MLib的算法应用示例,及其在电商与支付平台和运营日志中的应用实践案例。
10. ELK(Elasticsearch ,Logstash,Kibana)分布式日志分析挖掘平台的系统架构、关键技术和核心组件剖析,它在电商、互联网金融平台和第三方支付平台,银行应用中的客户行为分析挖掘与分析处理,预测客户的兴趣、爱好、产品关联性、情感、推荐标签以及预测其在线消费决策,并剖析讲解客户个性化营销的技术解决方案。
11. 基于大数据的推荐系统Oryx平台的技术架构、关键技术和核心算法组件,以及Oryx分布式集群在个性化推荐、精准营销、精准广告投放领域中的实战应用,以及解决方案实施。
12. 针对当前业务工作中遇到的大数据分析的需求、难点、痛点、瓶颈,以及解决之道,课堂讨论预计可行的项目方案。讲解某大型银行的数据仓库与分析系统架构,业务数据分析和数据统计分析与自动化报表的项目实施案例。
13. 基于真实的互联网数据和实验指导手册在讲师的引导下完成实际的项目案例,巩固学过的大数据分析挖掘处理平台技术知识以及应用技能 1. VMware环境下部署配置CentOS虚拟机集群模拟真实的物理集群
2. 在CentOS虚拟集群上部署Hadoop平台以及配置操作
3. 配置部署HIVE数据仓库集群,以及性能调优实战
4. 基于HIVE的大型数据仓库的解决方案
5. 数据挖掘算法程序的实现与运行,并以用户行为日志数据集为实验素材,基于Hadoop处理平台利用不同的算法对用户进行分类、聚类以及推荐等实验操作,并得出相应的结果
6. Mahout分布式并行挖掘平台的实战解决方案
7. 基于Spark与MLib的实时分析分析处理平台的实战解决方案,集群的部署、配置,分析算法的运行调优


8. 运行Mahout和MLib中的每一类算法中的不同算法实现,并比较不同分析挖掘结果,掌握各个分析场景下的算法组合优化
9. ELK日志分析与挖掘系统的实战解决方案,基于真实日志数据集进行分析
10. Oryx大数据推荐系统的实战解决方案
11. 基于实验部署的VMware虚拟化集群管理软件,以及Hadoop + HBase + ELK + HIVE + Mahout + Storm + Spark的大数据分析挖掘处理平台集成解决方案的应用实践案例分享
12. 基于讲解过的大数据分析挖掘平台集成解决方案,设计实现一个真实的融合用户历史行为的数据搜索系统,日志分析与电商推荐系统应用案例。
13. 互联网电商和银行金融业的客户分析、支付分析、产品推荐分析、用户行为分析、交易分析、预测分析的应用解决方案。


 

android开发板
linux_android开发板
fpga图像处理
曙海培训实验设备
fpga培训班
 
本课程部分实验室实景
曙海实验室
实验室
曙海培训优势
 
  备案号:沪ICP备08026168号 .(2014年7月11)...................
友情链接:Cadence培训 ICEPAK培训 EMC培训 电磁兼容培训 sas容培训 罗克韦尔PLC培训 欧姆龙PLC培训 PLC培训 三菱PLC培训 西门子PLC培训 dcs培训 横河dcs培训 艾默生培训 robot CAD培训 eplan培训 dcs培训 电路板设计培训 浙大dcs培训 PCB设计培训 adams培训 fluent培训系列课程 培训机构课程短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班培训 南京 NS3培训 OpenGL培训 FPGA培训 PCIE培训 MTK培训 Cortex训 Arduino培训 单片机培训 EMC培训 信号完整性培训 电源设计培训 电机控制培训 LabVIEW培训 OPENCV培训 集成电路培训 UVM验证培训 VxWorks培训 CST培训 PLC培训 Python培训 ANSYS培训 VB语言培训 HFSS培训 SAS培训 Ansys培训 短期培训系列课程培训机构 长期课程列表实践课程高级课程学校培训机构周末班 曙海 教育 企业 学院 培训课程 系列班 长期课程列表实践课程高级课程学校培训机构周末班 短期培训系列课程培训机构 曙海教育企业学院培训课程 系列班