班级规模及环境--热线:4008699035 手机:15921673576( 微信同号) |
坚持小班授课,为保证培训效果,增加互动环节,每期人数限3到5人。 |
上课时间和地点 |
上课地点:【上海】:同济大学(沪西)/新城金郡商务楼(11号线白银路站) 【深圳分部】:电影大厦(地铁一号线大剧院站)/深圳大学成教院 【北京分部】:北京中山学院/福鑫大楼 【南京分部】:金港大厦(和燕路) 【武汉分部】:佳源大厦(高新二路) 【成都分部】:领馆区1号(中和大道) 【沈阳分部】:沈阳理工大学/六宅臻品 【郑州分部】:郑州大学/锦华大厦 【石家庄分部】:河北科技大学/瑞景大厦 【广州分部】:广粮大厦 【西安分部】:协同大厦
最近开课时间(周末班/连续班/晚班):即将开课,详情请咨询客服! |
实验设备 |
☆资深工程师授课
☆注重质量
☆边讲边练
☆合格学员免费推荐工作
★实验设备请点击这儿查看★ |
质量保障 |
1、培训过程中,如有部分内容理解不透或消化不好,可免费在以后培训班中重听;
2、课程完成后,授课老师留给学员手机和Email,保障培训效果,免费提供半年的技术支持。
3、培训合格学员可享受免费推荐就业机会。 |
课程大纲 |
一、 课程背景
信息爆炸的大数据时代,如何有效利用系统庞大的数据,如何面对互联网金融的挑战,成为企业关注的重要问题。为帮助企业认清和解决这一问题,有必要紧跟时代发展步伐,综合各方经验,以帮助企业成功转型。中培在过去的十年中曾经为数百家企业提供了数据挖掘培训服务。
二、 培训收益
通过本课程,您可以掌握以下:
1. 数据挖掘与商业智能的历史、概念、经典案例、基础理论;
2. 掌握R的基本数据结构、统计函数及高级函数、导入导出数据;
3. 理解如何使用R语言及相应的模型解决现实问题;
4. 全面掌握Hadoop的架构原理和使用场景;
5. 掌握大数据基本概念及特点;
6. 了解典型行业对于大数据的处理方式;
7. 了解基于大数据的客户行为分析;
8. 数据云计算框架Hadoop及其对大数据处理的支撑作用;
9. 掌握MapReduce计算模型概念及应用;
10. 熟悉大数据存储组件Hbase及Hive;
11. 了解大数据分析工具Mouhout;
12. 掌握R数据挖掘的基本方法。
三、 培训大纲
日程 培训模块 培训内容
大数据概述 1. 大数据基本概念、技术梗概、技术沿革,以及大数据技术是如何改变人工智能技术、语音识别技术、图像识别/视频理解、自然语言处理技术等;
2. 数据挖掘与商业智能概述;
3. 数据挖掘与商业智能发展历程;
4. 数据挖掘与商业智能的基本理论。
R语言精要 本着循序渐进而又覆盖R语言重要而有用的基本内容原则,本讲从R语言入门开始,以前期的数据处理为核心,以实际案例为载体,内容包括R语言的向量、数据框、矩阵运算、缺失值和零值的处理、特别注重用R语言构造函数编程解决实际问题,详细介绍强大的数据清洗整理plyr、zoo、car等常用包和强大的作图ggplot2包,为使用R语言进行数据挖掘打下扎实的工具基础。
主要案例:
案例1:如何用R语言plyr等包合并、排序、分析数据并编制香农-威纳指数;
案例2:如何用R语言编程同时实现几十个高难度数据分析可视化图片的jpeg格式输出;
案例3:如何使用R语言进行分层或者整群抽样构建训练集与测试集;
案例4:使用ggplot2画出各种复杂的图形。
关联规则和R语言实现 关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法和eclat算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析。
主要案例:
案例1:使用R语言关联规则方法帮助各个超市实现商品的最佳捆绑销售方案(即“购物篮”分析);
案例2:泰坦尼克号乘客幸存的关联规则分析;
案例3:提高个人收入的关联分析。
决策树(回归树)分析和R语言实现 决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C4.5算法,使用Rpart和J48函数进行R语言分析。
主要案例:
案例1:对汽车耗油量进行决策树分析并完成相关目标变量的预测;
案例2:使用决策树帮助电信局判断和预测客户办理宽带业务。
R语言随机森林(RandomForest)算法 在机器学习中,随机森林是一个包含多个决策树的分类器,本讲讲清随机森林方法的原理,以致在实际中帮助学员判断适合进行随机森林分析的情况,最终熟练掌握R语言随机森林分析的方法。
主要案例:
案例1:对皮肤病进行随机森林的分类和预测;
案例2:对酒的品质和种类进行分类和评价。
支持向量机和R语言的实现 本讲将分析支持向量机的结构风险最小原理、间隔和核函数,从而帮助学员深刻理解支持向量机的思想和算法,以及使用中注意的问题,从而帮助学员灵活地应用于各个领域。
主要案例:
案例1:对著名的鸢尾花数据进行支持向量机的分析;
案例2:使用支持向量机识别有毒蘑菇;
案例3:使用支持向量机进行股票指数预测。
神经网络和R语言的实现 神经网络由大量的节点和输出函数构成逻辑策略,本讲介绍其原理,主要通过案例的方式讲解R语言实现神经网络算法的过程和注意的事项。
主要案例:
案例1:酒的品质和种类的神经网络的分析和预测;
案例2:公司财务预警建模。
使用R语言结合KNN算法进行文本挖掘 文本挖掘,特别是对中文的文本挖掘日趋重要。本讲介绍文本挖掘的原理和方法,帮助大家使用R语言在大量的非结构化的数据中发现有价值的信息,抽取潜在有用的数据,发现适合模式,实现可视化结果展示。
主要案例:
案例:使用R语言结合KNN算法对网页(Web)进行文本挖掘(含分词、分类、可视化等)。 |
|
|