|返回首页|0755-26070628

大数据分析及可视化技术应用实战

发布日期:2017-10-12 09:53     浏览次数:

大数据分析及可视化技术应用实战

【招生对象】 1.大数据分析应用开发工程师
各有关单位:
“数据为王”的时代,大数据将带来一次全新的革命,将改变众多企业的命运。在大数据时代的背景下,R语言作为一种迅速兴起的数据挖掘和可视化工具软件,由于其功能强大、简洁易用,正越来越多的成为数据挖掘项目的实施基础。在数据挖掘和可视化的教学中,如果缺少相应的实际训练,是很难掌握好工具和理论的。本课程理论联系实际,通过具体案例贯穿所有的理论知识。针对游戏、医疗、汽车行业等不同领域应用问题,介绍数据挖掘及可视化的各个技术细节,通过实际的案例演练,让学员真正体验数据挖掘及可视化的强大魅力。中国电子标准协会培训中心大数据研究院专注于大数据应用开发,特推出了大数据分析及可视化技术应用实战课程培训班,旨在培养大数据技术和应用创新型人才,促进大数据技术在各行业内部及跨行业进行实施应用,以及企业大数据分析及可视化项目开发和落地,并利用大数据打造企业核心竞争力优势。现将相关事宜通知如下:
一、 课程特色
1. 本课程尽量避开数学公式,按照“讲清思想方法原理—结合具体案例—R语言实现细节”思路,让即使是几乎没有什么基础的学员,掌握数据挖掘和可视化的基本思路和模式,打下未来深入的良好基础,能在工作和学习中结合具体问题立马上手操作解决;
2. 课程注重学练结合的方法,会采取课中练习的方法,充分调动大家思考的积极性,在做中掌握相关知识和技能;
3. 课程紧紧抓住基于R语言的数据挖掘和可视化的重点和难点,详细的分析和讲解,在理解难、容易出错的地方反复提醒,以便学员在课后容易的进行自己复习和相关拓展。

二、 培训对象
1.大数据分析应用开发工程师
2.大数据分析项目的规划咨询管理人员
3.大数据分析项目的IT项目高管人员
4.大数据分析与挖掘处理算法应用工程师
5.大数据分析集群运维工程师
6.大数据分析项目的售前和售后技术支持服务人员

三、课程大纲
时间 知识模块 授课内容
第一天
上午 数据处理及复杂数据可视化(一) 第一讲 大数据挖掘及可视化介绍
 数据挖掘及可视化背景
 数据挖掘流程
 常用挖掘工具介绍
 R语言的优势
 R数据挖掘可视化工具-Rattle快速上手
 R语言对复杂数据可视化的优势
 R语言快速入门
 利用caret包做数据抽样及虚拟化处理
第一天
下午 数据处理及复杂数据可视化(二) 第二讲 数据质量分析及高级可视化
 缺失值处理的高级方法
 异常值甄别的高级方法
 数据可视化进阶:lattice及ggplot2包介绍
 数据交互可视化:rCharts、recharts、networkD3、plotly等包介绍
第二天
上午 数据挖掘模型实战(一) 第三讲 聚类分析及R语言实现
聚类分析是一种原理简单、应用广泛的数据挖掘技术。顾名思义,聚类分析即是把若干事物按照某种标准归为几个类别,其中较为相近的聚为一类,不那么相近的聚于不同类。
 案例一:对著名的鸢尾花数据进行K均值聚类分析
 案例二:对汽车数据进行K均值聚类分析
 案例三:对洛杉矶街区数据进行层次聚类
 案例四:对汽车数据进行层次聚类
第四讲 关联规则及R语言实现
关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析,并通过arulesViz扩展包对关联规则进行可视化展示。
案例:利用超市购物篮Groceries数据进行关联规则分析
第二天
下午 数据挖掘模型实战(二) 第五讲 KNN近邻算法及R语言实现
KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。
 案例一:对鸢尾花数据集进行knn分类
 案例二:对乳腺癌数据进行knn分类
 案例三:对文本数据进行knn分类
第六讲 决策树分类及R语言实现
决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C5.0算法,使用rpart和C50函数进行R语言分析。
 案例一:对鸢尾花数据集运用C50算法分类
 案例二:对鸢尾花数据集运用CART算法进行分类
 案例三:对汽车数据运用CART对汽车重量进行预测
第三天
上午 行业应用案例分享(一) 第七讲 深度挖掘用户付费行为及社会网络分析
 对用户的购买行为进行购物篮分析
 智能推荐系统常用算法介绍
 对用户购物行为构建智能推荐系统
 社会网络图基本知识
 利用R语言绘制社会网络图
 利用Gephi绘制社会网络图
 对用户购物行为进行聚类分析,发现社群
第三天
下午 行业应用案例分享(二)
第八讲 航空公司客户价值分析
 背景与挖掘目标
 分析方法及过程
 数据探索分析
 数据预处理
 模型构建
 模型应用
第九讲 漏斗模型及路径分析
 漏斗模型的主要应用场景
 路径分析的主要应用场景
 漏斗模型与路径分析的不同点
 sunburst事件路径图的绘制方法
 利用基于时序的关联规则对点击事件进行分析
第四天 学习考核与业内经验交流

培训费用
面授班培训费5800 元/人(含场地费、考试证书费、教材费、学习期间的午餐费) 食宿统一安排,费用自理。请学员带二寸彩照1张(背面注明姓名),身份证复印件一张;
老师介绍
此次课程由以下其中一位老师授课:
  谢老师  计算机硕士,数据分析与可视化专家,高级培训讲师。中国R语言资深顾问,WOT“互联网+”大数据技术、百城沙龙大数据沙龙广深两地特邀顾问。目前就职于某集团上市公司的高级数据分析师,主要利用R语言进行大数据的挖掘和可视化工作。本人从事数据挖掘建模工作已有8年,曾经从事过咨询、电商、电购、电力、游戏等行业,了解不同领域的数据特点。有丰富的利用R语言进行数据挖掘实战经验,部分研究成果曾获得国家专利。培训过的精品课程有:《R语言基础培训》、《Rattle:可视化数据挖掘工具》、《数据分析之R语言实战》、《机器学习与R语言实践》、《R语言与文本挖掘》
钟老师  现任职于中科院某研究所,高级工程师,副高职称,博士毕业于中国科学院计算技术研究所,获工学博士学位(计算机系统结构方向)。中培教育的大数据、云计算、移动互联网系列课程建设与教学专家。近七年来带领团队主要从事大数据与云计算技术项目的研发与IT项目管理工作。钟老师有着多年的企业内训和公开课培训讲师经历,主讲大数据平台技术、云计算、移动互联网、电子商务、IT信息软件项目管理、企业信息化规划与管理、IT战略规划与企业架构、数据中心主机规划与IDC系统运营等企业实战类培训课程。

 

62.9K