【快班】快速数据挖掘平台RapidMiner
数据分析
14周
10人
- tekken
- TEKKEN,从事IT行业十余年,有丰富的数据分析挖掘领域知识经验。对数据清洗转换集成、数据挖掘分析、数据可视化展现等内容有丰富的产品/项目实践经验。曾独立开发完成集成了各种仪表盘、图表、数据挖掘组件在一起的Flex仪表盘设计器( http://blog.csdn.net/stylereport/article/details/7078345 )。现任某数据分析挖掘公司产品总监。
作 为一门学科,数据挖掘对于世人来说在很大程度上是透明的。我们在大多数时间都从未注意到它的发生。但每当我们办理商店购物卡、使用信用卡购物或在网上冲浪 时,都在创建数据。这些数据以大数据集形式存储在我们每天与之打交道的公司所拥有的功能强大的计算机上。存在于这些数据集之内的便是模式 - 表明我们的兴趣、习惯和行为。数据挖掘可让人们找到并解读这些模式,从而帮助人们做出更明智的决策,并更好地为客户服务。 本 培训旨在向您介绍数据挖掘方面的常见概念和做法。 主要目标读者除了大学生之外,还有希望通过挖掘数据,使用信息系统和技术解决业务问题,但在计算机科学方面没有正式相关背景或教育经历的业务专家。 尽管数据挖掘融合了应用统计、逻辑、人工智能、机器学习和数据管理系统,但您不需要在这些领域具有很强的背景即可参加本次培训,来学会使用 RapidMiner。 虽然学过统计学和数据库方面的初级大学课程将会有所帮助,但本培训中对成功学习如何挖掘数据需要了解的概念和技术进行了解释。 RapidMiner原名Yale,它是用于数据挖掘、机器学习、商业预测分析的开源计算环境。根据KDnuggets在2013年的一次投票显示,从使用率来看该软件比之R语言还要略胜一筹。因为其具备GUI特性,所以很适合于数据挖掘的初学者入门。投票信息: http://www.kdnuggets.com/polls/2013/analytics-big-data-mining-data-science-software.htm
- 第1课 数据挖掘基本知识RapidMiner工具介绍
- 第2课 数据准备:导入、预处理、导出
- 第3课 数据挖掘模型和方法
- 第4课 K-Means 聚类与辨别分析
- 第5课 线性回归与逻辑回归
- 第6课 决策树与神经网络
- 第7课 文本挖掘
- 第8课 WEB挖掘
- 第9课 协同过滤、推荐
- 第10课 时间序列分析
- 10-1 网站信息爬取
- 第11课 离群点分析
- 11-1 网页元素值获取、数据入库
- 第12课 模型评估-交叉验证与模型优化化
- 第13课 过程控制
- 第14课 数据转换与执行命令
本课程适合已经有一定的IT基础,但对数据挖掘领域尚不了解的朋友进修学习。如果您具备统计学和数据库方面的初级基础技能会更好。课程同样适用于数据分析师、IT系统架构设计及研发人员,通过简单灵活的挖掘模型定制,带领您探索发现隐藏在海量数据背后的新知识。
算法有一定的了解,有一定的使用RapidMiner工具解决问题的能力,能够熟练地使用RapidMiner提供的典型挖掘算法进行挖掘分析。
学费: ¥400 ( 固定学费: ¥300, 逆向学费: ¥100 )
新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取300元固定收费+100元逆向学费,学习圆满则逆向学费全额返还给学员!