课程信息
  • 课程首页
  • 拼团活动
  • 专业套餐
  • 优惠活动
  • 我的课程
  • 站内消息
  • 站内提醒
  • 我的钱包
  • 奖学金
  • 道具 | 抵价券
  • 登录


【快班】R七种武器之文本挖掘包tm

数据分析

3周

22人

此课程所属【Dataguru精品公开课(免费)】专业,专业内有不少于15门推荐课程,目前平台推出【专业课程0元学】活动,只需0元即可在所有的专业课程中任选5门学习,超值优惠,助您快速成长!点击这里了解

讲师
tracy1616
何翠仪:中山大学统计学专业毕业,炼数成金专职讲师,在过去曾讲授《大数据的统计学基础》课程,并负责多门炼数成金数据分析课程的助教工作,参与主持建设炼数成金的R语言认证题库系统(即将上线)。
课程简介

      自然语言处理与文本挖掘是机器学习当前最神秘,最红火,最具难度,也最让引人关注的分支。在搜索引擎,语音识别,情感分析,大批量文档处理,机器翻译,自动应答等各个领域有着前程无可限量的应用。可以试想一台能理解自然语言,并且和人类能用语言纯熟交流的机器,那还能叫机器么?
      文本挖掘(Text Mining)是数据挖掘的一个分支,挖掘对象通常是非结构化的文本数据,常见的文本挖掘对象包括网页所产生的BBS留言、博客、微博、新闻跟贴与转贴等。此外,拥有大型呼叫中心或邮件系统的企业,call center或mail积攒下来的大量语言记录也可以通过文本挖掘获得更大价值。很多统计软件都提供了文本挖掘的功能,比如常见的数据分析软件SAS、SPSS等,以及一些语言如Python、Java,侧重点有所不同。在R语言环境下,有众多的扩展包可以解决文本挖掘问题,本门课程将对这些扩展包作详细讲解。
      《R七种武器之文本挖掘》是“R七种武器”系列的又一门新课程。炼数成金在2015年内必开关于自然语言处理和文本挖掘方面的大课,也可能是全国第一个公开的成体系的此类课程。本课程可以看为是上述大课程的一个预热。

课程章节
  • 第1课 自然语言处理与文本挖掘概述
  • 第2课 R的文本挖掘包tm,基本操作介绍
  • 第3课 其它处理文本的扩展包
    • 3-1 与tm包结合使用的应用案例
课程环境

windows或其它所有能跑R的环境

授课对象

适合已经学习《数据分析,展现与R语言》(或具有同等能力)的朋友进一步学习。只要有基本的R环境即可而无需增加其它任何设备

收获预期

熟练地使用R进行文本分析处理工作

学费

学费: ¥0 ( 固定学费: ¥0, 逆向学费: ¥0 )

新颖的课程收费形式:“逆向收费”约等于免费学习,仅收取0元固定收费+0元逆向学费,学习圆满则逆向学费全额返还给学员!

炼数成金移动版 v2.0