如何使用Recharts绘制动态词云图

Echarts是由百度开发的一款免费、强大的图表生成和可视化库,使其可以方便地对数据进行展示、交互和定制。

Recharts是基于Echarts开发的R版本,由Yang Zhou和TaiyunWei开发,通过该包的echartR函数可以完成很多可视化的任务,图表美观且有动态效果,是一款优秀的数据可视化产品。以下是Recharts绘图的知识地图(基本图形):

百闻不如一见,今天我们使用一则案例来演示使用echartR进行绘图的流程。

一、举例Showcase

“世界很复杂,百度更懂你”。百度搜索风云榜以数亿网民的单日搜索行为作为数据基础,以关键词为统计对象建立权威全面的各类关键词排行榜,盘点中国最新最热的人、事、物信息,为最具代表性的“网络风向标”。

我们想通过从百度热词榜获取热词并通过词云的形式实时展现网名关注的人、事、物。

二、前置准备

1.本机测试环境:R最新版 R3.4.4

2.Recharts安装与加载方法

三、echartr词云WordCloud语法介绍

四、正式绘图

1.数据准备

从百度热词榜获取热词,并解析为数据框,包含热词和频数。为此构建一个函数getBaiduHot,解析_百度热词趋势_ 网页。

2. 预览一下数据集前十位:

3.基本图形绘制

只要提供x和y

制图结果如下:

上图根据关键词和词频绘制了Top30的百度热词,抓取的时间是2018-3-18 12:44:08。可以看出网友比较关注的话题有娱乐话题、政治话题、生活话题、体育话题等。如“姚笛被成功求婚”、”iPhoneX撒一地”、”中超一方最差开局”等等。

4.按数据系列着色

我们希望将热词分组。定义一个series变量’Trend’。’rise’系列和’fall’系列用不同的颜色标注。

绘制结果如下:

5.带时间轴WithTimeline

比较实时热点、今日热点和七日热词趋势。

首先,获取今日热点和七日热点两个榜单的网页并转为数据框,合并。

然后作图:

效果如下:

备注:此图为动态图片,可以通过拖动X轴动态展示实时热点、今日热点和七日热词趋势。

6.设置主题setTheme

设定主题背景和调色板颜色。效果如下:

熟悉此案例之后,你可以通过R来抓取公开网页的词语(需要注意合法性的问题)并进行动态词云展示。EchartR的语法并不复杂,通过简单的几行命令即可实现强大的自定义可视化图表制作。

这个正式R最吸引人的地方,它可以用几行简单的代码生成图表和图以及完成强大的任务功能。同时作为开源工具,目前尚无行业应用限制,方便的拓展性,不仅可以同Python,Java,C,C++等语言进行互调,其他统计软件也大部分均可调用R,如SAS,SPSS statistic等。

广告插播

如果你对R语言进行数据分析感兴趣,欢迎参加CDA业务数据分析师-R语言专题课程。

课程通过R语言基础、数据提取、数据处理、统计分析、数据建模、数据可视化等体系学习,介绍了R语言及数据分析与挖掘的各个技术细节。通过实际的金融、电信、市场调研、客户关系等案例演练,让学员真正体验数据分析与R语言的魅力。

R语言最近开课:

(CDA LEVEL I R 数据分析)

一、课程信息

北京 & 远程:2018年03月24日~04月22日(四周线下&直播) + 两周线上

授课安排:现场班6900元,远程班4900元

(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式

(2)授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)

(3)学习期限:现场与视频结合,长期学习加练习答疑。

二、报名流程

1. 在线填写报名信息

微信端:

2. 给予反馈,确认报名信息

3. 网上缴费

4. 开课前一周发送电子版课件和教室路线图

三、课程大纲

第一阶段:数据分析概念与R编程

第二阶段:数理统计与SQL数据库

第三阶段:数理统计与数据可视化

第四阶段:统计推断与精益管理

第五阶段:市场分析方法与模式识别模型

第六阶段:客户分析方法与分类模型

第七阶段:时间序列与综合案例

第八阶段:综合案例分析

第九阶段:[线上选修]Mysql数据库基础知识(一周)

第十阶段:[线上选修]Tableau数据可视化(一周)

如果你有R语言统计分析和业务分析的基础,对R数据挖掘和模型的知识有兴趣,也欢迎报名参加R数据挖掘的课程:

http://www.cda.cn/kecheng/31.html

1级2级连报更有8折优惠!

四、课程讲师

程老师

CDA数据分析研究院讲师/中国人民大学经济学博士

多年数据挖掘及可视化实战经验,参与科研课题近20项,发表中英文论文近30篇。曾获得“汇丰杯”中国高校SAS数据分析大赛冠军。翻译或参与编写《商务与经济统计》、《R语言编程艺术》、《大数据挖掘与统计机器学习》等多部著作。

曾珂

管理科学工程硕士/CDA数据分析研究院讲师

现为第一车贷金融产品部数据挖掘工程师,精通Python与R语言数据挖掘,研究方向为互联网、电子商务数据分析与挖掘,擅长基于客户关系管理的数据挖掘、数据可视化、文本挖掘。

五、课程优惠

1. 全日制在读学生8折优惠(需提供学生证件证明);

2. 参加过论坛其他现场班老学员9折优惠;

3. 同一单位三人及以上9折优惠,五人及以上8折优惠;

4. 同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。

联系我们

课程顾问:

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180319A0KE3300?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券