使用WordCloud绘制词云图,就这么简单!

“词云”,指的是对网络文本中出现频率较高的关键词予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

今天,小编给大家分享在Python中如何绘制一张词云图。

一、WordCloud包安装

在绘制词云图之前,我们需要安装WordCloud包,安装方式如下图所示:

当然,你也可以从PyPI中下载WordCloud源码包,使用python install setup.py命令进行安装。

二、绘制词云图

WordCloud包安装完成后,我们开始绘制词云图。首先,展示一下绘制词云图的源数据,如下所示:Statistics skills, and programming skills are equally important for analytics.

它存储在名称为wordcloud.txt的文本文档中。以下是绘制词云图的一些代码及步骤:

Step 1:我们需要从wordcloud中导入WordCloud类,从matplotlib中导入pyplot模块,并将其别名为plt,如下所示:

import matplotlib.pyplot as plt

from wordcloud import WordCloud

Step 2:我们需要从wordcloud.txt文本文档中读取所有内容。同时,实例化WordCloud类,并将文本内容传递到实例的generate方法中,它会生成一张词云图,代码如下:

text = open('wordcloud.txt').read()

wordcloud = WordCloud()

pic = wordcloud.generate(text)

Step 3:最后,我们需要使用绘图包matplotlib将其显示出来,代码如下:

plt.imshow(pic.recolor(random_state=2019))

plt.title('Most Frequent Words')

plt.axis("off")

plt.show()

以上步骤完成后,一张反映词频多少的的词云图(如下图所示)就生成了,是不是非常简单!赶快试一试吧!

以上所有代码如下图:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180918G1YC3I00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券