首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

计算思维|利用Python处理文本,形成可视化词云

利用Python制作一个可视化的词云,是一项相对简单、适合初学者练手的一个实验。通过本实验,我们可以体会到计算思维方法在解决自然语言处理问题中的重要作用,将计算思维与实际生活紧密结合起来。

实验准备

1.安装Python解释器(版本最好在3.7.x以上,不建议使用最新版)+配置相关环境

2.导入第三方库wordcloud和jieba(或者下载一个完备的Anaconda),如果要更改词云形状的话还需要导入numpy库

3.确定要进行可视化处理的文本

4.编写代码,实现词云

代码实现

import wordcloud #以空格为标识,区分单词import jiebaimport numpy as npimport PIL.Image as image

f = open("mytext.txt","r",encoding="utf-8")txt=f.read() #生成字符串,一大段文本f.close()ls = jieba.lcut(txt)#jieba库分词,形成列表

t = " ".join(ls)#然后以空格为标识,将列表的每一个元素区分开

mask = np.array(image.open("图片1.jpg"))#注意这里的图片的背景必须是白色,否则会修改词云形状失败

w = wordcloud.WordCloud(width=1000,height=700,background_color="white",\ font_path="msyh.ttc")w.generate(t)

w.to_file("result.png")

实验效果

关注我们

2021

学生工坊

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20210118A0E0FG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券