前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >赘婿词云图制作

赘婿词云图制作

作者头像
罗罗攀
发布2021-03-15 21:19:18
7870
发布2021-03-15 21:19:18
举报
文章被收录于专栏:有趣的Python和你

前言

之前的文章我们已经介绍了如何使用wordcloud库制作中英文词云图,并介绍了中英文停用词的使用方法,介绍了如何美化词云图,例如换字体背景颜色,背景换成图片等,那这次我们就以现在很火的电视剧赘婿为例,制作赘婿小说的词云图。

数据准备

  • 赘婿小说txt
  • 停用词表
  • 一张赘婿相关背景图

制作流程

  • 读取小说文本
  • 利用jieba库对文本进行分词
  • 设置停用词表
  • 利用wordcloud库制作词云图

代码

根据上面的流程,编写代码。

代码语言:javascript
复制
from matplotlib import pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import jieba

fp = open('赘婿.txt','r')
text = fp.read()
cut_word = " ".join(jieba.cut(text))

stopwords = set()
content = [line.strip() for line in open('hit_stopwords.txt','r').readlines()]
stopwords.update(content)

background_image = plt.imread('赘婿.jpg')

wc = WordCloud(background_color = 'white',
               font_path = r'/System/Library/Fonts/Supplemental/Songti.ttc',
               stopwords = stopwords,
               mask = background_image,
               max_words=2000)
wc.generate(cut_word)

#改变字体颜色
img_colors = ImageColorGenerator(background_image)
#字体颜色为背景图片的颜色
wc.recolor(color_func=img_colors)

plt.imshow(wc, interpolation='bilinear')
plt.axis('off') #取消坐标轴
plt.show()

词云图可以看出,还是有很多次我们还需要过滤掉,这部分内容在jieba库的使用中再进行讲解。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 数据准备
  • 制作流程
  • 代码
相关产品与服务
腾讯云图数据可视化
腾讯云图数据可视化(Tencent Cloud Visualization) 是一站式数据可视化展示平台,旨在帮助用户快速通过可视化图表展示大量数据,低门槛快速打造出专业大屏数据展示。精心预设多种行业模板,极致展示数据魅力。采用拖拽式自由布局,全图形化编辑,快速可视化制作。腾讯云图数据可视化支持多种数据来源配置,支持数据实时同步更新,同时基于 Web 页面渲染,可灵活投屏多种屏幕终端。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档