前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >什么是词云?

什么是词云?

作者头像
种花家的奋斗兔
发布2020-11-13 11:04:21
4.5K0
发布2020-11-13 11:04:21
举报
文章被收录于专栏:NLP小白的学习历程

1. 定义

“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。

词云”就是数据可视化的一种形式。给出一段文本的关键词,根据关键词的出现频率而生成的一幅图像,人们只要扫一眼就能够明白文章主旨。

如下图:

2. 词云的生成

工具:

  1. matplotlib matplotlib,不用多讲,用python学习过机器学习的人都知道,是一个绘图库,最终词云的绘制需要用到它。
  2. jieba jieba,最好用的开源中文分词工具。他最主要的两个功能是分词和关键词的抽取。在词云的生成过程中都需要用到。
  3. wordcloud wordcloud是一个词云生成器,只要进行相关的配置就能生成相应的词云。

实现的过程简单来讲,两步走,1. 提取关键词,2. 生成词云。

关于如何使用代码生成词云,参考:

https://blog.csdn.net/weixin_43926091/article/details/85078763

https://www.cnblogs.com/Leo_wl/p/7643308.html

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/12/04 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 定义
  • 2. 词云的生成
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档