专栏首页python-爬虫049 模块6-wordcloud库的使用

049 模块6-wordcloud库的使用

一、wordcloud库基本介绍

1.1 wordcloud库概述

wordcloud是优秀的词云展示第三方库

  • 词云以词语为基本单位,更加直观和艺术的展示文本

1.2 wordcloud库的安装

pip install wordcloud(cmd命令行)

二、wordcloud库使用说明

2.1 wordcloud库基本使用

wordcloud库把词云当作一个WordCloud对象

  • wordcloud.WordCloud()代表一个文本对应的词云
  • 可以根据文本中词语出现的频率等参数绘制词云
  • 绘制词云的形状、尺寸和颜色都可以设定

2.2 wordcloud库常规方法

w = wordcloud.WordCloud()

  • 以WordCloud对象为基础
  • 配置参数、加载文本、输出文件

方法

描述

w.generate(txt)

向WordCloud对象w中加载文本txt,w.generate("Python and WordCloud")

w.to_file(filename)

将词云输出为图像文件,.png或.jpg?x-oss-process=style/watermark格式,w.to_file("outfile.png")

  • 步骤1:配置对象参数
  • 步骤2:加载词云文本
  • 步骤3:输出词云文件
import wordcloud

w = wordcloud.WordCloud()
w.generate("Python and WordCloud")
c.to_file("pywordcloud.png")

2.3 配置对象参数

w = wordcloud.WordCloud(<参数>)

参数

描述

width

指定词云对象生成图片的宽度,默认400像素

height

指定词云对象生成图片的高度,默认200像素

min_font_size

指定词云中字体的最小字号,默认4号

max_font_size

指定词云中字体的最大字号,根据高度自动调节

font_step

指定词云中字体字号的步进间隔,默认为1

font_path

指定字体文件的路径,默认None

max_words

指定词云显示的最大单词数量,默认200

stop_words

指定词云的排除词列表,即不显示的单词列表

mask

指定词云形状,默认为长方形,需要引用imread()函数

background_color

指定词云图片的背景颜色,默认为黑色

# mask
from imageio import imread 

mk=imread("pic.png")
w=wordcloud.WordCloud(mask=mk)

2.4 wordcloud应用实例

import wordcloud

txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color="white")
w.generate(txt)
w.to_file("pywcloud.png")

中文需要先分词并组成空格分隔字符串

import jieba
import wordcloud

txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"

w = wordcloud.WordCloud( width=1000,\
font_path="/Library/Fonts/Heiti.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")
import jieba
import wordcloud

txt = "Nick 是上海虹桥最帅的男人,没有之一,因为他就是最帅的"

w = wordcloud.WordCloud( width=1000,\
font_path="/Library/Fonts/Heiti.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")
Building prefix dict from the default dictionary ...
Loading model from cache /var/folders/mh/krrg51957cqgl0rhgnwyylvc0000gn/T/jieba.cache
Loading model cost 1.047 seconds.
Prefix dict has been built succesfully.





<wordcloud.wordcloud.WordCloud at 0x1150979e8>

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • python词云生成-wordcloud库

    全文转载于'https://www.cnblogs.com/nickchen121/p/11208274.html#autoid-0-0-0'

    小小咸鱼YwY
  • pandas模块(很详细归类),pd.concat(后续补充)

    https://pandas.pydata.org/pandas-docs/stable/?v=20190307135750

    小小咸鱼YwY
  • APP脱壳方法三

    小小咸鱼YwY
  • Shell脚本编写思路和实例讲解

    1.理清思路:在我们想实现一个功能需要写脚本的时候是切忌不要想到就写,避免需要什么功能就先写个什么命令再去完善,这种写法常常会出现在结构上很难调整的问题。在我们...

    HACK学习
  • Python-科学计算-pandas-08-列字符串操作1

    系统:Windows 7 语言版本:Anaconda3-4.3.0.1-Windows-x86_64 编辑器:pycharm-community-2016.3....

    zishendianxia
  • mtcnn算法网络结构简介

    由于各种姿势,照明和遮挡,在不受限制的环境中进行人脸检测和对齐具有挑战性。 最近的研究表明,深度学习方法可以在这两项任务上取得令人印象深刻的性能。 在本文中,我...

    算法发
  • POJ 3273 | Monthly Expense 农场的窘境(经典二分)

    Farmer John is an astounding accounting wizard and has realized he might run out...

    ACM算法日常
  • 归一化vs标准化,哪个更好

    众所周知,特征工程是将原始数据转换为数据集的过程。有各种可用的功能工程技术。两种最广泛使用且最容易混淆的特征工程技术是:

    deephub
  • 不可错过的电商系统干货

    电商作为互联网的常青业务,已经渗透到我们生活日常方方面面。随着市场发展,以及我们的个性化需求,衍化出很多玩法。虽然业务规则上略有差异,但底层技术都是相通的。无非...

    用户7676729
  • 极客DIY:打造属于自己的无线移动渗透测试箱

    本文中介绍的工具、技术带有一定的攻击性,请合理合法使用。 ? 你想不想拥有一款属于自己的移动无线渗透测试箱,如果你感兴趣,下面介绍的设备将会对你很有帮助。这...

    FB客服

扫码关注云+社区

领取腾讯云代金券