Python wordcloud库学习小结

wordcloud库常规方法

w = wordcloud.WordCloud()

方法

描述

例子

w.generate(txt)

向wordcloud对象w中加载文本txt

>>>w.generate("Python and WordCloud")

w.to_file(filename)

将词云输出为图像文件,.png或.jpg格式

>>>w.to_file("outfile.png")

应用实例:

import wordcloud
w = wordcloud.WordCloud() #配置对象参数
w.generate("wordcloud by Python") #加载词云文本
w.to_file("pywordcloud.png") #输出词云文件
  1. 分隔: 以空格分隔单词
  2. 统计: 单词出现次数并过滤
  3. 字体: 根据统计配置字号
  4. 布局: 颜色环境尺寸

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数

描述

例子

width

指定词云对象生成图片的宽度,默认400像素

>>>w=wordcloud.WordCloud(width=600)

height

指定词云对象生成图片的高度,默认200像素

>>>w=wordcloud.WordCloud(height=400)

min_font_size

指定词云中字体的最小字号,默认4号

>>>w=wordcloud.WordCloud(min_font_size=10)

max_font_size

指定词云中字体的最大字号,根据高度自动调节

>>>w=wordcloud.WordCloud(max_font_size=20)

font_step

指定词云中字体字号的步进间隔,默认为1

>>>w=wordcloud.WordCloud(font_step=2)

font_path

指定文件字体的路径,默认None

>>>w=wordcloud.WordCloud(font_path="msyh.ttc")

max_words

指定词云显示的最大单词数量,默认200

>>>w=wordcloud.WordCloud(font_step=2)

stop_words

指定词云的排除词列表,即不显示的单词列表

>>>w=wordcloud.WordCloud(stop_words={"Python"})

mask

指定词云形状,默认为长方形,需要应用imread()函数

>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk)

background_color

指定词云图片的背景颜色,默认为黑色

>>>w=wordcloud.WordCloud(background_color="white")

应用实例:

  1. 英文(以空格分隔单词)
import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color = "white")
w.generate(txt)
w.to_file("pywcloud.png")
  1. 中文(中文需要先分词并组成空格分隔字符串)
import jieba
import wordcloud
txt = "程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。 "
w = wordcloud.WordCloud( width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏点滴积累

geotrellis使用(十四)导出定制的GeoTiff

Geotrellis系列文章链接地址http://www.cnblogs.com/shoufengwei/p/5619419.html 目录 前言 需求说...

2756
来自专栏码云1024

a-start寻路算法

在英雄联盟之中,当你和你的队友都苦苦修炼到十八级的时候,仍然与敌方阵营不分胜负,就在你刚买好装备已经神装的时候,你看见信息框中一条队友的消息:“大龙集合”,这个...

1132
来自专栏happyJared

用python快速分析你的微信好友

itchat基于python开发,封装了大量调取微信功能的接口,使得开发人员可以快速基于这个框架来完成一些微信操作,在这之前我们要做的就是扫码登录,实际上这相...

442
来自专栏SeanCheney的专栏

《这就是搜索引擎》爬虫部分摘抄总结

首先从互联网页面中精心选择一部分网页,以这些网页的链接地址作为种子URL,将这些种子URL放入待抓取URL队列中,爬虫从待抓取URL队列依次读取,并将URL通过...

854
来自专栏Android群英传

花式实现图片3D翻转效果

541
来自专栏大数据杂谈

非常实用的九个程序员工具网站

1314
来自专栏码云1024

游戏中的人物是如何寻路的?

1507
来自专栏枕边书

JS实现别踩白块小游戏

最近有朋友找我用JS帮忙仿做一个别踩白块的小游戏程序,但他给的源代码较麻烦,而且没有注释,理解起来很无力,我就以自己的想法自己做了这个小游戏,主要是应用JS对D...

2078
来自专栏数据小魔方

带负值的图表标签处理方法

今天跟大家分享带负值的图表标签处理方法! ▽▼▽ 在遇到某些特殊图表时,特别是一个数据系列中既有正值又有负值的情况,数据标签以及纵轴轴标签总是会相互遮挡,做出来...

3066
来自专栏Python数据科学

要成为一个专业的爬虫大佬,你还需要了解这些

本文内容参考Github:https://github.com/lorien/awesome-web-scraping/blob/master/python.m...

861

扫码关注云+社区