Python wordcloud库学习小结

wordcloud库常规方法

w = wordcloud.WordCloud()

方法

描述

例子

w.generate(txt)

向wordcloud对象w中加载文本txt

>>>w.generate("Python and WordCloud")

w.to_file(filename)

将词云输出为图像文件,.png或.jpg格式

>>>w.to_file("outfile.png")

应用实例:

import wordcloud
w = wordcloud.WordCloud() #配置对象参数
w.generate("wordcloud by Python") #加载词云文本
w.to_file("pywordcloud.png") #输出词云文件
  1. 分隔: 以空格分隔单词
  2. 统计: 单词出现次数并过滤
  3. 字体: 根据统计配置字号
  4. 布局: 颜色环境尺寸

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数

描述

例子

width

指定词云对象生成图片的宽度,默认400像素

>>>w=wordcloud.WordCloud(width=600)

height

指定词云对象生成图片的高度,默认200像素

>>>w=wordcloud.WordCloud(height=400)

min_font_size

指定词云中字体的最小字号,默认4号

>>>w=wordcloud.WordCloud(min_font_size=10)

max_font_size

指定词云中字体的最大字号,根据高度自动调节

>>>w=wordcloud.WordCloud(max_font_size=20)

font_step

指定词云中字体字号的步进间隔,默认为1

>>>w=wordcloud.WordCloud(font_step=2)

font_path

指定文件字体的路径,默认None

>>>w=wordcloud.WordCloud(font_path="msyh.ttc")

max_words

指定词云显示的最大单词数量,默认200

>>>w=wordcloud.WordCloud(font_step=2)

stop_words

指定词云的排除词列表,即不显示的单词列表

>>>w=wordcloud.WordCloud(stop_words={"Python"})

mask

指定词云形状,默认为长方形,需要应用imread()函数

>>>from scipy.misc import imread>>>mk=imread("pic.png")>>>w=wordcloud.WordCloud(mask=mk)

background_color

指定词云图片的背景颜色,默认为黑色

>>>w=wordcloud.WordCloud(background_color="white")

应用实例:

  1. 英文(以空格分隔单词)
import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color = "white")
w.generate(txt)
w.to_file("pywcloud.png")
  1. 中文(中文需要先分词并组成空格分隔字符串)
import jieba
import wordcloud
txt = "程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。 "
w = wordcloud.WordCloud( width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏hbbliyong

WPF Trigger for IsSelected in a DataTemplate for ListBox items

<DataTemplate DataType="{x:Type vm:HeaderSlugViewModel}"> <vw:HeaderSlug...

4054
来自专栏张善友的专栏

LINQ via C# 系列文章

LINQ via C# Recently I am giving a series of talk on LINQ. the name “LINQ via C...

2605
来自专栏菩提树下的杨过

Flash/Flex学习笔记(23):运动学原理

先写一个公用的小球类Ball: package{ import flash.display.Sprite; //小球 类 public class B...

25210
来自专栏pangguoming

Spring Boot集成JasperReports生成PDF文档

由于工作需要,要实现后端根据模板动态填充数据生成PDF文档,通过技术选型,使用Ireport5.6来设计模板,结合JasperReports5.6工具库来调用渲...

1.2K7
来自专栏杨龙飞前端

scrollto 到指定位置

2494
来自专栏一个会写诗的程序员的博客

Spring Reactor 项目核心库Reactor Core

Non-Blocking Reactive Streams Foundation for the JVM both implementing a Reactiv...

2102
来自专栏我和未来有约会

Silverlight第三方控件专题

这里我收集整理了目前网上silverlight第三方控件的专题,若果有所遗漏请告知我一下。 名称 简介 截图 telerik 商 RadC...

3955
来自专栏张善友的专栏

Mix 10 上的asp.net mvc 2的相关Session

Beyond File | New Company: From Cheesy Sample to Social Platform Scott Hansel...

2517
来自专栏魂祭心

原 canvas绘制clock

4004
来自专栏一个爱瞎折腾的程序猿

sqlserver使用存储过程跟踪SQL

USE [master] GO /****** Object: StoredProcedure [dbo].[sp_perfworkload_trace_s...

1990

扫码关注云+社区