Python入门之生成海贼王云图

本教程适合于有一定编程经验的同学,使用Python3,在Jupyter进行调试开发。

涉及的Python基础包括:

  • 变量和函数的定义和使用
  • 列表和字典等数据结构的使用
  • 条件和循环语句,if、for等
  • 模块的导入和使用,import语法

需要安装以下依赖库:

  • jupyter - 交互式笔记本
  • matplotlib - Python2D绘图库
  • jieba - Python中文分词组件
  • pillow - Python图像处理库
  • wordcloud - Python词云库

目标

从海贼王的歌词中提取出关键词,然后生成乔巴形状的云图,最后效果如下:

1.准备数据

a. 事先我已准备好15首海贼王的歌词文本文件, 放在本地的data目录下。

In [1]:

b. 原始数据准备OK后,先实现一个函数循环读取data目录下的所有文件

In [2]:

In [3]:

c. 使用jieba提取出关键词

In [4]:

2.使用wordcloud生成云图

这里还需要一张底图用于生成云图,这里使用海贼王中乔巴的图片

In [6]:

作者:101python 来源:https://ask.hellobi.com/blog/101python/8225

原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2017-06-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏为数不多的Android技巧

ASCII Art:使用纯文本流程图

我们使用纯文本写代码,有了Markdown又可以使用纯文本写文档,那么对于更直观的信息表达方式——图片,能不能使用纯文本描述呢?

2342
来自专栏惨绿少年

Shell编程基础篇-下

1.1 条件表达式 1.1.1 文件判断 常用文件测试操作符 常用文件测试操作符 说明 -d文件,d的全拼为directory 文...

1870
来自专栏IT开发技术与工作效率

Excel函数学习重点指南(官网)

1113
来自专栏Ceph对象存储方案

简谈RGW的index shard计算

在RGW里面每个存储到rados的Object都需要先计算出对应元数据存储的shard number,之后再将元数据信息更新到shard number对应的Ob...

2636
来自专栏程序员的诗和远方

30分钟QUnit入门教程

30分钟让你了解Javascript单元测试框架QUnit,并能在程序中使用。 QUnit是什么 QUnit是一个强大,易用的JavaScript单元测试框架,...

4559
来自专栏小文博客

C语言迷宫代码分享

2093
来自专栏java系列博客

UML——序列图

2064
来自专栏java系列博客

深入理解Java内存模型(七)——总结

1633
来自专栏奇点大数据

【干货】Pytorch中的DataLoader的相关记录

DataLoader简单介绍 DataLoader是Pytorch中用来处理模型输入数据的一个工具类。通过使用DataLoader,我们可以方便地对数据进行...

1.3K6
来自专栏小樱的经验随笔

Gym 100952A&&2015 HIAST Collegiate Programming Contest A. Who is the winner?【字符串,暴力】

A. Who is the winner? time limit per test:1 second memory limit per test:64 mega...

2766

扫码关注云+社区