Python入门之生成海贼王云图

本教程适合于有一定编程经验的同学,使用Python3,在Jupyter进行调试开发。

涉及的Python基础包括:

  • 变量和函数的定义和使用
  • 列表和字典等数据结构的使用
  • 条件和循环语句,if、for等
  • 模块的导入和使用,import语法

需要安装以下依赖库:

  • jupyter - 交互式笔记本
  • matplotlib - Python2D绘图库
  • jieba - Python中文分词组件
  • pillow - Python图像处理库
  • wordcloud - Python词云库

目标

从海贼王的歌词中提取出关键词,然后生成乔巴形状的云图,最后效果如下:

1.准备数据

a. 事先我已准备好15首海贼王的歌词文本文件, 放在本地的data目录下。

In [1]:

b. 原始数据准备OK后,先实现一个函数循环读取data目录下的所有文件

In [2]:

In [3]:

c. 使用jieba提取出关键词

In [4]:

2.使用wordcloud生成云图

这里还需要一张底图用于生成云图,这里使用海贼王中乔巴的图片

In [6]:

作者:101python 来源:https://ask.hellobi.com/blog/101python/8225

原文发布于微信公众号 - 马哥Linux运维(magedu-Linux)

原文发表时间:2017-06-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏惨绿少年

Shell编程基础篇-下

1.1 条件表达式 1.1.1 文件判断 常用文件测试操作符 常用文件测试操作符 说明 -d文件,d的全拼为directory 文...

20600
来自专栏吉浦迅科技

TensorFlow版本号升至1.0,正式版即将到来

2015年11月份,谷歌宣布开源了深度学习框架TensorFlow,一年之后,TensorFlow就已经成长为了GitHub上最受欢迎的深度学习框架,尽管那时候...

39290
来自专栏猿人谷

memcpy和memmove的区别

memcpy()和memmove()都是C语言中的库函数,在头文件string.h中,其原型分别如下: void *memcpy(void *dst, con...

36750
来自专栏UE4技术专场

UE4 ReplicationGraph分析

ReplicationDriverClassName="/Script/ProjectName.ClassName"

82020
来自专栏java系列博客

UML——序列图

21640
来自专栏奇点大数据

【干货】Pytorch中的DataLoader的相关记录

DataLoader简单介绍 DataLoader是Pytorch中用来处理模型输入数据的一个工具类。通过使用DataLoader,我们可以方便地对数据进行...

1.8K60
来自专栏小樱的经验随笔

Gym 100952A&&2015 HIAST Collegiate Programming Contest A. Who is the winner?【字符串,暴力】

A. Who is the winner? time limit per test:1 second memory limit per test:64 mega...

29260
来自专栏用户画像

H5 新增的input元素的类型

search类型用于搜索域,如站点搜索或Google搜索。search域显示为常规的文本域。

7730
来自专栏Aloys的开发之路

一个比较全面的java随机数据生成工具包

        最近,由于一个项目的原因需要使用一些随机数据做测试,于是写了一个随机数据生成工具,ExtraRanom。可以看成是Java官方Random类的扩...

31390
来自专栏深度学习自然语言处理

matplotlib--python的数据可视化二

11820

扫码关注云+社区

领取腾讯云代金券