前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pyecharts极简入门教程

pyecharts极简入门教程

作者头像
luanhz
发布2020-08-04 14:24:29
1.4K0
发布2020-08-04 14:24:29
举报
文章被收录于专栏:小数志小数志

导读

数据可视化是整个数据分析流程中的关键环节,甚至有着一图定成败的关键性地位。前期,陆续推出了matplotlibseaborn详细入门教程,对于常规的数据探索和基本图表制作是足够的,但二者的一个共同短板是图表不可交互,缺少那种活灵灵的样子!当Python遇到百度echarts,pyecharts便应用而生,最重要的是支持交互、且可移植到PPT报告中,这效果简直是再理想不过的。

pyecharts4步输出图表

pyecharts可视化图表制作相比matplotlib和seaborn而言,其实是更为简单的,因为它几乎所有图表都遵循了"同一套路",没有过多复杂参数、无需细节技巧牵绊。但同时,它又有二者所不具备的一些优点:

  • 简洁的API设计,支持链式调用
  • 多种主题可选,丰富的参数设置
  • 可交互的可视化效果,且可移植到PPT中
  • 提供了常用图表类型接口,包括matplotlib和seaborn不支持的一些图表:例如词云、可视化地图等

基于以上这些原因,pyecharts是个人在可视化输出过程中应用仅次于matplotlib和seaborn的第三大可视化库。当然,各可视化库都有其各自擅长场景,本无优劣高下之分。本文旨在介绍pyecharts图表制作中最基础的套路,掌握这些基本操作、再辅以官网详尽教程,基本上常规图表都是可以的!

个人认为学习pyecharts无需熟记各类参数,而仅需掌握通用原理和流程即可,具体操作可待实际应用时查阅相应源码和官网教程。所以本文给出的是一份极简教程,而不会逐一介绍面面俱到。

1. 设置通用项

与seaborn类似,pyecharts也提供了多个通用设置项,包括图表主题、生成文件类型等,一般保持默认即可得到较为不错的图表,但希望尝试新的风格时则可调用主题接口。主题设置作为具体图表的一个初始化参数进行设置,例如:

代码语言:javascript
复制
from pyecharts.charts import Bar
from pyecharts import options as opts
from pyecharts.globals import ThemeTyp

#主题选择作为图表初始化参数进行设置
bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION))

另一个通用项设置中较为实用的是notebook选项,这在使用jupyter notebook或者jupyter lab中是必不可少的一项,默认为jupyter notebook方式。在jupyter lab中加入以下两行通用设置后,即可调用render_notebook()在cell中查看图表结果:

代码语言:javascript
复制
from pyecharts.globals import CurrentConfig, NotebookType  
CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LAB

2. 选择图表

pyecharts提供了几乎常用的所有图表类型,除了柱状图、折线图、饼图、散点图这4大通用可视化图表外,还包括词云、地图、箱线图、K线图等专用图表,另外,pyecharts也提供了常用图表的3D形式,对于多类型图表组合则提供了Page、Grid、Tab和Timeline4种形式,可将其看做是单图表的容器,例如Timeline的一个简单案例:原来用pyecharts画个时间线图这么简单

在确定图表类型(图表实例化)后则是添加数据。pyecharts在迭代1.0版本后,一个最大的特色就是支持链式调用,所以添加数据也是极其方便的。

这里有必要解释下何为链式调用。可能很多pyecharts初学者在查阅官方文档时会看到如下写法(这里选用官网上直方图的一个demo):

代码语言:javascript
复制
from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker

c = (
    Bar()
    .add_xaxis(Faker.choose())
    .add_yaxis("商家A", Faker.values())
    .add_yaxis("商家B", Faker.values())
    .set_global_opts(
        title_opts=opts.TitleOpts(title="Bar-Brush示例", subtitle="我是副标题"),
        brush_opts=opts.BrushOpts(),
    )
    .render("bar_with_brush.html")
)

这个链式调用将图表的实例化、添加数据、设置参数、输出结果放在了一句代码执行,对新人更为不友好的是将这些代码放在了一组圆括号之中,搞得云里雾里(至少在我初学时是这样的),实际上理解这段代码需要掌握两个知识点:

  • Python中可将单个表达式或单个语句放在一组圆括号内实现跨行书写,例如下面例子中,写法1合法,而写法2报错,区别仅在于有无圆括号
  • pyecharts将图表类的每个方法都返回了self本身,这样每个方法的返回值都是该图表实例,进而实现链式调用

实际上,这种链式调用在机器学习库中是非常常见的一种设计,学过sklearn的读者应该都了解一行代码实现*.fit().score()的优雅写法。

理解了链式调用背后的原理,则很容易弄懂上面的代码:实际上其等价于如下形式:

代码语言:javascript
复制
from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker

c = Bar()  # 1.实例化
c.add_xaxis(Faker.choose())  # 2.添加x轴标签
c.add_yaxis("商家A", Faker.values())  # 3.添加y轴数据A
c.add_yaxis("商家B", Faker.values())  # 4.添加y轴数据B
c.set_global_opts(
        title_opts=opts.TitleOpts(title="Bar-Brush示例", subtitle="我是副标题"),
        brush_opts=opts.BrushOpts(),
    )  # 5.添加通用设置项
c.render("bar_with_brush.html")  # 6.输出html图表结果

6句代码调用了6个接口,分别完成:

  • 实例化一个直方图对象
  • 添加x轴数据
  • 添加y轴数据A
  • 添加y轴数据B
  • 设置通用参数,包括标题、区域圈选等
  • 输出html图表文件

掌握了这一基本套路,基本上就理解了pyecharts输出可视化图表的通用方法。

3. 设置图表参数

pyecharts提供了3类图表参数设置类型,分别是图表设置项、通用设置项、系列设置项,其中:

  • 图表设置项是具体到某个特定图表对象的设置参数,各图表可选设置参数不同
  • 通用设置项最为常用,例如图表初始化设置就属于通用设置中的一项,另外包括标题、坐标轴、可视化缩放条等都属于通用设置项
  • 系列设置项则可以用于设置图表的某些具体参数,例如label可设置数据标签是否显示以及位置等

对应相应设置项,pyecharts分别提供了设置接口:

代码语言:javascript
复制
set_global_opts()
set_series_opts()

4. 输出结果

最后,pyecharts提供了将可视化图表输出的方式,实际较为常用的有两种:

  • render()输出到网页中
  • render_notebook()在jupyter中即时显示,具体区分notebook和jupyter lab两种,可在全局参数中设置

此外,pyecharts还提供了其他多种图表输出形式,例如make_snapshot()可直接输出为png图片。但如此一来则失去交互能力。

pyecharts作为百度出echarts可视化库与Python的结合体,其在制作可交互图表方面具有很好的效果,且更重要的是相较于其他可视化库学起来更易上手。如果说有什么明显缺点的话,那么可能是其支持数据类型较为传统:即仅支持Python基础的数据结构,对数据科学库的数据类型(如ndarray和dataframe)则不适用,这是由其定位所决定的。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-08-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小数志 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
容器服务
腾讯云容器服务(Tencent Kubernetes Engine, TKE)基于原生 kubernetes 提供以容器为核心的、高度可扩展的高性能容器管理服务,覆盖 Serverless、边缘计算、分布式云等多种业务部署场景,业内首创单个集群兼容多种计算节点的容器资源管理模式。同时产品作为云原生 Finops 领先布道者,主导开源项目Crane,全面助力客户实现资源优化、成本控制。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档