专栏首页小数志pyecharts极简入门教程

pyecharts极简入门教程

导读

数据可视化是整个数据分析流程中的关键环节,甚至有着一图定成败的关键性地位。前期,陆续推出了matplotlibseaborn详细入门教程,对于常规的数据探索和基本图表制作是足够的,但二者的一个共同短板是图表不可交互,缺少那种活灵灵的样子!当Python遇到百度echarts,pyecharts便应用而生,最重要的是支持交互、且可移植到PPT报告中,这效果简直是再理想不过的。

pyecharts4步输出图表

pyecharts可视化图表制作相比matplotlib和seaborn而言,其实是更为简单的,因为它几乎所有图表都遵循了"同一套路",没有过多复杂参数、无需细节技巧牵绊。但同时,它又有二者所不具备的一些优点:

  • 简洁的API设计,支持链式调用
  • 多种主题可选,丰富的参数设置
  • 可交互的可视化效果,且可移植到PPT中
  • 提供了常用图表类型接口,包括matplotlib和seaborn不支持的一些图表:例如词云、可视化地图等

基于以上这些原因,pyecharts是个人在可视化输出过程中应用仅次于matplotlib和seaborn的第三大可视化库。当然,各可视化库都有其各自擅长场景,本无优劣高下之分。本文旨在介绍pyecharts图表制作中最基础的套路,掌握这些基本操作、再辅以官网详尽教程,基本上常规图表都是可以的!

个人认为学习pyecharts无需熟记各类参数,而仅需掌握通用原理和流程即可,具体操作可待实际应用时查阅相应源码和官网教程。所以本文给出的是一份极简教程,而不会逐一介绍面面俱到。

1. 设置通用项

与seaborn类似,pyecharts也提供了多个通用设置项,包括图表主题、生成文件类型等,一般保持默认即可得到较为不错的图表,但希望尝试新的风格时则可调用主题接口。主题设置作为具体图表的一个初始化参数进行设置,例如:

from pyecharts.charts import Bar
from pyecharts import options as opts
from pyecharts.globals import ThemeTyp

#主题选择作为图表初始化参数进行设置
bar = Bar(init_opts=opts.InitOpts(theme=ThemeType.PURPLE_PASSION))

另一个通用项设置中较为实用的是notebook选项,这在使用jupyter notebook或者jupyter lab中是必不可少的一项,默认为jupyter notebook方式。在jupyter lab中加入以下两行通用设置后,即可调用render_notebook()在cell中查看图表结果:

from pyecharts.globals import CurrentConfig, NotebookType  
CurrentConfig.NOTEBOOK_TYPE = NotebookType.JUPYTER_LAB

2. 选择图表

pyecharts提供了几乎常用的所有图表类型,除了柱状图、折线图、饼图、散点图这4大通用可视化图表外,还包括词云、地图、箱线图、K线图等专用图表,另外,pyecharts也提供了常用图表的3D形式,对于多类型图表组合则提供了Page、Grid、Tab和Timeline4种形式,可将其看做是单图表的容器,例如Timeline的一个简单案例:原来用pyecharts画个时间线图这么简单

在确定图表类型(图表实例化)后则是添加数据。pyecharts在迭代1.0版本后,一个最大的特色就是支持链式调用,所以添加数据也是极其方便的。

这里有必要解释下何为链式调用。可能很多pyecharts初学者在查阅官方文档时会看到如下写法(这里选用官网上直方图的一个demo):

from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker

c = (
    Bar()
    .add_xaxis(Faker.choose())
    .add_yaxis("商家A", Faker.values())
    .add_yaxis("商家B", Faker.values())
    .set_global_opts(
        title_opts=opts.TitleOpts(title="Bar-Brush示例", subtitle="我是副标题"),
        brush_opts=opts.BrushOpts(),
    )
    .render("bar_with_brush.html")
)

这个链式调用将图表的实例化、添加数据、设置参数、输出结果放在了一句代码执行,对新人更为不友好的是将这些代码放在了一组圆括号之中,搞得云里雾里(至少在我初学时是这样的),实际上理解这段代码需要掌握两个知识点:

  • Python中可将单个表达式或单个语句放在一组圆括号内实现跨行书写,例如下面例子中,写法1合法,而写法2报错,区别仅在于有无圆括号
  • pyecharts将图表类的每个方法都返回了self本身,这样每个方法的返回值都是该图表实例,进而实现链式调用

实际上,这种链式调用在机器学习库中是非常常见的一种设计,学过sklearn的读者应该都了解一行代码实现*.fit().score()的优雅写法。

理解了链式调用背后的原理,则很容易弄懂上面的代码:实际上其等价于如下形式:

from pyecharts import options as opts
from pyecharts.charts import Bar
from pyecharts.faker import Faker

c = Bar()  # 1.实例化
c.add_xaxis(Faker.choose())  # 2.添加x轴标签
c.add_yaxis("商家A", Faker.values())  # 3.添加y轴数据A
c.add_yaxis("商家B", Faker.values())  # 4.添加y轴数据B
c.set_global_opts(
        title_opts=opts.TitleOpts(title="Bar-Brush示例", subtitle="我是副标题"),
        brush_opts=opts.BrushOpts(),
    )  # 5.添加通用设置项
c.render("bar_with_brush.html")  # 6.输出html图表结果

6句代码调用了6个接口,分别完成:

  • 实例化一个直方图对象
  • 添加x轴数据
  • 添加y轴数据A
  • 添加y轴数据B
  • 设置通用参数,包括标题、区域圈选等
  • 输出html图表文件

掌握了这一基本套路,基本上就理解了pyecharts输出可视化图表的通用方法。

3. 设置图表参数

pyecharts提供了3类图表参数设置类型,分别是图表设置项、通用设置项、系列设置项,其中:

  • 图表设置项是具体到某个特定图表对象的设置参数,各图表可选设置参数不同
  • 通用设置项最为常用,例如图表初始化设置就属于通用设置中的一项,另外包括标题、坐标轴、可视化缩放条等都属于通用设置项
  • 系列设置项则可以用于设置图表的某些具体参数,例如label可设置数据标签是否显示以及位置等

对应相应设置项,pyecharts分别提供了设置接口:

set_global_opts()
set_series_opts()

4. 输出结果

最后,pyecharts提供了将可视化图表输出的方式,实际较为常用的有两种:

  • render()输出到网页中
  • render_notebook()在jupyter中即时显示,具体区分notebook和jupyter lab两种,可在全局参数中设置

此外,pyecharts还提供了其他多种图表输出形式,例如make_snapshot()可直接输出为png图片。但如此一来则失去交互能力。

pyecharts作为百度出echarts可视化库与Python的结合体,其在制作可交互图表方面具有很好的效果,且更重要的是相较于其他可视化库学起来更易上手。如果说有什么明显缺点的话,那么可能是其支持数据类型较为传统:即仅支持Python基础的数据结构,对数据科学库的数据类型(如ndarray和dataframe)则不适用,这是由其定位所决定的。

本文分享自微信公众号 - 小数志(Datazhi),作者:luanhz

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-08-01

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 地图可视化不只是pyecharts.map

    导读:地图可视化是一种非常直观的数据分析结果展现形式,python有很多可视化库可以实现,pyecharts就是很多python爱好者喜爱的实现地图可视化方法之...

    luanhz
  • 10张图带你快速了解Python岗位招聘需求

    Python语言以其简单易学、连接性强和适用范围广等优势成文当前最火热的编程语言之一,并长期盘踞编程语言排行榜前三,相应的岗位需求也是水涨船高。人生苦短,我用P...

    luanhz
  • 一文弄懂Python上下文管理器和with用法

    导读:pythoners都知道有个关键字叫"with",它可以实现使用某些"临时"声明的对象,而之后"什么也不用管",这个用法在python中叫上下文管理器。本...

    luanhz
  • 普利姆(prim)算法和克鲁斯卡尔(kruskal)算法

    连通网的最小生成树算法: 1.普里姆算法——”加点法”。 假设N=(V,{E})是连通网,TE为最小生成树的边集合。 (1)初始U={u0}(...

    Steve Wang
  • 决策树ID3算法

    决策树 (Decision Tree)是在已知各种情况发生概率的基础上,通过构成 决策树 来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策...

    机器学习和大数据挖掘
  • SpringBoot中 使用[info]日志级别打印mybatis sql语句

    在 Spring Cloud 项目中,生产环境需要打印mybatis的sql语句日志,但是mybatis打印的sql的默认日志级别是[debug],如果生产环境...

    夹胡碰
  • 天池-半导体质量预测

    1) 提取特征后,xgboost的mse为0.0325341683406 2) 单个随机森林的5折交叉验证的平均mse为0.0288353227614 (max...

    DuncanZhou
  • SAP S/4 HANA新变化-FI数据模型

    With the installation of SAP Simple Finance, on-premise edition totals and appli...

    SAP最佳业务实践
  • BT技术是如何实现高速下载节省带宽的?

    bt具有哪些优势呢?使得bt在游戏、影音、大文件分发领域的应用越来越广泛,下面小编就来扒一扒,小编团队做大文件分发传输已经10年+了,在优化节省带宽方面,bt技...

    点量小崔
  • RabbitMQ 高级篇九 TTL设置队列或消息有效期队列及消息

    本文是《RabbitMQ精讲系列》中第十六篇:RabbitMQ消息中间件技术精讲16 高级篇九 TTL队列及消息。如果想学习RabbitMQ的朋友建议从第一篇开...

    凯哥Java

扫码关注云+社区

领取腾讯云代金券