2.1 Power Query 概述

数字搬运工

记得是一个加班的夜晚,公司财务部里依然灯火通明,几个小伙伴们在为赶一版预算忙碌着。一位同事的长叹道出了财务工作的精髓,“我们不生产数字,我们是数字的搬运工”。

也许你恰好也是在财务分析岗位或者从事数据分析类的工作,试想一下,你有多少时间在做真正的分析?又有多少时间在处理那些繁琐的基础数据?我们是数字的玩家还是数字的奴隶?

Power Query在Power BI的三个模块中是投资回报率最高的一个,花最少的时间学习但收到最好的效果,因为它的操作非常容易上手,但直击数字工作的痛点,解决那些重复的、繁琐的、低附加值的工作。

1

财务分析师的一天

我发现一个很有意思得事情,很多对Excel软件精通的人并非出身于IT类,而是财务,因为他们每天都要跟表格打交道。然而做财务分析师也许并不是想象那样的光鲜,就好像下图在各种人眼里对财务分析师的看法。

在我有限的财务职业生涯和遇到的大多数从事财务分析的人中,他们无一例外地会做下面的数据处理工作,只不过在花费的时间上因人而异:

我们可以看到的是有80%以上的工作(1,2,3,4,5)是在获取、清洗、关联和计算数据,这些都是相对低附加值的工作,真正高附加值的分析部分(6) 连20%都不到。我们经常讲要最大化发挥财务分析师的价值,然而没有高效率的流程,即使你有非常卓越的分析能力,可谁又有时间去做最大化发挥价值呢?

所以财务人员的当务之急就是解决那80%的工作效率问题。而且这种现象不仅仅存在于财务,它是很多企业中从事数据分析工作的通病。

2

工具评测

其实利用工具来解决分析效率问题不是一个新话题,在Power Query之前,常见的方法有三种:Excel公式、VBA编程、SQL数据库。我们来分别做个剖析。

1)Excel公式:这个是大部分分析者依赖的首选方法,使用比如Vlookup, Index, Match, Offset等等大量的公式,虽然它是首选,但由于公式的复杂性,技能的水平需要大量时间和实践经验来磨练。

2)VBA宏语言, 很多Excel的高级玩家喜欢探索宏语言来创建程序做数据处理,不可否认它的强大,但这只限于高级玩家,掌握这门技术的门槛实在有点高。即便你会用简单的宏录制功能,但它需要百分之百一样的步骤,一点小小的变化就需要重新更改录制。

3)SQL数据库,这是另一门强大的计算机语言,特别是在利用它来查询、排序、分组和转化数据方面非常的有用。然而现实是,这也是一门面向高级玩家的语言,往往是从事数据库职业人士的专有工具。

4)那么PowerQuery又是什么?不同于上面的三个方法,它既不是公式也不是一门语言,它是一个工具插件,这个插件把我们常用的提取、清洗、加载数据等常用功能制作成了傻瓜化的界面,让不懂高级计算机语言的人也能够非常快速地完成数据处理工作。我来做进一步评析:

A.在哪里可以找到?Excel2016版本已经集成了PowerQuery的插件功能,在<数据选项卡中>就可以找到这个模块,而在Excel2010和2013版本需要单独安装插件,插件的免费下载大家可以百度"Power Query"很容易搜到。当然PowerBI软件集成了PowerQuery的功能。

在这里,我想做个小停顿来建议大家同时用Excel和PowerBI软件做体验学习,原因是对于我们大多数习惯使用Excel的人,我们已经养成了使用网格表的习惯。PowerBI中的Power Query虽然在使用方法上和Excel是一模一样的,但它的设计更倾向于用户在对数据的结构有了完全掌握的前提下进行工作,而Excel单元格式的编辑模式更方便用户对未知数据的探索。

所以我们应该把Excel和PowerBI结合起来使用,取长补短。但这并不意味着你必须花更多的时间学习两款软件,无论你用哪个版本掌握了PowerQuery,你的知识水平都是一样的。在微软的2016年度峰会上,有一个讲座名为 "Excel + PowerBI = Better Together" 同样微软官方也是倡导共用的理念。

B.下面的两张图源于《M is Data Monkey》这本书, 他们很好地说明了Power Query可谓神器,是个低付出,高回报的工具。

C. Power Query是依托于Excel而独立模块化的知识体系,它的影响力和受众人群远高于其他三个我们所列举的工具。

3

小结

在本文的开头,“我们不生产数字,我们是数字的搬运工”道出了很多数据工作者的心声。Power Query的出现就好像一台智能机器,把我们从搬运工的苦力工作中解放了出来,让机器来取代人力。在计算机不断改变人类工作和生活的今天,让我们拥抱这个变革,利用Power Query, 来达到20%的时间做数据,80%的时间做分析的目标。如果你已经看到了这里,恭喜你距离这个目标已经不远了。

感谢您关注公众号PowerBI大师

本文分享自微信公众号 - PowerBI大师(PowerBIMaster)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-05-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏休辞醉倒

mysql通过source恢复大表小记

最近迁移一个数据库,500多张表大概600多万条数据,通过navicat导出的数据,再通过source命令导入到mysql8.0

11930
来自专栏休辞醉倒

关于nohup在连接断开后进程退出的小记

工作中遇到了迁移数据库的操作,sql文件30G,当然不能搞到本地用Navicat导入,要通过命令导入。

8430
来自专栏微卡智享

Android Sqlite里数据查询性能优化对比

我们在做Android开发时常会用到Sqlite数据库做为本地的缓存库,针对Sqlite数据库的性能优化网上也有不少的文章。

14020
来自专栏烟草的香味

23种设计模式之备忘录模式

定义: 在不破坏封装性的前提下, 捕获一个对象的内部状态, 并在该对象之外保存这个状态. 这样以后就可将该对象回复到原先保存的状态

11660
来自专栏烟草的香味

23种设计模式之桥梁模式

桥梁模式是一个很简单的模式, 它只是使用了类间的聚合关系、继承、覆写等常用功能, 但是它却提供了一个非常清晰、稳定的架构.

6420
来自专栏休辞醉倒

mysql语句执行顺序

from->join->on->where->group by->avg\sum...->having->select->distinct->order by

8220
来自专栏休辞醉倒

crontab定时任务中提示command not found解决方案

写了个脚本定时从MySQL中提取数据,但是crontab发邮件提示mysql command not found

16040
来自专栏休辞醉倒

shell提取MySQL结果到变量中

host=`mysql -u$user -p$pass -D $db -e "select host from user;"` or host=$(...

16120
来自专栏休辞醉倒

MySQL存储引擎小记

9820
来自专栏烟草的香味

设计模式之黑板模式

黑板模式是观察者模式的一个扩展,知名度并不高,但使用的范围却非常广. 其意图为: 允许消息的读写同时进行, 广泛的交互消息.

6120

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励