好指标与坏指标

使用Power BI做数据分析的核心是实现度量。下层基础决定上层建筑,写出一个好的度量值的前提是有好的指标设计。什么样的指标才是好指标呢?

Specific 明确性

电影院的数据分析经常会使用到上座率,即一部影片获得观众人次的多少 / 提供的总座位数,它是评价电影优劣的好指标,但对于电影院自身的运营并不会有明确的帮助,因为上座率的高低很大程度取决于一部电影的火热,而这不是电影院自己可以改善的事。

前几天看到一则新闻,一般影厅里选择第一排座位的观众较少,北京一家电影院为了改善这种情况,把第一排座椅做了特殊改造,真皮沙发、电动调节、可以躺着看电影并赠送爆米花饮料,于是第一排的上座率大幅提高。

换个角度来思考,明确想要回答和解决的问题,同一类公式瞬间可以变成指导行动的指标。

Measurable 可度量

上座率的逻辑其实可以应用在很多地方,比如大学里课程的出勤率。受欢迎的老师场场爆棚,乏味的课程门可罗雀。如果可以把这个度量落实下去,那一定是让老师们殚精竭虑的指标,也必定带来教学质量的改善。

但如何能够公平地衡量可能存在一些操作上的困难,比如出勤人数的计算是通过老师本人点名进行还是有独立的人脸识别设备做监控;学生是自发参加课程还是受学校考勤制度的约束;课程的时间安排对出勤率有多大的影响;如果有学生签到后中途离开,又怎样去确认...

如果无法实现公平的度量,再好的指标也是个理想状态。比如颜值,你怎样把它数字化呢?

Attainable 可实现性

电影院的上座率最高值是100%,考虑电影的票价、影厅座位数以及每天能够运营的电影场次,能够实现的收入必然存在上限。如果定个超范围的目标,那只能是再造一家影院了。

同理,成绩分数也是个有上限的指标,想起来小时候立下豪言壮志上清华北大,随着高考的倒计时,发现距离是渐行渐远,一个大目标就这样一步步妥协成切合实际的志愿填报。分数带给了无数学生梦想、幻想以及挫折感。

你设计的指标影响力有多大呢?

Reliable 可靠性

2011年-2014年因所在公司对当地GDP有举足轻重的影响,我曾代表公司成为了统计局的常客,切实体会到了“增长黑客”般的“统计教育”。感谢当年老板给我讲了个“不以GDP论英雄”的国家基调,并督促实事求是的原则。当我回首那份工作任务,做正确的事,其意义远大于工作本身。

2017年初,辽宁政府工作报告中首次对外确认:“辽宁省所辖市、县财政普遍存在数据造假行为,且呈现持续时间长,涉及面广、手段多样等特点。虚增金额和比例从2011年至2014年,呈逐年上升趋势。”

如上图所示,2016年全国GDP增速6.7%,低于平均值的只有辽宁、山东和黑龙江,其余28个省市自治区全部高于全国,水分不言而喻。2018年1月初,内蒙古、天津相继承认GDP造假,大幅下调历史数据。

纠错也是一种进步,你的指标是否经得起时间的考验?

Time-Based 时间

关于时间需要结合Power BI来讲了。在时间智能函数的学习中我把公式分成了两类,时间段和时间点。

这是一个很重要的问题,你设计的指标是评价一段时间的发生值,还是某一时点值?

前天出版社的编辑老师告诉我新书的第一批库存快卖光了,要开始加印。让我在关注销售册数的同时又加入了一个库存量指标。显然销售册数是时间段指标,库存量是时间点指标。

对于时间段指标通过日期表可以得到年、季度、月、周的对应值,并且利用时间智能函数可以轻松求得环比、同比等等,这并不难。

让很多人感到头痛的是时间点指标,其实大多数的问题可能在于你没有历史时点数据,而只有时间段的历史发生数据。

比如你想要知道每日的银行存款余额是多少,如果系统中有每日的记录自然计算起来很简单;但如果没有,我们也可以从历史的发生数据中做推导。基本的思路就是把指标拆解成流入流出,再分别求累计至今的发生值。

这个原理适用于大部分类似的时间点指标:

银行存款=初始余额+累计现金流入-累计现金流出

库存量=初始库存量+累计入库数量-累计出库数量

在职人数=初始人数+累计入职人数-累计离职人数

Power BI 的确提供了一个很好的解决方案,但从根本上讲,公式的设计不是工具能够解决的问题,而是基于使用者对指标的理解。

以上是目标管理的SMART原则,也可以作为判断指标好坏的参考。简而言之,能够解决问题的就是好指标

本文分享自微信公众号 - PowerBI大师(PowerBIMaster),作者:马世权

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-01-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • PowerBI公式-时间智能

    时间智能是一个系列时间函数的打包来解决时间对比的问题。我们在业务的数据分析中经常有诸如此类的问题,与去年同期比较怎么样?与上个月比如何?截至到某一日我们今年完成...

    公众号PowerBI大师
  • 排名 RankX和TopN

    又是一对好用的函数,特别是对于营销分析,做业绩排名,当然对于学生考试成绩、运动比赛成绩的排名也不在话下,应用场景就根据自己需要来发掘吧,授之以鱼不如授之以渔,我...

    公众号PowerBI大师
  • PowerBI指标动态化二三事

    随着学习PBI的深入 ,各种操作技能也都逐渐被掌握,那么指标的动态化是必然会去尝试的一件事情。

    公众号PowerBI大师
  • 浅谈利用元数管理平台自动化管理指标的方法

    目录: 一、企业指标管理的三个核心问题 二、解决指标管理的问题,需要从三个方面入手 三、通过元数据管理平台,实现指标管理在技术上的自动化 四、总结 指标直接反映...

    yuanyi928
  • 请拿数据说质量

    前面我们从被动角度发现质量改进点,今天我们聊聊主动发现,即如何建立一个产品质量度量指标?如何监控?

    旺仔小小鹿
  • 智能分析最佳实践——指标逻辑树

    背景 所有业务都会面对“为什么涨、为什么降、原因是什么?”这种简单粗暴又不易定位的业务问题。为了找出数据发生异动的原因,业务人员会通过使用多维查询、dashbo...

    美团技术团队
  • Android图片加载库内存缓存策略分析

    Oceanlong
  • 中国人工智能城市十五强发布:北京稳居榜首,杭州超越深圳!

    为客观评价各城市人工智能发展水平和未来潜力,赛迪顾问建立了人工智能城市发展评价体系,共包括三级指标,数据来自公开统计数据与专家打分。其中,包含政策环境、科研能力...

    钱塘数据
  • 腾讯云服务器购买了不会搭建环境怎么办?官方教程+镜像市场助你轻松上云

    现在有很多传统虚拟主机用户和物理服务器用户都在慢慢的将网站迁移至腾讯云服务器,但是有很多用户不懂怎么给腾讯云服务器安装网站程序运行所必要的环境,同时又没有相应的...

    tengxunyun8点com活动整理
  • 【爬虫军火库】如何优雅地复制请求头

    『回』字有四种写法。 ——鲁迅 复制请求头可以说是写爬虫代码的一个日常操作了,虽然不是所有网站都会检校请求头中的字段,但是如果遇到爬虫无法正常返回网页内容时,我...

    不二小段

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动