前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >聊一聊数据仓库的 KPI 怎么定

聊一聊数据仓库的 KPI 怎么定

作者头像
木东居士
发布2019-02-28 16:35:55
1K0
发布2019-02-28 16:35:55
举报

0x00 前言

本篇聊一聊在做数据仓库的时候该如何确定 KPI。

0x01 思考角度

首先,要明确的一点是数据最终是要服务于业务的!但是,数据仓库一般又不直接对接于业务,而更多地对接数据分析系统、用户画像系统和推荐或广告系统等。因此不容易用业务指标来衡量数据仓库的效果。

那么我们可以换一个角度,从数据仓库要解决的问题来考虑。简单地讲,数据仓库要做的是提高数据能力、提高数据分析效率、提高数据质量的。

那么,怎样既体现了服务业务,又体现了提高了整体的数据服务能力呢?这就是下面要讨论的 KPI 怎么定。

0x02 怎样定 KPI

定 KPI 在某种程度上也可以理解为工作的评价标准。对于数据建设来讲,我们可以从工作内容是否可量化的角度来考虑。

个人认为真正价值最高的是那部分不可量化或者不容易量化的工作内容。这些工作可以是:一、数据仓库整体的设计(比如主题设计、通用维度的设计、数据分层的设计);二、数据规范的设计(比如说表和字段命名规范、Sql 编写规范)。

对于这部分内容,居士建议可以通过写文档的形式体现,最终统计出这些工作带来的效果(KPI 之一):

  1. 比如说需要写多少和数据仓库设计相关的文档
  2. 有哪些业务相关的表将会按照你的设计来卡发
  3. 优化了多少数据分析的流程

上面的内容更多的像是品牌影响力,不容易体现具体的工作产出。我们聊一下相对容易量化的工作内容。比如说中间表对业务方的支持情况,解决了多少业务的痛点,提高了多少的数据质量等等。

具体到点的话,大致可以总结出下面的一些内容(KPI 之二):

  1. 将要解决哪些业务问题(多少业务、多少报表用了你的中间表)
  2. 将会替换多少原始表的使用频率(比如数据分析查询你的表的次数,以前都是查原始日志的)
  3. 将要解决了多少数据口径不一致,数据质量的问题(可以加上告警,统计出来提前发现了多少数据问题)

0x03 举个栗子

上面列了一些居士大致思考的一些点,在具体写 KPI 的时候,可以从中选三四条。

举个简单的栗子,仅供参考:

  1. 完成数据仓库的设计,包括主题设计、数据分层和表字段命名等内容,完成10篇以上 Wiki
  2. 完成店铺主题相关的中间表的设计和开发,满足90%的数据分析需求。
  3. 完成基本的数据监控功能,能够监控关键数据的数据迟到、掉零、环比等内容。

大致解释一下,根据上面的栗子,在半年后做工作汇报的时候可以大致这样写:

  1. 已完成数据仓库设计相关文档的编写,总计25篇 Wiki,总阅读量10w。
  2. 已完成店铺主题相关的中间表的设计和开发,共计15张中间表,日均访问次数400次,占店铺主题相关总任务数的98%。
  3. 完成基本的数据监控功能,共计监控380张业务表,提前发现了14起数据异常。

0xFF 总结

上面就是数据仓库相关的 KPI 该怎么定的内容,具体的内容要和现实的业务情况相结合,因此本文仅起到抛砖引玉的作用,希望读者朋友们看后能有一些启发。不足之处多多指出,一起交流进步。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-10-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 木东居士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0x00 前言
  • 0x02 怎样定 KPI
  • 0x03 举个栗子
  • 0xFF 总结
相关产品与服务
智能数据分析
腾讯云智能数据分析 Intellectual Data Analysis 是新一代云原生大数据敏捷分析解决方案。产品具备存算分离、动态扩缩容等特点,并内置事件、转化、留存、行为路径等成熟分析模型,提供高可用、低成本的全场景敏捷分析服务,可同时满足数据分析师、数据开发工程师和业务决策人的关键分析需求,帮助企业大幅降低数据分析成本,支撑业务更高效决策。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档