前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据驱动管理:WHY、WHAT、WHO、HOW

数据驱动管理:WHY、WHAT、WHO、HOW

作者头像
大数据杂货铺
发布2023-11-13 21:07:53
4891
发布2023-11-13 21:07:53
举报
文章被收录于专栏:大数据杂货铺

虽然许多企业渴望成为数据驱动型组织,但其中很大一部分往往只关注技术方面,主要将其视为技术资产。因此,他们的投资和举措通常围绕以技术驱动的努力。然而必须认识到技术是达到目的的手段。

四个基本问题构成您的数据驱动雄心:WHY?WHO?HOW?WHAT?

我认为,在投入详细的技术实施计划之前解决 4 个基本问题至关重要:

  • 为什么我们应该在组织内利用数据?换句话说,数据能为我们的组织带来什么好处?
  • 谁是参与数据处理的主要利益相关者?该群体涵盖广泛,包括业务用户、执行管理层、客户以及数据工程师和数据科学家等技术角色。
  • 可以采取什么系统方法将原始数据转化为有形价值?此过程涉及从数据中获取价值的分步蓝图。
  • 我们如何才能有效地实现数据驱动的愿望?这涉及技术和数据管理实践的集成,使数据视角与总体业务以及组织目标保持一致。

在本文中,我将深入探讨这些关键问题,并探讨明确定义的数据策略如何在确保这些问题的答案与公司的战略目标以及项目无缝衔接方面发挥重要作用。

WHY

我始终主张揭示数据驱动管理雄心背后的潜在动机。是什么推动了数据工作的价值?解决 WHY 问题有助于衡量即将到来的数据项目的潜在回报。明确数据目标将为众多后续决策提供宝贵的指导。

制定用例场景并将其与潜在的价值驱动因素联系起来,可以提供回答该问题所需的见解。价值驱动因素的灵感来源可以来自贝恩公司的 B2B 和 B2C 价值金字塔

用于说明价值驱动因素的常用模型是贝恩公司的 B2B 和 B2C 价值金字塔。这个框架中,数据项目经常利用的几个价值驱动因素包括:

  • 透明度 —— 利用仪表板提供企业指标透明、客观的视图。例如,精心制作的营销报告可以使关键活动指标对营销人员和利益相关者透明。
  • 降低成本 —— 报告工具可以对流程绩效进行深入分析,有助于识别能够实现成本降低的领域。
  • 集成 —— 数据项目可以集成不同来源的数据,产生新的观点和见解。这种集成可以检测异常并提供端到端流程的见解。
  • 可用性 —— 提示驱动的人工智能工具(或聊天机器人界面)几乎总是可以访问,让您可以全天候请求信息。
  • 节省时间 —— 人工智能驱动的应用程序通常会自动执行大量重复性任务。例如,可以自动将服务台票分配给适当的员工,或在简洁的仪表板中总结社交媒体情绪。
  • 可持续性——数据驱动工具可以根据内部和外部数据源阐明 ESG 相关指标。这有助于组织推进其可持续发展目标。

我想使用具体的用例场景来回答 WHY 问题。具体描述您想要使用数据的场景以及相应的值是什么。这将有助于稍后识别 WHO 将在哪个过程中使用数据。

WHO

回答 WHO 的问题有助于评估您当前和设想的组织的文化背景。仅靠数据无法创造价值;需要个人带领组织获得数据洞察并根据数据驱动的结果采取行动。了解潜在的数据用户,对于在工具、基础设施和构建数据驱动文化方面做出明智的选择至关重要。

回答 WHO 的问题有助于评估您当前和设想的组织的 DNA

以下是一些文化特征的示例,这些特征将影响后面 WHAT 和 HOW 答案:

  • 软件打造 DNA —— 公司是否有构建和维护自己软件的传统?是否打算继续投资开发?在这种情况下,与内部数据工程团队合作可能是一个谨慎的选择。
  • IT 外包文化 —— 公司是否习惯外包 IT 解决方案?如果是这样,建议考虑购买方法,而不是开发内部解决方案。
  • 主动性的空间 —— 组织是否提倡自下而上的员工主动性?如果是,那么培养一种自助数据文化,让员工可以产生自己的见解将会是有益的。
  • 专业领域知识 —— 组织是否拥有在其他地方很难找到的独特领域知识?在这种情况下,识别这些领域并投资专门的、定制的数据产品是值得的。
  • 专业技术知识 —— 组织中是否已经具备与数据相关主题(例如云、数据库或数据管道)相关的专业技术知识?组织在此类技术领域的成熟度对于选择如何推出正确的数据平台至关重要。
  • 分析基础 —— 电子表格分析是否已经成为您组织决策的常识?那么,让这些用户更进一步并为他们提供更成熟的工具来进行更好、更深入的分析将是一个好主意。

WHAT

从广义上讲,WHAT 问题可以通过遵循 DIKW 金字塔中概述的基本步骤来解决,其中涉及将原始数据提炼为智慧的过程,经历信息和知识的阶段。

价值主要是通过首先将原始数据转化为数据产品来实现的。最终用户可以通过数据工具访问这些产品

我更喜欢将这些通用阶段分解为三个略有不同的部分:

  • 数据产品:对于 WHAT 阶段,必须确定促进 WHY 阶段中用例所需的特定数据产品。这些数据产品被视为可重用的数据集,例如包含有关订单、发票或客户信息的数据集。
  • 数据工具:确定指定数据个人(如 WHO 阶段中确定的)将使用哪些工具是 WHAT 阶段的一个关键方面。评估您的用例场景是否需要专门的统计工具,或者是否可以将数据驱动的算法无缝集成到现有的数字应用程序中。数据可用性的概念与数据工具的选择密切相关。
  • 原始数据:查明构建已识别数据产品所需的原始数据也很重要。原始数据和数据产品的识别通常涉及迭代过程,原始数据的可用性激发新数据产品的创建,反之亦然。

现在您已经全面了解了输入(原始数据)和输出(数据产品),可以继续确定将原始数据转换为这些产品所需的必要数据转换(技术上称为“管道”)。在此阶段,捕获与这些管道相关的功能需求变得特别重要。示例功能要求是:

  • 数据新鲜度:确定数据产品所需的新鲜度级别。您需要实时信息,还是每小时更新就足够了?
  • 数据量和速度:评估需要转换和集成的数据量以及该数据量扩展的速度。
  • 数据多样性:识别需要转换的各种原始数据源。考虑这些源是否主要由关系数据库系统 (RDBMS) 中的结构化数据组成,或者是否还包含文档、视频和图像等非结构化数据类型。

HOW

现在您已经清楚地回答了 WHY、WHAT 和 WHO 问题,下一步就是解决 HOW。在此阶段,您将确定最佳的技术架构,并根据这些新发现的数据驱动功能制定有效管理组织的策略。

在 HOW 阶段,您将确定最佳的技术架构,并根据这些新发现的数据驱动功能制定有效管理组织的策略

技术

发现与目标相符并与组织的 WHY、WHAT 和 WHO 相协调的技术产品。例如,如果您缺乏在组织内内部化开发能力的策略,那么选择以自定义开发为中心的数据方法是不切实际的。

在建立数据平台时,必须仔细考虑一系列技术选择。虽然此列表并不详尽,但强调了一些关键的权衡:

  • 购买与构建:必须清楚地界定数据平台的哪些组件应该在内部构建,哪些组件更适合购买或租赁。针对已解决的问题重新发明解决方案通常不会产生什么价值,而在平台内创建独特的销售主张 (USP) 则可能非常有益。当然,服务和工具的成本和性能影响在这些决策中发挥着重要作用。
  • 数据转换类型:考虑谁需要集成和转换数据的能力。如果您的目标用户是处理大量数据的数据工程师,那么使用 Spark 和 Python 或 Scala 等技术进行管道是一个明智的选择。对于不太复杂的场景,低代码解决方案或 SQL 可能更合适。所需的数据新鲜度也会影响此决策,因为某些管道技术非常适合实时场景,而其他技术则不然。
  • 计算引擎:数据的数量和性质以及新鲜度要求决定了计算引擎的选择。对小型数据集使用广泛的大数据计算能力通常在成本和性能方面效率低下。此外,在将非结构化数据加载到关系数据库管理系统 (RDBMS) 之前对其进行转换通常被认为是一种反模式。在这种情况下,支持 Lakehouse 模式的计算架构可能更合适。
  • 云还是本地:与购买与构建决策类似,评估数据平台的哪些部分适合云、哪些部分不适合至关重要。要考虑的因素包括您组织的云愿景和成熟度。此外,分析与云服务相关的未来运营支出 (opex) 与本地解决方案的传统资本支出 (capex)。
  • 集成:促进数据在组织内的正确时间无缝流动到正确的位置对于创造价值至关重要。因此,定义数据集成模式是关键的一步。常见选项包括通过 API 进行数据访问、数据库连接或在流管道中创建数据主题。

技术决策通过数据平台的实现付诸实施,从数据中提取价值。该数据平台由多种技术产品组成:(云)服务、现成软件产品和定制技术解决方案。由此产生的软件堆栈应该满足实现回答 WHY 时概述的目标所需的标准。

数据管理

建立强大的技术基础是启动组织数据计划的关键一步。有效的数据管理是确保全面数据实践持续成功的关键。在雄心勃勃的数据驱动型组织的框架内,几个关键的数据管理因素发挥着作用:

  • 角色和职责:数据管理的一个关键方面涉及创建一个清晰的模型,概述数据处理的角色和职责。该框架回答了一个基本问题:谁对特定数据负责?一旦定义,该结构就会确定解决有关特定数据集的查询或解决数据质量问题的首选人员。然而,数据所有者并不是孤立运作的。例如,可以构建 RACI 模型来补充和履行角色和职责。
  • 数据质量:任何数据驱动产品或后续技术利用的有效性都取决于数据的基础质量。基本的数据管理实践围绕着对数据质量的持续监控。鼓励数据所有者采取旨在提高数据质量的措施。
  • 数据发现:无论数据管理是分布式的还是集中式,每个数据管理团队都应该全面了解组织内可用的各种数据元素。采取措施以确保整个组织中的个人知道在哪里可以找到特定的数据集。
  • 支持数据流程:广泛处理数据通常涉及劳动密集型流程。这些流程包括数据访问管理(获得数据所有者的同意以访问特定数据集)、数据共享(与他人共享数据产品)以及记录数据安全级别。结构良好的数据管理实践可以制定策略来简化和优化这些支持数据流程。

虽然数据管理的主要目标不是技术驱动的,但工具可以显着加快数据管理实践的成熟。这些工具涵盖范围广泛,从用于可视化数据模型的数据目录到用于监控数据质量状态的数据质量工具,以及旨在促进各种数据处理的特定工具。尽管不同的供应商可能对这些工具的定位不同,但它们的基本概念很大程度上植根于元数据管理。

数据策略

我建议采用敏捷数据策略,因为期望 WHY、WHAT 、WHO 和 HOW 的答案在较长时间内保持不变,并且通常在数周或数月内发生变化是不现实的。虽然鼓励拥抱变革,但对所有动态要素保持系统的看法可能具有挑战性。这就是为什么我建议寻求一种方法,使 WHY、WHAT 、WHO 和 HOW 之间的联系变得切实可见。

计划板可以帮助将技术产品和数据管理计划(HOW)与最终的数据产品(WHAT)以及最终的价值贡献(WHY)联系起来。我还喜欢通过在板上标记各种卡片来跟踪 “WHO” 角色

我更喜欢的策略是利用一个简单但功能极其强大的“数字规划板”,具有三个垂直通道:

  • 如何:该通道重点关注技术产品,例如管道、计算资源、数据库和数据管理计划,以促进后续的“什么”和“为什么”。
  • 内容:该通道涉及包含实现用例场景所需数据的数据产品。
  • 原因:在此通道中,您可以确定用例所贡献的价值驱动因素。

此外,我建议在规划板最右侧的项目上标记相关的角色(WHO)。这种做法可确保交付的价值符合您组织的文化和 DNA。

通过从左到右绘制连接,您可以快速掌握价值驱动因素和支持计划之间的关系。这种战略方法有助于获得对变革性 HOW 项目的支持,这些项目最终将为 WHY 方面带来重大价值。

结论

在本文中,我证明了数据驱动管理超越了数据平台的纯粹技术实现。通过解决四个核心问题—— WHY、WHAT 、WHO 和 HOW , 我们可以了解技术实施和数据管理计划如何与组织更广泛的价值驱动因素保持一致。明确定义的数据策略在保持这种一致性并确保技术实施与组织 DNA 之间的文化和谐方面发挥着至关重要的作用。 原文作者:Janmeskens

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-11-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据杂货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • WHY
  • WHO
  • WHAT
  • HOW
    • 技术
      • 数据管理
      • 数据策略
      • 结论
      相关产品与服务
      数据集成
      数据集成(DataInLong)源于腾讯开源并孵化成功的 ASF 顶级项目 Apache InLong(应龙),依托 InLong 百万亿级别的数据接入和处理能力支持数据采集、汇聚、存储、分拣数据处理全流程,在跨云跨网环境下提供可靠、安全、敏捷的全场景异构数据源集成能力。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档