首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何让数据分析为你所用

如何让数据分析为你所用

作者头像
企鹅号小编
发布2018-01-03 15:19:08
6610
发布2018-01-03 15:19:08
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

原文作者:Helen Mayhew, TamimSaleh, and Simon Williams

翻译:Peiwen Lin , Youjun Zhai

校对/编辑:Youjun Zhai

你的数据有目的吗?如果没有,那么你正在原地踏步。下面是一个如何发现目标,并将其转换为行动的方法。

数据分析革命

目前正在进行的数据分析革命具有可以改变公司如何去组织、经营、管理人才和创造价值的潜力。一些公司之中,特别是那些从数据中获得主要回报的企业,正在发生这种变革,但尚未成为主流。

原因很简单:作为唯一能够推动更广泛的业务变革、充分利用高级数据分析的关键人物,CEO和其他高层管理人员,对于数据分析这种他们看来深奥又有很多门道的新事物,保持着敬而远之的心态。

在某个层面上考虑,这是可以理解的。数据分析方法的复杂性、机器学习的日益重要性以及数据集的庞大规模,使得管理层更倾向于“把它留给专家们”。

同时这也是错误的。高级数据分析是一个重要的业务问题。这就意味着CEO和其他高管必须能够清楚地明白这些数据的目的,并将其转化为行动。他们必须要明白,数据分析不单单是数据分析部门的工作,其结果更是能为整个公司都带来洞察力和灵感。

本文介绍了8个理清数据分析目标和提升行动能力的关键要素。我们确信,充分意识到这两个其重要性的领导者们,不仅能借助数据分析解决一些基本问题,还能够更好地解决他们所面临的许多关键和重要的高级管理方面的挑战:传统商业原则下将分析愿景转化为切实结果的需求,部署一系列生产工具和雇用适当人员的重要性,以及应用严格指标和提出难题的必要性。从而提升使用数据分析提高企业绩效的可能性。

毕竟,性能才是最终的要点,而不是原始的数据集、有趣的模式或者通杀的算法。高级数据分析是实现目标的手段,它是用来鉴别、实现目标的辨别工具,是一个价值驱动的答案。只有清楚分析数据的目的(我们将在本文的前四条原则中谈到)和数据的用处(后四条原则),才能正确的使用这样的工具。由于不同公司、行业和地区对于高级数据分析业务的熟悉程度参差不齐,当然会得到不一样的结果。

但是,无论你的起点是什么,分析发现的洞察力应该成为你的企业的核心策略,能够随着市场竞争的变化,持续的定义和不断的提升公司表现。如果不是这样的话,则你并没有让高级分析的成功为你所用。

第一部分 “目的导向”的数据

对于不同的公司,“更好的性能”意味着不同的东西。这也意味着应该根据具体案例情况来分离,聚合和分析不同类型的数据。有时,数据点(data point)很难找到,当然,并非所有数据点都是一样的。但是,正是这些能助你达到特定目的的数据点,才是最具价值的。

1. 提出正确的问题 Ask the right questions

你的机构应该问的确切问题取决于你的最优先事项。问题清晰是至关重要的。例如,好的提问包括“我们如何减少开销?”或者“我们如何增加收入?”,甚至更好的是进一步挖掘问题:“我们如何提高团队中每个成员的生产力?”、“我们如何为患者带来高质量的服务?”、“我们如何从根本上加快产品从研发到上市的时间?”

我们需要考虑如何将重要的功能和领域与最重要的版块结合起来,通过实际的业务示例来,指向真正价值之所在。在对资金和时间有着严格限制的现实世界中,数据分析很难为含糊不清的问题给出答案,例如“数据点显示了什么样的模式?”。

一家大型金融公司也因这种开放性的尝试而遭遇了失败:它试图收集尽可能多的数据,想看看大量的数据背后显示了什么。当公司发行这种开放性的尝试结果,有趣但却对提升企业利益没有任何帮助的时候,他们才重新调整了团队。

有了来自管理层的强大支持,这家公司首先清晰了自己使用数据分析想要达到的目标:减少产品开发时间,然后使用客户采纳度,作为衡量此目的的指标。提高数据分析的针对性帮助公司为两个细分市场推出成功的产品。

无独有偶,我们知道的另一个组织也是通过首先创建“数据湖”(data lake)而陷入漫无目的的数据分析中。它花费了过多的时间(实际上是数年的时间)收集和处理原始数据,但几乎没有投入任何精力来思考数据分析的目的以及想要解决的问题到底是什么。管理层之后才意识到那些是急待解决的问题,却已经失去了先机。

如果这些企业先明确了想要解决的问题,再以此为引导来收集数据,那么他们肯定会更快地取得成效,哪怕只有一部分数据可用作分析。

例如,一家著名的汽车公司在一开始就着眼于如何提高利润这一基本问题。随后认识到解决此问题最大的机会是减少在匹配产品设计和工程功能时耗费的开发时间(以及成本)。

一旦公司意识到关键所在,即结合其十年的研发经验教训进行改革,并显著的缩短了开发周期,提升了公司利润。

2. 看起来微不足道的事物,作用却很大 Think really small... and very big

细节可能决定成败。让我们关注下面这张拍摄于1896年奥运会,100米决赛起跑线上的照片。照片中,参赛运动员们的起跑姿势可谓千姿百态,有直立的,有弯着腰的,也有双手摊开的,只有美国田径运动员ThomasBurke一人采用了现在的标准蹲踞式起跑方法(four-point stance)。也正是这种蹲踞式起跑,帮助Burke节省了加速时间从而助他在那一届奥运会上,以12秒的成绩夺得100米跑的金牌。Burke的成功使田径界在短跑比赛中开始普及蹲踞式起跑方式,如今,短跑运动员在比赛中都采用了这种准备姿势。

当然,这个案例可以很好地类比到商业界,那就是当竞争对手迅速采取了同样的最佳方案(best practice)之后,你的竞争优势就难以维持。

在1896年雅典举行的第一次现代奥运会上,被现代观众所惊讶的是100米短跑参赛者的姿态各种各样。Thoams Burke(左二)是唯一的一个采用标准蹲踞式起跑(如今被认为是短跑起跑的最佳方案)的选手,这个优势帮助他在奥运会上赢得了他两个金牌中的一个。

好消息是,聪明的一方仍然可以不断的提升他们的表现,取得突破并回到领先位置。轻松地保持优势是不可能的,但是公司可以找出微小的差异,然后放大并利用它。

“大数据”分析的成果通常表现为数千甚至更多的细微改进。如果一个组织可以将单个任务细化为数个细小的组成部分,并在可能的情况下一一对其进行提升改进,那么由此带来的回报是相当可观的。如果一个组织能够将这些小的改进,系统化的合并到整个连续的流程之中,其带来的回报更是呈指数增长的。

企业所做的一切事情几乎都可以被分解成小的组成模块。

GE(通用电气)公司在飞机发动机中嵌入传感器,以实时跟踪其各部分的性能,从而实现更快的调整,大大减少停机维护的时间。

如果这听起来像是最前沿的高科技(实际上确实如此),那么我们可以看一看更接地气的消费品是怎么做的。一家领先的CPG公司试图增加旗下某知名早餐品牌的利润率。它将整个产品制造过程分解为几个大的步骤,然后通过高级分析,仔细检查每个制造过程,以寻求其中是否有可以提高利润的机会。在这个案例中,公司在烤箱里发现了答案:稍微的调整了烘烤温度之后,不仅产品的味道更好,而且还减少了生产成本。证据就是,优秀的试吃的结果,以及同样优秀的财务报表。

当一系列的流程可以在比原子结构更为复杂的系统中被分解,分析,又被重新组合在一起时,产生的结果可以比原子弹更具威力。一家大型钢铁制造商使用各种分析技术来研究其商业模式的关键阶段,包括需求规划,预测,采购和库存管理。它单独对每个阶段中关键的价值驱动版块进行研究,并缩减或消除效率缺陷,从而节约5%至10%成本。

当制造商将改进后的流程再重组在一起,并将实时信息在每个阶段之间传送时,这些数据分析所带来的,数以百计的微小改进及其所节约的成本,带来了前所未有的收益激增。

通过合理化的端到端系统,将需求计划,预测,采购和库存管理连在一起,制造商实现了近50%的成本节约,节约了相当于几亿美元的成本。

3. 拥抱禁忌 Embrace the taboo

谨防废进废出(garbage in, garbage out:要保证数据可靠有用,才能保证分析结果的可靠有用),这个咒语已深入到了商业思维中,有时会阻碍我们的思维和洞察力。

实际上,有用的数据点在不同的案例中有着不同的形式和规模,通常以自由文本维护报告或者PPT演示文档等形式隐藏在企业之中。然而,不少团队经常会忽视这些数据,因为这些数据质量不一、缺乏一致性、过时或者因为看起来并不像是我们定义中的“数据”而被过滤等。

但是如果我们能“废物再利用”,正确的使用这些隐藏着的信息,也许将能得到更清晰有力的结论。在日常生活中,在跳出Excel表格进行信息创建,读取或回应的非二进制世界里,即使是最精英的“金融工程师”(“quant”)处理大量定性的信息,其中大部分都是无法量化信息并且不适合用做数据分析。我们知道,生活中很少有确定的事情,通常我们去衡量概率,考虑各方优势并且记录细微的提示信息。

想一想去超市购物的时候,你总是去4号台结账吗?或者你有没有注意到,今天某个柜台的员工似乎工作效率更高,某个柜台有个顾客拿着现金买单而不是信用卡,某个柜台的收银员没有助手去帮助他打包商品,而在某条队伍排队的顾客的购物车里面有些货物还未称重并且需要分开装?所有这些都是无法量化却可以处理的信息,并且有些数据比其他数据更有价值。但你可能会逐个地去考虑他们,而且当你决定购物车将往哪儿推时会考虑地更多。只是因为4号结账台在你最近几次购物经历中结账速度最快,但这并不意味着在今天也会是最快的。

事实上,虽然原生数据点和历史数据点是有价值的,但它们有其局限性。有一家公司在建立强大的投资审批流程后遇到了这些问题。公司为减少资本资源的浪费,在没有历史数据,以及可靠的信息支持投资回报率预测的情况下,管理层将不予通过新产品。不幸的是,这种严格的制度导致了公司产品上市周期过长,从而使公司不断错过市场。只有放松数据约束,将诸如行业预测、产品专家预测和社交媒体评论等软数据也纳入考虑之中,公司才能更准确地了解当前市场环境和推出新产品的绝佳时机。

当然,Twitter信息与远程信息处理并不一样。但是不能仅因为数据不完整或基于设伦,或是存在偏差,就把这些数据当作“垃圾”来对待。软信息确实有它的价值。特别是当人们尝试将获取更精准的数据与更好的推测未来形势时,这些软数据甚至会起到关键作用。

为了以智能而细致的方式优化可用信息,公司应努力构建一个强大的数据世系模型(data provenance model),以识别信息来源源,并实时评估其可靠性(可能随时间而提升或降低)。记录数据的质量,以及确定数据之类的方法,这不仅是数据透明度问题,同时也是一种风险管理的形式。所有的公司都在一个不确定性下竞争,有时一个关键的决定性数据的确定性不一定能满足人们的期待。一个构架完善的世系模型可以使用负荷测试检查对行/不行决策的可行度,从而帮助管理者决定投资去改善关键数据集的合适的时机。

4. 连点成线 Connect the dots

在边界上往往能产生新见解,就像考虑软数据一样能够带来新见解一样,结合信息来源来全盘考虑,可以使这些见解更加清晰。

一些企业往往在一项独立的数据集上进行深入挖掘,却没有考虑到各种不同数据集结合在一起时所传达的信息。例如,人力资源部可能有完整的员工绩效数据,营运部门有特定资产的综合信息,而财务部的投资回报率的备份财务报表。仔细审查每一份信息肯定是有用的,但是互相独立的信息数据集之间也许存在着更多尚待未开发的价值。

有家工业公司提供了一个具有启发性的实例。公司核心业务使用了最先进的机器,它可以同时负载多个任务。机器的每一个部件都价值上百万美元,而公司采购了数百个单元,总共投资了数十亿美元。这些机器可提供了优秀的运行性能数据,该公司据此评估了机器的每个部件一直以来的运行情况。毫不夸张地说,让机器保持持续运作是公司成功的关键。

尽管如此,这些机器实际上花费了比管理人员预期更长的维护时间和更昂贵的维护费用,停机维修的每一个小时都对公司有着极大的影响。虽然公司派出了强大的分析团队去仔细筛选分析机器的运行性能数据,但还是没有找出确切的故障原因。

然后,当公司将人力资源部提供的信息也纳入分析考虑中时,产生次级输出的原因变得很清楚:因为负责人在关键时刻未在场,导致机器缺少定期维护检查。

奖励机制,而非器械性能,才是这个问题的本质原因。最终,一个简单的政策调整就能解决这个问题,但只有当将不同的信息数据集结合起来审查时才能发现问题本质之所在。

第二部分 从分析结果到实际行动

在前面的工业公司的案例中,在视觉上就像Venn图一样(维恩图,用于显示元素集合重叠区域的图示。):当将两个数据集放在一起观察研究时,数据集重叠的部分往往显示了问题所在。当你同时分析50个数据集时,其呈现信息的能力则更为强大-前提是繁杂的数据没有造成过度的复杂,从而减弱了数据分析的作用。为了避免这个问题,领导者应该鼓励他们的企业,从多方面入手,来分析数据。如果数据分析工作在孤立的环境中进行而不考虑全局的其他影响,如果数据分析结果在实际情况中没有起到作用,更糟糕的是,如果数据分析得到了正确的结论,可企业并未采纳和依次采取对应的实际行动;那么,这个分析工作就是失败的,没有成功的。

5. 采用迭代循环而不是单向流程 Run loops, not lines

数据分析需要一个目的和一个计划。但俗话说“没有任何作战计划在与敌人遭遇后还能保持有效。”为此,我们引入另一个军事理论-包以德循环(OODALoop),这是由美国空军上校John Boyd发明的,由观察(Observe),调整(Orient),决策(Decide)和行动(Act)组成的决策循环

Boyd上校认为做出决策的方式往往能决定胜利属于哪一方,能更快速地对情况做出反应并更准确地处理新的信息的一方将在战斗中取得优势。换句话说,可以把决策过程看做一个循环,或更确切地说,是一个动态循环系列(下图)。

The OODA Loop

许多一流的企业都采用以上这种方法来提升其竞争优势。

Google就是其中之一,它坚持以数据为中心做决策,将消费者反馈构建成解决方案,并迅速升级改进顾客常用且喜爱的产品。

在硅谷之外,这种迭代循环而非单向的方法也很奏效。例如,有一家全球制药公司跟踪和监测其产品数据用以识别关键模式。当数据点表明某个过程可能偏离轨道时,迅速采取干预措施并通过试验改善其反馈环路以加速新药物研发。电子消费产品制造商通过收集数据并采用一个迭代、驱动假设建模周期做盘算之后快速行动起来。

它首先创建了一个临时数据架构、构建三个“建议库”(insightsfactories),为其最高优先级的关注要点提供可操作性建议,并与反馈并行结合起来。这一系列的措施,使得该公司的早期试点产品快速的得到了优异的结果。

如今,数据点的数字化缩短了反馈周期。通过使用高级算法和机器学习,提高了对于新增信息的分析能力,从而是公司可以更快更好的进行迭代循环。虽然机器学习在任何分析工具中都有着重要的地位,但它并不是唯一可用的分析工具,我们也不希望它取代所有其他分析方法。我们前面提到了圆形Venn图,或者叫三重Venn图。无论叫什么名字,其概念本质上是一样的,那就是,使用各种分析技术,并将其结果以不同的方式结合,从而得到一个更可靠的答案。

在我们的经验中,我们发现哪怕是拥有最先进机器学习算法和使用了自动迭代循环的企业,都将会受益于将其结果同另外一种或多种分析方式的结果进行比较。事实上,最好的迭代循环,包含了人和机器这两个组成部分。通过测试、迭代循环和监控数据质量变化的方式,更新数据点并使之随着事态的进程做出智能化反应,一个动态的、多管齐下的决策过程将超越任何单一的算法,无论这个算法有多么先进。

6. 使你的分析结果既有用又美观 Make your outputs usable - and beautiful

虽然最好的算法能够制造奇迹,但是它们并不能为自己发声代言。而数据科学家们往往缺乏良好的表达能力,不擅长阐述和演示他们的成果。这并不足以为奇,因为公司在雇佣技术人员时,毫无疑问的把对专业技能要求放在了表达能力之前。但我们需要意识到这一点,及其可能会产生的后果。

有一个世界级的制造商雇佣了一个团队为研发项目的期权定价开发了一个优秀的算法。在这个算法中数据点被精心解析,拥有智能、给力的数据分析过程,得到的数据本质上都是是正确的。但最后公司却没有使用这个算法,原因?公司的决策者们觉得产品有些“复杂”。

毕竟我们是人类,外在对我们来说十分重要。这就是为什么,比起有超强运算功能但五官不全的产品,赏心悦目的操作界面更能俘获人心。这也是为什么如苹果和Nest这些知名企业,都选择为使用优雅的外观设计以及易于操作的特质来打造他们的产品的原因。

数据分析应当被当做一件商品,需妥善包装才能吸引顾客,现在一流的企业已经在他们的核心分析团队中增设了设计师一职。我们发现,懂得抓人眼球,突出关键研究成果的展示界面,在整个企业中将获得更好的反响与支持。

7. 建立一个技能多样化的团队 Build a multiskilled team

牢牢抓住你的用户是至关重要的,不仅仅是管理层需要考虑到这一点,更应该培养企业中不同员工都向着这一目标努力,提升个人能力。数据分析是一项需要团队协作的任务,采用哪种分析方法、要挖掘哪些数据源以及以何种方式呈现分析结果等决定,都是需要人为进行选择判断的。

组建一个强大的团队如同烹制一份美食----你需要有各种优良的食材和创造的激情。团队主要成员包括:开发和应用复杂分析算法的数据科学家,精通微服务(microservices)、数据集成和分布计算领域技能的工程师,提供技术和系统支持的云数据架构师,以及保证产品的视觉美观、简明易操作的用户界面开发人员和创意设计师等。你还需要可以将IT和数据分析结果与业务决策和管理联系在一起的“翻译官们”。

我们发现,希望企业们也意识到了,拥有合适能力的人才明显供不应求。且简单地扩大编制引进更多人通常无法解决问题。有效的方法是根据具体情况将一系列行动的结合在一起:雇佣一些经验丰富的行业资深人员来带领公司的分析团队;在某些情况下,战略性收购或与小型数据分析服务公司达成合作关系;针对具有一定量化技术背景的现有员工进行改编和技术培训,将其加入到公司自己的分析团队中。

我们熟悉的几家金融机构和一家大型工业公司,通过推行这些方法建立了一流的高级数据分析团队。这些团队成功的关键因素,是充分理解组内每一个成员可以做出的最大贡献,以及一个有互补人才的团队可以集体实现的最大潜力。有时,幸运的雇主可以找到全能员工(“rainbow unicorn”),这类员工一个人就拥有了一个团队所需的大部分或者全部的技能。但是最稳妥的做法还是打造一支有具有多样技能的人才组成的分析协作团队。

组建这样一只团队,最开始的重点,是那些拥有核心技术,活跃在解析数据点及进行复杂分析的人们。然而,我们期望随着发展,企业会转向另一种模式,处于不同职能的员工们,都能使用数据分析为其日常工作服务。拥有数据思维天赋的员工的特性不难被发现:他们是有好奇心的思想者,关注细节,对尚未探索清楚的事物充满热情,对不同意见持开放态度,并愿意与公司一起不断尝试,期望能从中得到有意义,能在现实世界中带来成果的结论。最后一点也是至关重要的一点,无论有的数据分析看起来有多炫酷,如果这些分析是与现实世界脱节,无法带来实际成果的,那么你的公司就不应该在上面耗费时间和资源。你和你的员工应该倾尽全力去开发那些切实可行的方案,并确保这些方案能得到妥善的执行。

8. 让你的成果得以应用 Make adoption your deliverable

优秀的公司文化能让你数据分析的成果得到更好的采纳应用。从你的公司踏上数据分析之旅开始,每一位员工都应该明白,那些数学运算、数据处理以及对分析结果的包装设计都是不够的:真正地力量来自于应用。算法只提供了问题的症结,问题的解决方法还需要将其应用在现实世界的运作模式,以及每天的工作流程中。传奇棒球裁判Bill Klem 有一句名言:在我裁决之前,它什么都不是。(Itain’t nothin’ until I call it)数据分析也是如此,除非你真正将其应用在企业运营中,让其发挥作用,不然它就没有任何意义。

我们已经看到太多不幸的警醒的事例,拥有使用精确(昂贵)的地震预测系统却没有被高层采纳,优秀且拥有惊人的准确度的飞行指示系统却被飞行员闲置等等。

在一个极具代表性的案例中,有一家公司似乎拥有了一切先进的资源:该公司目标明确,专注于营收增长,对可靠的数据源进行了智能加权和开发,雇佣Stellar分析公司提供服务,并取得了提升交叉销售的机会。

他们的客服中心甚至有一款界面优美的,由语言识别软件触发的屏幕弹出窗口系统,此系统会根据顾客在电话中提到的信息,在弹出窗口中向客服人员展示顾客可能感兴趣的一些产品。真的是无比的优秀!但可惜该公司的客服人员并没有很好的使用这一功能,而是不断的关闭弹窗,不断的忽视提示信息。原来,客服人员的收入更多的取决于其处理顾客来电的数量和效率,而非他们成功销售出的产品的数量和类型。

当整个团队群策群力并拥有正确匹配的奖励制度时,得到的效果是显著的。例如,一家航空公司需要评估其下一代产品一系列的研发方向,但在技术、市场和监管条例方面面临重大挑战,致使任何结果都无法确定。而根据历史数据,一些技术似乎是更安全的投资,而另一些技术看起来也充满潜力,但尚未得到证实。加上产业链正在从产品转向以服务为中心的模式转型,未来的发展方向的预估和复杂的利弊权衡,都需要公司做出一系列动态且准确的决定。

通过构筑正确的问题、对不同方案进行负荷测试,使用设计优良的视觉模型呈现沟通各种方案的利弊取舍之后,该公司发现,增加某一个研发方向投资可以提供更多的灵活性,可以为公司争取到更长的时间对三个技术进行权衡取舍,而不必急于做出选择。这一发现让公司有了足够的时间来观望了解相关技术的发展情况,避免陷入最糟糕的情况-导致公司做出一个花费巨大且非常错误的选择。公司的一个高管将其得到的灵活性比作“不但能在比赛开始时选择马匹下注,更为保险的是,还能够在比赛中途在某匹马上下注”。

这种皆大欢喜的结局不是一个巧合。根据我们的经验,数据分析项目中从一开始就能预示成功的指标,并不是手上的数据质量,甚至也不是公司团队人员的技术水平,而是公司管理层的参与与投入。成功的数据分析项目,需要有人从企业管理层的角度来识别关键的业务问题,促进各职能部门间的协作、匹配激励政策,并全力推进直至方案被采用。虽然高级数据分析是一项优秀的技术,但你的公司不应该仅仅为了实施。

毕竟,我们使用数据分析的初衷是让其为你所用。

本文来自企鹅号 - 数据挖掘与大数据分析媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 数据挖掘与大数据分析媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档