高效能数据分析的七个习惯

导读:高效的数据分析不是马上就能学会的,但是可以通过快速学习掌握。这里有7个数据分析的习惯,我希望有人可以针对一个工程团队,告诉我关于数据分析的高效合作,沟通以及投资。

1相比花哨算法,更重视分析的简单性

如果你都不能向一个5岁的小孩解释清楚,那么你将很难将你的产品卖给其他人。产品数据分析的重点不是分析,别误会,你还是需要分析,但是它的故事和基于数据的推荐真的很重要。

复杂的分析造成的混乱将导致你获得完全相反的结果。你希望能够驱动工程和投资分析行为。如果你的分析是不清晰的,工程师就不能快速通过你的分析获得知识,那么你的分析就会失去价值。

关于数据分析的影响力的最终测试是根据工程和投资行为的改变程度。应该令数据分析变得容易,方便人们使用,得以实现改变。

2相比数据,更加重视数据源

在更广泛的时间段里看更多的数据可以给你在分析上有更多的信心。然而,遥测或日志作为单一的传递途径会被捕捉到的特性所限制。一般来说,一个单一的途径只讲述产品的一部分。

相同分析+相同原理=相同故事

你需要的是其他数据源。可以是所有被登记在某处的SQL操作记录,或者是你有工具可以从你的用户那里获得日志样本。更多的数据源也会让你确定你的故事是否一致。更多的数据不能给你更多得洞察力。但是更多的数据源可以。

3相比最新亮眼的工具,更加重视熟悉的工具

亮眼的最新工具使用起来很有趣,有时候也很管用。但是,你还记的你的数据分析的影响力的最终测试吗?

你希望工具变的容易,能够被人们所使用并得到自己想要的改变,但是改变不是这么容易的。从文章《你的大脑在工作》即《Your Brain at Work》学到3点,希望大家能牢牢记住,它们能给与你们最大程度的帮助来促进改变。

  • 对于你的工程师伙伴而言,令工具安全很重要,它们可以被使用和促进改变。通过使用你熟悉的工具,讲述那些快速吸引大家注意力的故事。远离最近,最酷的可视化技术除非它们在你的故事中必不可少。
  • 深入分析核心信息
  • 重复核心信息,不断的重复

除非你正在推荐一个新工具的使用,重点不是在工具,而是你故事的核心信息。

4相比指标,更加重视洞察力和投资

指标是指你的关键性能指标(KPI)。它们可能以图表,坐标或表的形式表现。你的分析不能就此止步。指标只是数据驱动工程‘3I’里面的第一个‘I’,告诉别人一个围绕数据的充满洞察力的故事,然后建议他们投资。你是改变的代理人,你的分析必须充满你的见解和对投资的建议。

5相比信任,更加重视CUSS

数据永远都是不干净的。这就是为什么我常常觉得自己像一个门卫。作为数据门卫,我很少相信里面的数据以及它们的格式是正确的。我总是从使用‘R语言的可能性和统计的介绍’中应用Kern’s CUSS,为了能够理解数据中心,数据的异常特征,数据的传播和数据的形状。

  • 中心:数据的总体趋势所在
  • 异常特征:有缺失的数据点?离群值?集群?
  • 传播:数据产生哪些变化?
  • 形状:如果你来绘制数据,数据的形状是什么?

了解数据如何生成和数据的CUSS可以让你作出更好且合理的见解和投资。

6相比确定性,更重视方向

数据收集的成本经常是解决业务和工程问题的最终答案的一大障碍。你几乎总是能得到不完整的答案,虽然比你手中已有的答案好。

《如何测试任何事》(How To Measure Anything)的作者推荐我们可以问这个问题:

“是否存在一个测试的方法可以减少不确定性,足够来确定测试的成本?”

即使你没有相应的工具来明确的回答特定的组件是否有这个问题。你也可以消除一些组件,通过廉价的方式来减少不确定性。也许你可以凝聚几个不同来源的数据,得到一些非常粗略的结果,让事情朝着正确的方向前进。

让你或你的团队朝着正确的方向前进比得到超级准确的,确切的答案更重要。

7相比你在“思考”软件是如何工作的,软件的实际工作更重要

产品数据分析的优点是看到实际用户使用你的软件产品的足迹。有时你会得到一个很好的的足迹。但也有可能,你得到的部分足迹让你的调查更加困难。无论如何,遥测和日志的足迹都是现实的反映。

架构知识是伟大的资产。但是,遥测和日志通过确凿的证据告诉我们实际发生了什么,结果并不是我们希望看到的。作为一名数据科学家,如果你对数据有着独特的看法。那么你看到的软件,就是软件的真实情况。

这是很强大的,因为你不仅有足够的证据显示软件是如何工作的,也可以对广泛的用户有针对性的洞察。你可以声称:“77%的用户沿着的这条编程路径是和软件设计矛盾的。”相信你的用户留下的足迹,但是要重复检查。在‘统计学习的元素’这篇文章中,有一句引言我很喜欢:“正如我相信上帝一样,我也相信他人带来的数据。”

补充:体系知识是你的SMARTCUT(一款可以让用户无缝删除照片目标的应用)

我今天的内容虽然会有矛盾之处,但是理解产品在不同的组件下一起工作,对于产品数据分析是非常有用的。

完全依靠你的遥测和日志来告诉你软件是如何工作的,这是可能的。虽然它可靠,但是缓慢。应该采用SMARTCUT和学习编码是如何执行的。通过调试器进行该步骤,在你的脑海中形成一个模型:组件是如何流动和组合在一起的。

脑海紧记SFDIPOT:即结构、功能、数据接口,平台,操作和时间。

Smartcuts的作者声称,你可以通过构建平台快速学习和训练自己。平台都是类似工具和他人建立的框架。使用调试器工具或架构文档可以快速布置你的平台。那么你的遥测和日志分析将得到全新的意义,因为你刻意的训练自己去掌握代码执行模式。

来源:36大数据

原文链接:http://www.36dsj.com/archives/43811

版权声明:转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly0801@163.com。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2016-03-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏云加头条

揭秘腾讯云Supermind智能网络,百万级设备的网络高效运维

网络数据中心正在不断向人工智能(AI)时代演进,在Gartner发布的《2017数据中心网络魔力象限报告》中,将分析和基于意图的网络(Analytics and...

7350
来自专栏人工智能快报

雅虎发布大量有助于研究机器学习的数据

2016年1月14日,计算机世界网发布消息,称雅虎发布了大量数据,用来帮助科研人员开展机器学习的研究工作。 雅虎发布的针对机器学习科学家的数据集成为了新的“有史...

2899
来自专栏数据科学与人工智能

【数据分析】创建定性用户画像

在产品研发过程中,确定明确的目标用户至关重要。不同类型的用户往往有不同甚至相冲突的需求,我们不可能做出一个满足所有用户的产品。   为了让团队成员在研发过程...

2429
来自专栏喔家ArchiSelf

老曹眼中的面向数据架构

数据是系统的核心,在面向服务的架构之外,也可以考虑一下面向数据的架构方式。面向数据的服务架构需要支持多数据源异构,支持动态数据和静态数据,既支持公有云部署又支持...

834
来自专栏CSDN技术头条

【BDTC 2016】专访中兴飞流吕阿斌、郑龙:Yita,基于数据流的大数据计算引擎

在此次大会的大数据分析与生态系统论坛上,中兴飞流信息科技有限公司CTO郑龙发表了“Yita:基于数据流的大数据计算引擎”的演讲,阐述了数据流对于大数据的影响,以...

2468
来自专栏腾讯社交用户体验设计

如何快速有效的发散思维

1233
来自专栏ATYUN订阅号

谷歌将基于AI的谷歌镜头引入谷歌图像搜索

谷歌宣布将其基于AI的Lens技术引入谷歌图像搜索。该公司解释说,这个想法是允许网络搜索者更多地了解照片中的内容,特别是他们可能想要购买和购买的商品。例如,装饰...

993
来自专栏机器人网

采用FPGA,机器人专用运动规划芯片问世

让机器人在物理世界中安全地移动是件棘手的事情。工业机器人是强大的产品,但有可能出现完全粉碎人类的意外,并且,用机器人视觉和足够的大脑来避开障碍成本非常昂贵,还会...

40211
来自专栏钱塘大数据

【解读】关于数据中心可靠性和可用性的几个概念

导读:数据中心的重要性在于支持企业应用不间断运行,但近年来,世界各地的数据中心频频爆发安全故障事件,在一次次冲击着企业用户的心理防线。这也让我们产生一些思考,究...

4487
来自专栏AI科技大本营的专栏

AI 技术讲座精选:无 IA(信息架构)不 AI(人工智能)

学习人工智能(AI)到底会如何影响我们个人生活和工作的各个方面? 利用人工智能技术的不同应用到底有哪些? 决策因素和具有典型应用、限制、考量因素和数据源的AI工...

31110

扫码关注云+社区

领取腾讯云代金券