关于《决战大数据》读这50条就够了

老师在其决战大数据一书中,强调的更多的是一种数据思考方式,书中范例介绍的小偷思维、先开枪后瞄准、CEO关注的三个问题等,都属于数据思考方式重构解决问题的过程。

全书从为什么大数据说起来容易做起来难出发,以大数据构建未来商业利器结束,总共花费了11个章节,中间穿插着其在阿里的数据实践经验,本人结合自己的读书体会,特将其总结归纳为以下50条:

1、大数据从来都不是免费的午餐,因为数据来源渠道的宽泛,难免出现偏倚误差。

2、人的断层是是大数据应用面临最严重的问题,这个断层包括沟通的断层、建模的断层,譬如现在收集数据的人不知道未来使用数据的人要什么?创建模型的人不知道未来数据是否稳定,使用模型的人不知道数据的来龙去脉。

3、从数据化运营到运营数据,是从看到用的过程。这个过程需要主动管理,需要更多的创新,需要学会问问题,问问题的过程就是寻找答案的过程,好的问题就是答案。

4、从商业角度讲,大数据的本质就是还原用户的真实需求。

5、数据价值的如何判定?首先看这个数据与你的目标是否一致,对你的价值是什么?其次看这个数据能否清楚的识别用户身份,以及反应出的对应的场景。

6、学会双向思考,关于数据的价值,对于企业而言,是实现企业资源的合理分配,而对于用户而言,则是对用户体验的提升改进,比如个性化的推荐系统就基于此。

7、场景与还原并行,前端还原为消费者场景,后端还原为业务需求。

8、数据的本质是还原,落地可能表现为收集元数据的方法,个人建议初期引入最小数据集的概念。

9、关于数据还原可以从两方面理解:①对人的行为目的的还原;②对制造原始信息的人的朔源。

10、活的数据才是大数据,这里的活主要从两方面考量:一是灵活收集数据,抓相关性,比如我们的克强指数;二是灵活动态的数据指标,动态的使用数据,将数据场景化。

11、 移动互联网时代,无线数据将是大数据的“颠覆者”。这个颠覆主要指无线数据的加入将原有数据的噪音加大,无线数据与原有PC数据的关系处理等。

12、无线数据分为wap和app两种,而APP的数据收集方式又有两种:①收集用户联网时请求服务器的记录②用户行为记录。

13、 APP对用户的识别主要基于手机的机器码,而机器码在不同系统中也有差异,差异体现在操作系统本身的差异和操作系统版本的差异。

14、 保证PC和无线两份数据的完整,通过用户体系将两份数据关联起来,就可以在分析过程中用彼此的融合来还原用户的行为,所以用户体系的建设在多屏时代尤为重要。

15、 关于数据价值,从数据的角度讲,估值就是通过不同的纬度去思考数据的价值。

16、 数据作为一种资产,不同的数据含金量必然不同,自然就会产生不同的价值,与此同时,同样的数据在不同环境中也会呈现出不同的价值。

17、数据的四种分类:①可再生与不可再生数据;②基础层、中间层、应用层数据;③不同数据主体对应的主体数据;④隐私与非隐私数据。

18、数据的五种价值:①串联与识别价值;②描述价值;③时间价值;④预测价值;⑤产出数据价值。

19、 数据分类与数据价值的意义,主要还是体现在数据产品的建立上,其应用思想体现在基础层-中间层-应用层上。

20、基础层收集那些数据,如何收集,如何保存等;中间层涉及数据管理与数据框架的搭建,应用层则是八仙过海各显神通。

21、数据收集的出发点是解决问题,此外数据的生命周期、收集背景都须注意。

22、 用数据是一种方法论,养数据则是一种数据战略,是基于更深的商业解释的商业决策。

23、 跳出固有思维圈,从旁观者角度出发,跳出0或1的选择,我们可以有第三种选择。

24、数据应用应该是小而美,而不是大而全。小而美指目标简单具体。

25、 如何利用数据框架做决策,简单四步告诉你:①确定问题,从解决问题的角度去收集数据;②整理数据放在一个框架内;③看框架与决策的关系;④根据决策行动,检查是否达到目的。

26、数据的盲点分为物理盲点和逻辑盲点,物理盲点是我不知道的,逻辑盲点是我知道但没被挖掘的。

27、 数据也有正负能量,正能量的数据告诉你如何成功,负能量的数据告诉你如何避免失败。

28、是否看到数据盲点的核心价值是,有没有看到应该看到的数据,有没有错失不应该错失的数据。

29、数据运营中的常见问题:①堵,日常报表信息量大,难以铺捉有效信息;②独,信息分散在不同部门,缺少有效组合;③慢,业务异动的处理往往是自上而下的推动;④漏,关键分析成果取得实效,但未实现沉淀。

30、 阿里的大数据实践一:数据化运营需要和商业咬合的非常紧密,所以数据也是混合在商业里,以假定稳定的方法去做业务上的对比、细分以及趋势预估。

31、 阿里的大数据实践二:假定数据是稳定的,意味着习惯于不去寻找一些新数据,用数据拿数据的方法可以将数据化运营和运营数据打通。

32、 阿里数据化运营的内三板斧之:混出数据,只有具备商业敏感的分析师,才懂得使用什么数据来驱动公司实现经营目标,数据部的人和业务部的人经常混在一起。

33、 阿里数据化运营的内三板斧之:打通混的数据,通是混、通、晒的关键节点,知道带着业务问题看数据或带着数据看业务,这就是通。

34、 阿里数据化运营的内三板斧之:晒出混和通的数据,数据能不能做到获取、使用、分享、协调、链接、组合之上,让自己变得超级简单和便捷,这是数据化管理运营中非常重要的一点。

35、 数据化运营需要有框架可依,做到如何证明业务是好还是不好,而这里的框架就是一个对业务进行指标化的分解,并通过有限多个指标来客观描述业务的状况。

36、 阿里运营数据的外三板斧之:存是数据收集的开始,收集数据不是目的,让收集起来的数据如何产生价值才是最终目的。

37、 阿里运营数据的外三板斧之:管是保护好存储数据,学会用数据产品来解决获取以及使用数据的问题。

38、 阿里运营数据的外三板斧之:用是从收集数据到管理数据,在用数据的问题上,数据的分裂和重组,都能做到颠覆性的创新。

39、数据思维之MECE法则,不断地用逻辑方法将问题进行分解,直到不能分解为止,然后从根本去解决问题。

40、大数据的本质是人,数据研究的极点就是揣测变幻莫测的人性。

41、假定数据是脏的,在处理数据的时候,会像污水处理厂一样,每一步都问自己几个为什么。这种情况的出现,到底是因为数据脏了还是因为数据提验过程中做的不好。

42、 做好数据的质量评分,从反映数据的可信度和质量水平出发。

43、 学会慢慢的淡化数据,数据是有优先级的,在数据中有些是特别核心的,有些即使缺失了也没问题,所以,我们要学会真正坐下来盘点那些对公司最有价值,对用户最有价值的数据。

44、数据的标签化管理,数据的属性标签是人类经验判断的数据,是数据后的数据。

45、大数据价值的实现在于数据与数据之间的连接。

46、数据的实时化和实时性分层,我们千万不要把所有能力都用来处理实时化的问题,因为我们依然会有大量的数据需要在恰当的时机处理,有的数据是重要的,但并不紧急。

47、关于数据,未来是人机的结合体。人和机器的结合,或者人和数据的结合将是未来的一种进步模式,人类将通过数据变得更加智能。

48、未来,人身体中流通的不仅是血液,还有数据。

49、 关于数据分析,更准确的说法应该是信息分析,目的是寻找短板,这个短板可能是自己的,也可能是竞争对手的。

50、我们都说数据分析是指导决策的重要依据,但我们用什么来保证分析的正确呢?是不断的试错还是考验我们数据分析师(科学家)分析和利用信息的能力。


转自:数据元素 微信公众号,由数据元素整理;

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2015-09-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯大讲堂的专栏

前端重构成长指南【首届TGDC-前端专场】

嘉宾介绍 贺彬:腾讯互动娱乐创意设计中心总监,负责网站重构组、设计项目攻坚组,项目管理组的团队管理;2003年加入腾讯,经历了团队由不足10人成长到现在超过15...

25750
来自专栏互联网数据官iCDO

驱动用户增长? 来,客户调查类型了解一下

顾客调查可以帮助企业在短时间内用最低成本收集大量顾客反馈。这些调查结果可以帮助企业快速简便地满足顾客的反馈和要求,并且可以识别潜在用户以及进行案例研究。

12830
来自专栏腾讯大讲堂的专栏

浅谈硬件PM与软件PM在产品设计上的差异

导语 | 在鹅厂经历了一个较为完整的智能硬件项目,在项目实践过程中,有一些感悟,准备结合这个产品作为例子做个总结,与大家一起分享下,希望对公司未来做硬件相关的团...

1.1K90

大数据如何变化并影响互联网运营

众所周知,通过计算每时每刻都会产生大量的用户数据。通过社交网络数据库和GPS(全球定位系统),每个人使用某些应用程序时所在的位置,以及他们的行为,观点,兴趣和所...

18630
来自专栏PPV课数据科学社区

2017年,为何过半的大数据项目不成功?

此前,援引外媒消息称,Gartner预测,2017年将有60%的大数据项目在试验阶段就会失败,并最终会被放弃。 在大数据正热的当下,这一结论无疑给众多的热心者泼...

31250
来自专栏云社区体验反馈

亲身体验后 | “如何提高云+社区吸引力”的浅见

之前在做小程序开发的时候简单地接触过“云+社区”。在我漫漫的产品求职路上,遇到过“社区”相关的问题,于是就想以“云+社区”为例,回头总结一番。

16950
来自专栏DevOps时代的专栏

从作坊到工厂:传统企业 DevOps 改造历程

22620
来自专栏云计算D1net

超级云计算:步履维艰or一帆风顺?

当前,随着云时代的不断发展,越来越多的企业开始关注于行业当中的客户需求,不同行业客户有着不同的需求点。 对于云计算来说同样也是如此,自从云计算诞生以来,我们对于...

34540
来自专栏WeTest质量开放平台团队的专栏

「深度兼容测试」服务 今日重磅发布!

根据腾讯WeTest提供数据显示,70%的互联网用户已有3年以上的互联网经验,对应用内容的需求更加追求高效与个性化,需要产品长期稳定产出优质内容。而随着行业内容...

10830
来自专栏西安软件开发

弈聪软件尹宏刚:讨论微信小程序前景不如撸起袖子做了再看

小程序究竟是什么?很多人认为它有助于更多创业者,也有人认为它是鸡肋。但无论如何一夜之间西安网络服务市场冒出大小几百家的小程序开发公司似乎已经说明和一些问题。西安...

10440

扫码关注云+社区

领取腾讯云代金券