3本书搞定大数据入门常识

3本书的作者国籍是分别是英国、加拿大和美国。在豆瓣读书搜索“大数据”,搜索结果中有很多中国人写的书。但中国跟互联网沾边的书,很多都是开一个宏大的足够吸引人的话题,然后在内容中夹带私货,《微信思维》就是这个套路的典型案例。而中国跟大数据有关的书,先不说是否夹带私货,问题首先是中国的大数据靠谱吗?那些“根据相关法律法规,搜索结果未显示”的数据,也就不会有点击量。某些社交软件的部分内容关闭了评论功能,变成博主的一言堂,这样不完整的数据是否还值得分析?

1

《大数据时代》

作者: 维克托·迈尔·舍恩伯格

出版社: 浙江人民出版社

副标题: 生活、工作与思维的大变革

原作名: Big Data:A Revolution That Will Transform How We Live, Work, and Think

译者: 周涛

ISBN: 9787213052545

这本书放在第一位,没什么悬念,是一本多角度完整讨论大数据的书。内容既包括一些已有的成功案例,也包括对未来的预言和展望。关于这本书的详情,「知鱼」上一篇图文已经说得很详细,就不再重复了。

眨眼之间,我们就能发现“causality”(因果关系)这个词在1900年之前的使用频率比“correlation”(相关关系)高;而在1900年之后,情况就与之前相反了。

2

《对伪心理学说不》

相关性和因果性是《大数据时代》重要的讨论部分。而《对伪心理学说不》这本书把相关性和因果性讲得更清晰、全面。虽然标题叫“心理学”,但内容主要是在讲统计学。统计学同时是大数据和心理学的基础,所以很容易想象,大数据会让心理学进入一个新时代。搞清楚这一点,你就不会再被那些只会给你灌鸡汤的三流心理咨询师骗钱。

大部分复杂的行为都是由多重原因所决定的。各种各样的因素共同起作用才导致了某种行为出现。有时多个因素联合在一起时会产生交互作用。也就是说,变量共同作用时的整体效应,会和其单独作用时获得的效应完全不同。

3

《赤裸裸的统计学》

不知是不是为了多卖几本,这本书的副标题强行带上了“大数据”。毕竟,枯燥的基础学科跟能骗钱的互联网前沿会给人完全不同的感觉。但实际上大数据跟统计学是放不开的,而统计和概率是分不开的。前两本书都主要是在讲统计学,概率的内容很少。这本《赤裸裸的统计学》可以帮你补上概率课。在电视节目中,一共有3扇门,其中1扇后面有一辆汽车,你猜中了车就归你。你做出选择之后,主持人帮你排除一个错误答案,然后问你是坚持原来的选择还是换一个?此时你怎样选择获得汽车的概率更大?

假设我们一开始有100位学生,在第一次抛硬币结束之后,有大约50人坐下;然后我们开始第二次抛硬币,之后还剩下约25位学生站着;然后是第三次、第四次……通常最后总是会剩下一位学生在连续5次或6次得到硬币反面朝上的结果后,依然站在那里,我会在这个时候走到这位同学的身边问他“你是怎么做到的?”、“你平时都做些什么特殊训练,可以连续这么多次都做到反面朝上?”、“你是不是吃了什么特别的东西?”等,这些问题惹得全班同学哈哈大笑,因为他们目睹了整个过程,他们知道这位抛硬币得到6次都是反面结果的同学并没有什么特殊的技能,一切只是巧合。但如果脱离了这样一个环境,当我们目睹一些异常的事件发生时,我们总是会想:“没那么巧吧?背后肯定有什么原因。”但事情偏偏就是这么巧。

-- 完 --

© 版权归作者所有,转载及其他事宜请联系作者。

* * *

如果你想关注「知鱼」

这里有个二维码

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180305G0KPXE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券