首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

大数据时代下的思维与生存巨变(二)

按:Viktor和Kenneth的这本《大数据》全名是《Big data- a revolution that will transform how we live, work, and think.》如标题所示,全书论述了大数据将给人们思维模式和社会生产力模式带来的转变。8.1分的好书,适合当下5年内各年龄层人阅读,2018年3月28日阅毕。书中提出:“大数据的关键是规模,核心是预测(及其带来的反馈和学习);精髓是三个转变:样本增大、精度下降和因果关系变弱。”本系列读书笔记分为四章:一、因果主导的关系转为相关关系;二、大数据时代下的思维变革;三、大数据时代下的商业变革;四、大数据时代下的管理变革。以下是第二部分,也是全书论述的重要部分。

Part two

大数据时代的思维变革:更多、更杂、更好

放弃因果关系,寻找“关联物”是预测的关键。

1、更多:不是随机样本而是全体数据。

在小数据时代,由于数据量有限,运算方法只能致力于以“最少数据获得最多的信息”,因此“随机采样”盛行。大数据时代开启后,我们进入“全数据模式”,这时的运算样本不再是随机抽样得到,而是“样本=总体”,这一全体数据时代的来临,意味着人们可以“从多维度考察细节并进行新的分析”,因此,“让数据本身发声”就成了大数据时代的工作基础。

2、更杂:不是精确性而是混杂性。

事实证明,“随着数据增多,大数据的简单算法比小数据的复杂算法更有效。简单的最大化算法较之其它算法提升最快,大数据的简单算法优于小数据的复杂算法。”由于简单的大数据计算优于复杂的样本计算,因此,对数据的全面采集能力就成为当前的迫切需求。

伴随科技进步带来的芯片成本下降、质量提升,数据采集和存储能力大大提升。数据采集的井喷式发展带来了数据的的混杂和不精确。

适应大数据时代,就必须适应数据的“更杂”,接受“规整的传统数据库转向非关系型数据库”。新的数据库设计的诞生,在新的数据库中,“混杂是关键。纷繁的数据越多越好,混杂性不是竭力避免,而是标准途径。”因为“想要获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。”以翻译软件谷歌的“训练集”和当下搜索引擎由“涉及索引转向任意搜索”为例,“更杂”的数据事实上更有用。

适应大数据时代,就必须适应数据的“错误”。“传统数据库设计要求在不同时间提供一致的结果,而大数据不刻意同步更新,这充分展现了大数据的多样性。”因为数据转化往往会丢失数据全貌,因此,新的数据库就必须允许不精确,允许格式不一致,即便存在混杂性、错误率上升的情况。例如“拥抱混杂是zestfinance得胜之道。”“越精确越好”的理念正变为“快速获得大概的轮廓和发展脉络优于严格的精确性”。当然,“错误性并非大数据本身固有,而是用以测量&交流数据的工具的一个缺陷,这将会是一个长期存在的阶段。”

3、更好:不是因果关系而是相关关系。

书中认为:“大数据在改变人类探索世界方法”。由于大数据将关联关系直接且迅速地反映出来,有许多关系是无法用因果关系来解释的,因此,逐渐地,人们将由低效率的“因果关系”中跳脱,进入快速的“关联关系”,改变将从操作方式开始,人们解决问题的方式将不再是提问“为什么”,而是只需从数据中寻找答案“是什么”。而寻找“关联物”则是预测的关键。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180524G1WLPA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券