前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【我读《Big Data》】预测---大数据的核心

【我读《Big Data》】预测---大数据的核心

作者头像
用户1687088
发布2018-05-07 17:03:12
8020
发布2018-05-07 17:03:12
举报

正文之前

我最近老是喜欢开一本新书,然后写点东西但是读到后面就不写了。这个习惯不是很好啊,但是阅读的速度确实比输出的速度快的太多了。就好比这本《Big Data》 我都读到195页了。但是我写的读书笔记还在16页晃悠,心塞。不过还好吧。今天多输出点,当做复习好了~~~

正文


大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,被视为一种机器学习。但是这种定义是有误导性的。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。


在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。因为我们可以在巨量的历史记录里面对一件事情进行相关性判断,毕竟很多时候,我们判断的准则都要依靠着前辈的经历,而当我们所有的历史都被数据化以后,这些依靠着案例活下去的判断领域,怎么会需要人类来干活呢?就好比无人驾驶这话事情。当计算机能够判断出来每种环境下该怎么做出应对的时候,我们就不需要司机了。因为计算机的反应能力能够做到人类反应的几千上万倍。当然,无人驾驶离我们还有很多的技术难关需要克服!但是计算机系统可以发挥作用的领域远远不止驾驶和交友,还有更多更复杂的任务。别忘了你在京东买本书就会有一大堆的推荐跑到你的购买页下面。

就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。


大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法。

  • 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。全世界目前感觉都进入了大数据的“军北竞赛” 各种各样的授权,数据采集协议迷晕了我们的眼睛。传感机技术空前发达,存储成本不断下降,存储密度千万倍上升,大数据的成本较之小数据时代下降了千百倍。
  • 第二个改变就是,研究数据如此之多,以至于我们不再热衷于追求精确度。不是不追求精确性,而是暂时还没发追求精确性吧?能精确我们当然要求精确,但是对于推荐系统的使用者--也就是用户来说,是不存在精确的,只能说准确率很高这种话,比如我今天买完《疯狂Java讲义精粹(第2版 附CD-ROM光盘)》,旁栏就会出现很多的类似的讲义,java学习教程等等,但是我现在突然看到旁边有人在看《C++ Primer》 所以我想买一本,这个事情是不存在与数据库中的,全世界独一份,总不会在一分钟前有一个人也买java 然后看到旁边有个人,也顺手买了本《C++ Primer》,然后被系统捕捉到按照这种清奇的线路给我推荐吧?那只能说是命了~~
  • 第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系。(这一点翻译的作者对于原作者不是很赞同,我也举得如此,因果是保证准确性的基础之一,太多的领域还是需要精确新的。大数据目前能影响到的也就是大局上的把握,对于细节是没法准备的评估的,就好比我们可以给所有买java讲义的人推荐 Android讲义一样,但是你没法追求二者之间的因果关系,因为这是大数据对长期的人类购买行为的一种记录,还是完全遵循着计算机的准则,没法跳出限制,而人类的思维是永远无法准备的捕捉的。如果计算机始终为人类服务,那么就只能逼近,而无法正确预判)

如果数百万条电子医疗记录显示橙汁和阿司匹林的特定组合可以治疗癌症,那么找出具体的药理机制就没有这种治疗方法本身来得重要。同样,只要我们知道什么时候是买机票的最佳时机,就算不知道机票价格疯狂变动的原因也无所谓了。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。在这些不需要追求更深层次的发展的方面,大数据确实够用了。而且对于从经验时代到大数据时代的过渡期人类来说,大数据的准确度让人着迷,但是如果我们要寻根问底。那就不好说了。做物理实验,如果只是追求99%的准确度,那么后续的实验又会有一个1%的偏移量,当多次累加,直到我们一门基础学科之上的学科的建立的时候,准确度可能已经不足50%了。复利效应的反效果~


(PS:~下面这段话是作者说的~? ,我对此还抱有疑虑,毕竟大数据本质上来说也是经验之谈,因果是可以捕捉到未来的!当然,我更希望是相辅相成的局面,好比当年的海王星的发现,要是没有诸多的观测数据,从而推测海王星的存在,我们可能至今对太阳系的认识还存在巨大的缺陷,但是如果没有依据因果关系存在的物理学的计算,海王星是很难被观测到的)

寻找原因是一种现代社会的一神论,大数据推翻了这个论断。但我们又陷入了一个历史的困境,那就是我们活在一个“上帝已死”的时代。也就是说,我们曾经坚守的信念动摇了。讽刺的是,这些信念正在被“更好”的证据所取代。那么,从经验中得来的与证据相矛盾的直觉、信念和迷惘应该充当什么角色呢?当世界由探求因果关系变成挖掘相关关系,我们怎样才能既不损坏建立在因果推理基础之上的社会繁荣和人类前行的基石,又取得实际的进步呢?本书意在解释我们身在何处,我们从何而来,并且提供当下亟需的指导,以应对眼前的利益和危险。


正文之后

最近被自己的咸鱼深深困扰着,这几天看了两本小说---<大王饶命> <重生之大涅槃> 第一本是真的精彩至极,第二本,勉强8分吧。强行装逼之嫌~ 第一本浓浓的逗比风格让我很是可乐,推荐大家也去看,有311章了,可以收割了~

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 工科狗和生物喵 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 正文之前
  • 正文
  • 正文之后
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档