科普:深扒——这几年很火的“大数据”

上一期我们分析了一下人工智能如今的发展现状,其中提到了一个问题:人工智能想要发展必须要依靠大数据的支撑,但是很多人对于这个“大数据”不是很了解,今天我们就一起来扒一扒这个“大数据”到底是个什么东西。

原理

不知道大家是否还记得我们以前推的一期“聊一聊GDPR及数据隐私的问题”这里面说到的厂商收集我们隐私的行为就是为“大数据”服务的,有兴趣的朋友们可以点开看一下。

大数据并不是单单指一堆冷冰冰的数字信息,而是一整套完备的体系。是通过对数据进行收集、存储、分析、处理从而变现的过程。它的意义不在于掌握庞大的数据信息,而是有意义地进行数据的专业化处理,换句话说就是通过“加工”实现数据的增值。由于处理的数据过于庞大,所以计算任务通常要用到我们常说的“云计算”来完成。(云计算:在处理收集而来的这些数据时,因为数据过于庞大,单个计算机无法负担完成计算任务,从而通过云技术来把计算任务分担出去,云计算是当下非常火的一种资源合理利用的方法)

在我们这个网络时代,网上每时每刻所产生的信息都是海量的,这么多的信息在科技公司眼里那可都是一本万利的买卖!这些数据只要一经转化其价值必然会蹭蹭往上涨,到那时他们就再也不用操心那每年都在亏空的财务报表了……

虐哭柯洁的阿尔法狗就是通过大数据的支持加上机器学习完成的,也算是人工智能的一种应用。我们都知道一个围棋棋盘横竖19条线,361个交叉点,合法的局面多达10的170次方还得乘2,要想下好围棋必须得会算,而阿尔法狗牛逼之处就在于“算”这一方面。

理论上来说我们只要把围棋的这10的170次方还得乘2的合法局面一股脑的全记住,那么我们在下围棋时必然会是无往不利的。想一想,我才下了一个子,你丫就已经把如何虐我的一千种方法想好了,那我还能有的玩儿吗?而阿尔法狗就做到了这一点。

简单解释一下:这10的170次方还得乘2的合法局面就是一种“数据”,而阿尔法狗通过“机器学习”的方法对于这些数据进行学习(导入)和存储再由计算机计算出如何虐我的一千种方法。(机器学习和云计算并不相同,下一期科普中我会为大家详细解释)

局限性

这就是一整套“大数据”的应用流程,好像听起来很牛逼的样子,其实它距离科学家们理想中的样子它还差的远呢!对于我们普通人而言,它也仅仅只是能够分析处理一些围棋、象棋这类规则十分明确的游戏,一旦遇到十分复杂的人类感情的话它就得懵逼。因为人类的思维时没有任何规律可循的,也就无法用逻辑去分析,机器学习也就废了一半。所以说它既能在玩游戏时虐哭你,同样也能在聊天时气哭你,阿尔法狗距离终结者还差着好几百个施瓦辛格呢……

在人类思维这里碰壁的科学家们自然不甘就此失败,既然无法分析那么我们就继续收集数据,总有一天能把你那奇怪的想法都收集全。然后各家语音助手都忙着和人类聊天去了……久而久之这些语音助手也就变得越来越聪明,懂的也越来越多了。

起源

关于大数据大家还要知道一个点:大数据可不是专属于我们这个时代的产物!只是随着网络技术的日益成熟近年来才逐渐进入了大家的视野而已,其实早在原始社会“大数据”就被应用到了人们的日常生活当中。当然那时候的“大数据”还非常初级,更多的是用来简单的记录哪里的猎物多,然后人们就到哪里去打猎。

再来说个稍微高级一点的:自古以来商人这一职业对于“大数据”一直是玩的最溜的,在商业发展中对于“大数据”的分析与运用一直就没停过,商人逐利,“大数据”在逐利这一方面可谓是无往不利,只要你的市场分析做对了,你就能赚钱。那些著名的大企业家对于这一点诠释的尤为明显,就像去年热播的电视剧《那年花开月正圆》中孙俪饰演的周滢与洋商的合作就是基于“大数据”对于时局的解读才最终拍板决定的。

关于大数据就先说到这里,大家有什么需要补充的欢迎来我们的公众号“百幕科技干货铺”后台留言哦(暂时没有开通留言功能,只能麻烦一下了)

图片素材:互联网

参考资料:百幕

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180807G07DUN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券