炙手可热的大数据是“泡沫”吗?

在互联网行业,你如果不能随口分析目前的大数据发展状况,估计你会沦落到鄙视链的最底端。即使在传统行业,数据意识也成为从员工到管理者眼中最具潜力的驱动力量……目前大数据的火热程度可见一斑。

我们都在说大数据,大家都在挖掘大数据的潜在价值,又有人提出,大数据太过于热,产生了大量的泡沫。甚至有人说这个泡沫破灭之后会出现前所未有的萧条。

目前很多企业都在布局大数据,无论是数据的直接价值的使用,还是用间接用数据促进增长、做决策……

那么大数据到底是不是泡沫呢?我们来看看Michael Jordan的看法

作为IEEE fellow,伯克利的Jordan教授是机器学习世界范围内最被尊敬的专家之一,在2013年还被邀请在美国国家研究委员会对相关领域的报告里作序总结。

Jordan认为有些媒体为了让公众容易理解打了些比方,但是这种比方造成了太多误解,进而造成了太多hype(夸张的大肆宣传)。大数据还是一个没有足够严谨程度的科学,可能有一定的概率做出一些有用的预测,但是使用不当,过分过早地依赖,则会造成灾难性的后果。

很多时候大家过早对一个技术爆发热情,寄希望她可以改变世界,如果短时间没有成果,有可能热情一下子转冷又觉得这是个错误,加速抽离给这个技术的资源。显然Michael很担心现在公众对这个技术的热情,并不是基于对这个技术的理解,从而有可能会经历这样的态度转变。但是他认为这个领域是现实存在的,很多重要的应用,是会创造价值的。

当然Jordan认为目前大数据还有很多不太成熟的地方。

1. 目前的大数据给出的结果可靠性太低,如果急于应用到实际中,就好比是土木工程都没学好就开始造桥,结果只能造出“豆腐渣工程”

一大波假阳性正在接近,因为数据增长的速度不够支撑我们把大数据到处乱用的欲望;

作为一个科学,不够严谨。不像造桥的土木工程,经过多年的积累,明确地能告诉我们什么样的情况可以造,什么不可以。而大数据没有。

2. 目前在computer vision领域进展还很小。

只能在非常有限的范围内识别,比如人脸识别这样非常具体的引用(虽然这个不是直接说大数据,但是可以看出,作者认为真正做到万物都sensor还很远,大数据的采集能力终究还是有限的)

3. neural network根本和人脑的neural network不是一回儿事,我们对大脑的理解根本没到可以引用到计算机科学的程度。

现在deep learning所采用的back propagation技巧,明显不是大脑的运作方式;

network的结构都完全不同,什么对数据的模糊性处理已经达到人脑的境界云云,主要是媒体扯谈。

从某种意义上来说,大数据本身并不是泡沫,我们可以亲身体会到它为一些行业带来的巨大价值,目前是以互联网、金融等行业为主,但以后将会有越来越多的行业受益。

真正的泡沫是什么,是本身并不具备大数据技术,没有实际应用大数据但却成天鼓吹大数据的群体。

的确目前大数据的发展的广度和深度都还有很长的路要走,由于技术的不成熟也无法让人们完全地依赖,但是就算是这样其实际的价值和具备的潜力都让我们坚信不疑。

引用下大牛Simon Matthews的话来说

“Big Data is like teenage sex: Everyone talks about it, nobody really knows how to do it, everyone thinks everyone else is doing it, so everyone claims they are doing it too”

大数据就像青少年性行为:人人都在谈论它,没有人真正知道如何去做,每个人都认为别人都这么做,所以每个人都声称他们也是这样做。

大数据从本质上说,是人类认识世界的方式进一步发展,以数据量化的方式,发现事物发展变化的规律和趋势,进而通过有效干预,推动事物向人们预计的方向发展。从物质基础上分析,大数据是人类社会进入信息化、网络化时代,发展到一定阶段的产物,是科技推到社会发展的又一社会现象,其社会效益,经济效益将不断显现。具体到个人,就是把握机会,顺势而为,实现梦想。

- DataCastle -

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181127A0N7OU00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券