首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据依赖,是良方还是毒药?

大数据时代,

数据似乎具有统治一切的魔力。

但凡涉及到决策,

人们首先想到的就是找数据。

数据变得和中国香港电影里的总部一样可爱、可靠,

遇到难题,

第一时间总是呼叫总部,请求支援。

如果是涉及到大众群体的决策,

那寻求数据支撑更是成了一种政治正确。

没有数据支撑就做出决定,

总是会被人指责为拍脑袋决策。

在这些场景中,几乎所有人都患上了数据依赖症。

但是,小蚂蚁看来,

依赖数据,与其说是决策优化的结果

不如说是决策退化的结果。

数据依赖症,实际上是数据妄想症。

第一个质疑就是,数据可靠吗?

根据数据作决策至少要经过两个信息传递过程,

也就是采集数据,以及使用数据。

在数据采集过程中,

意见表达、信息传递行为均有可能出现信息丢失或失真的情况。

尤其是问卷调查之类依赖人力进行的数据采集,

仓促、随意甚至故意扭曲的反馈更是普遍现象。

俗话说,差之毫厘缪之千里,

依靠这种方式收集的数据,

其质量难以得到保证。

数据就是餐厅的菜,

采集数据就是厨房的烹饪,

如果厨房和厨师缺乏透明度,

即使端出来的菜品看上去光鲜靓丽,

也难保卫生、可口。

二,数据充分吗?

在使用数据进行决策的环节,

除了受制于数据采集的质量,

还要受制于数据的来源和范围,以及对数据的挖掘结果。

现代社会,

信息产业高度发达,

数据量确实远远超过以往。

但是数据来源和范围是否足够,

数据的颗粒度能否匹配决策需要的认知程度?

这些问题依靠数据本身似乎无法得到满意的答案。

在数据挖掘上,同样存在疑问。

机器学习中常用的欠拟合与过拟合这两个词汇就暴露了这种窘境,

欠拟合指的是对数据隐含特征的挖掘并不充分,

比如只知道人有四肢,但并不知道如何区分手和脚,

导致把猪、牛、羊也当成人了。

而过拟合则是指对数据特征的挖掘过火了,

比如发现大部分人都戴了眼镜,就以为未戴眼镜的就不是人了。

第三,最重要的决策本身。

数据是什么?

究其本质,数据其实就是个体的意见。

以数据为依据进行决策,

从形式上来说,扩大了决策的认识来源,

也就是将决策依据由精英主义的个体认知变成群体性的大众认知。

将个体决策变成群体决策

而大众认知,只能是群体的平均认知,

绝无可能达到领先水平。

但精英主义的个体认知,却有可能超出大众的认知水平。

将个体决策变成群体决策,

实际上就是一种放弃冒险的价值选择,

至少在探索性的创新活动中实际上是一种退化。

决策既是一种权力,更是责任重大的光荣使命。

依赖数据进行决策,

在扩大认知范围的同时,也是在让渡做出判断的责任。

在某种意义上说,数据依赖,毋宁说是一种风险转移。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181222G0557J00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券