-第62篇-
(本文瘦身版发表于《科技日报》2019年8月21日)
“数据垄断”四个字最近很常见,大概指的是正处于反垄断风口浪尖上的那些互联网大公司(Big Tech),“垄断”了我们的数据,据说这样会导致很严重的后果。
从“数据垄断”这四个字本身我们可以解读出两层意思来:
首先,数据是很有用的东西,要不人家垄断它干什么?
其次,数据是可以被垄断起来的,这里的“垄断”意为“独占”,数据被某些公司独占了,别人用不到。
数据有什么用?
单纯的数据本身什么用也没有,不信你看:
这就是个数据,你什么也看不出来是吧?
“40岁”,这是个年龄,指一个不再年轻的年轻人,或是一个还不是很老的老年人。
“40元”,这可能是一个价格,也可能是一笔收入。
“40度”,如果指的是体温,此人在发烧;如果指的是一杯水的温度,此水现在有点烫。
所以呢,数据本身什么信息也不包含,必须和其他产品、服务、活动结合起来才能够提供有用的信息,
当我们把大量数据集中在一起,奇妙的事情发生了。
前几天闹台风,大家时刻盯着手机上的一个页面:
“台风实时路径”,预报准确度很高。正是因为有了这样的气象预报,我们才能够提前防范,减少损失。
台风路径预测的背后,是气象部门依据无数的数据在不停地计算分析。
再比如,每天上下班的时候,打开地图APP看看交通拥堵情况:
这些红色、黄色、绿色的线条能够使我们避开拥堵路段,快点回家。
这也是基于成千上万个车辆的位置、速度等数据计算出来的结果。
滴滴在济南和交警部门合作进行了个“试点”,接管几条主干道上的红绿灯,按照拥堵状况实时调整信号灯时长。路口有屏幕显示“绿波速度”的速度。
如果所有车辆都按照这个速度前进,那么可以一路顺畅地快速通过多个路口。改善拥堵的效果很明显。
这么好的结果如何实现的?靠的是路上行驶的车辆中的APP数据,再加上交警部门的数据。
这便是数据的第一个作用:揭示出个体信息无法体现的整体规律。
数据的第二个作用我们天天见:提高既有市场的交易效率,最简单的就是“匹配”。
搜索引擎、电商平台、外卖平台,其实做的都是这个事。
交易双方的数据越多,匹配的效率就越高。
不过这只是理论上的结论,匹配效率最高的状态不见得就是平台利润最大的状态。
对于平台而言,匹配效率显然没有利润那么重要。
很快,掌握了大量数据的科技平台不满足于只是匹配现有的信息,他们更要基于用户的个体信息提供“个性化服务”,这是数据的第三种作用。
这个领域做得最彻底的当属亚马逊已经申请了专利的“预发货”系统:
亚马逊通过你之前的消费数据,推断出你在未来的几天会买什么东西,然后安排发货。
在你真正下订单的那一刻,你的包裹可能已经在路上,可能已经在离你家最近的配送站点,还可能已经在站在你家门外准备敲门的快递小哥手里了。
“比你自己还了解你自己”,这是大数据时代很正常的现象。
和超级电脑相比,人脑的数据处理能力显然不是一个量级。
至于“个性化定价”、“个性化推荐”之类,和亚马逊的“预先发货”相比,只能算小儿科级应用。
不过很奇怪的是:
如果一个消费者因为大数据的引导,多花了钱,感觉很气愤;
可因为大数据的引导,多买了几件东西,却好像没什么意见,其实这两种行为的实质是一样的:“大数据杀熟”。
数据的以上三种作用还都是辅助性的,下面这个才是数据的“杀手级应用”:基于数据的全新产品和服务。
基于数据的创新
苹果表上有个很冷门的功能“跌倒报警”,如果你意外跌倒,会提示你是否需要报警,简单确认后会拨通事先设置好的急救电话。
这一功能就如同汽车上的安全气囊,我们希望永远也用不上,但一旦意外发生,它可以救命。
它可以判断出你是自己蹲下的、趴下的、躺下的,还是意外跌倒的,依据的是苹果表上十几个传感器的数据计算的结果。
这就是数据创新的价值:关键时刻能救命。
这个表现在还可以测你的心电图,并且已经获得了FDA的批准。
这些数据长期积累下来,对于了解掌握一个人的身体健康状况,该是多么有价值的东西。
无人驾驶也是数据创新的好例子,车辆能够实现无人驾驶,靠的是车辆上下四周的多个传感器时刻收集周围路况的数据,经过计算,得出最优的驾驶策略。
造个车不难,造个能自己开的车,就难了;
造个自己能开还能停的车,难上加难。
让科幻电影中的场景成为现实的,还是数据。
“知人知面不知心”,一个人的“信用”是个很难准确量化的,可是却又经常需要知道,比如谈生意的时候,还有相亲的时候……
可有人就想法弄出来了,不仅弄出来了还算出数来了:
不仅算出来了,还越来越有用,这就了不起了。
“信用分”也是一个基于多种数据的新产品,完全彻底的创新。
期待这个数字能早日从“财务信用”,扩展至一个人全方位的“信用”。
那样的话,相亲、招聘、面试的时候,无需多言,一亮分即可……
数据到信息:生产过程
以前我们企业分成了两种:劳动密集型,和资本技术密集型。
现在有必要加上第三种了:数据密集型。
数据大致可以分成两类,一类是象城市里的道路分布、某个区域里有多少幢楼、某个路口一天有多少人来车往这样的,可以称为“公共领域的数据”。
这类数据谁都可以获得,无法垄断;
第二类是公司自己生产经营过程中产生的数据,平台每天的成交数量、一家餐馆每天卖出去多少份菜、平均每桌花了多少钱等。
这类数据本来就是公司自己的,也无所谓垄断与否。
所以,“数据垄断”本身就是个不成立的伪命题。
更重要的是,从无用的数据到有用的信息之间,需要经过数据的收集、处理、存储、分析过程,这是一个不折不扣的生产过程。
数据的生产有两个特点:
数据量越大,成本越低,效果越好。
数据种类越多,成本越低,效果越好
因此对于数据密集型行业而言,数据的集中能够提高数据生产的效率。
以前“玩数据”是很烧钱的,一般的企业玩不起。
现在不一样了,有了这些专业的“云”,自己想上个天玩个云成本大大降低。
数据密集型行业的竞争在数据的总量、类型、处理分析能力、应用开发等层面展开,数据的集中将是行业发展的必然趋势。
数据不能被垄断,但可能被滥用
大家忧心忡忡的“数据垄断”很多时候指的是“基于数据的垄断”,并不是对数据本身的垄断。
不久前的8月17日,欧盟正式发起了对亚马逊的反垄断调查,核心问题正是数据。
亚马逊身兼二职,既有自营业务,也有第三方业务。
在亚马逊上开店的第三方商家数据显然要对亚马逊开放,第三方业务和亚马逊的自营业务构成直接的竞争关系。
欧盟发现亚马逊很可能利用这些第三方商家的数据,对他们实施了不正当竞争行为。
此案正在调查中,结果怎样我们拭目以待,其结果很可能对国内的电商行业具有很强的借鉴意义。国内有一家电商平台的情况与亚马逊十分接近。
还有一个已经结了案的:
Art和Trod是两家卖招贴画的商家,他们都在亚马逊上开店(怎么又是亚马逊,今天算是和亚马逊杠上了)。
他俩写了个程序,可以自动获取对方商品的价格,然后和自己的同样商品价格比较,然后程序自动调整,保持价格一致。
具体算法据说很复杂,但目的很简单:价格合谋。
这是最古老的垄断行为,没有之一。
从以前行业大佬们面对面的合谋,到如今基于数据的算法合谋。
上百年的陈酿装在不同材质的瓶子里,味道还是一样的:
竞争对手之间通过合谋消除竞争,你好我也好,就是消费者不好。
正因为如此,“合谋”也是目前在反垄断中唯一依然适用于“本身违法原则”的行为。
不需要界定相关市场、不需要判定后果、不需要计算损害,有此行为即是违法。
数据本身是无法被垄断的,但是在一个数字化和大数据时代,数据却可能成为垄断和不正当竞争行为的帮凶。
数据可以让这些违法行为更加隐蔽、效果更好,对市场竞争和消费者福利的损害也就越大,这才是我们需要关注的。
苹果-电子书垄断案全集:
竞争者的垄断梦,都是原创。
领取专属 10元无门槛券
私享最新 技术干货