吴甘沙:既然不能避免个人数据泄漏,何不做自己数据的CEO呢?|高峰论坛

本文由未来创客(futuretrek)根据峰会内容整理,未经授权禁止转载

6月18日下午,湛庐文化·未来创客在清华大学学经管学院伟伦楼一层报告厅,举办了题为“数据风暴中,谁将成为下一个产业颠覆者?”的大数据应用创新高峰论坛,本文为因特尔中国研究院院长吴甘沙先生的演讲内容整理版。

文章有点长,但小创强烈建议一定要认真阅读。现在谈论大数据时,我们往往是从商业角度探讨这一话题,但吴先生却更多地从大家更关心的个人隐私角度来分析问题。在这个互联网日益发达的大数据时代,一个人不可能很好地隐藏自己的数据,那么我们就应该学会主动管理自己的数据,做自己数据的CEO,让数据为自己创造财富。

今天我会跟大家讲一个非常特别的话题,关于个人数据的隐私问题。过去讲了很多的大数据,更多是在企业、互联网,甚至过去花了很多时间讲开放数据创新,讲政府应该把数据开放出来,现在大家已经看到中国的政府,尤其是一些地方政府已经开始把数据开放出来。当然,这不是我说要讲的重点,只是跟这个事情有因果关系,这是大数据的相关性。

我觉得现在是时候开始讲一种新的大数据,就是个人数据。大家看这个题目有点out,叫做“你是数据,我即生意”。什么意思呢?你也许现在已经不是物理人,而是你的数据呈现出来的生命体。而我是数据,我不再是某个公司的员工,我自己就是一个生命,我是我自己的CEO,我能够去货币化自己的数据,我做我自己数据的生意,这是一个比较独特的话题,如果你能认真听完我的演讲,这对你来说或许是一个新的商机。

个人数据究竟是谁的?

首先,我想跟大家探讨几个问题。

第一个问题,就是你是不是真正的拥有你自己的数据?拥有,我使用的英文词是own,它有几层意思,先用它的第一层意思,你是不是真正拥有你自己的数据?可能有不同的答案。很多人回答说我并不真正拥有我自己的数据。

为什么呢?大家不是说数据是石油,数据是资产,数据是货币,数据是原材料,数据是值钱的东西。但问题是,这是谁的资产?谁的货币?谁的原材料?我感觉不是我的。我的数据不是我的资产,这是现在大家很多人有的这么一个考虑。

当然还有很大一部分人,他回答说,我真正确实是拥有我自己的数据。但这不是好事,怀璧其罪,我因为拥有我的数据,我真正体验了很多的麻烦,这些数据给我带来了麻烦。比如说隐私的问题,其实我们现在跟很多年轻人谈隐私的话,他们不能感觉到这对他来说是一个问题。他觉得我又是一个爱看A片的中年大叔,我也没有同性恋,没有HIV,我又担心什么呢?但事实上,你换一个角度去看,也许你就能够理解到隐私对你的影响。

比如说你在用你的电脑时,有个人在你的背后看着,你是否会感到不舒适?这就是一个隐私的问题。事实上,当你在互联网上冲浪,在使用手机,在到处行走时,你留下了数字足迹,这里面有你的很多隐私。所以隐私的问题,给大家带来了困扰。

当我在网上购物时,留下了我的很多信用卡信息,这对我来说,可能是一个financial risk。很多人目前并不那么认为,我给大家讲一个故事。我有一次到一个地方去开会,住在一个很高大上的酒店,把信用卡给服务员预收款,把东西放到楼上以后,就去下面吃饭,吃完饭以后,在付款的时候,我突然脑子里面出现了三种选择,第一种选择是拿现金付款。第二种选择是我拿信用卡付,同一张信用卡,或者是说计入房费。或者我用另外一种信用卡?为什么会出现这种考虑呢?我用现金付款,我的隐私泄漏最少,但是少掉了一些信用的点数。如果计入房费呢?也不错,但是这个酒店更多的了解了我的行为,他不但知道我入住的行为,还知道我隐私的行为。如果我用另外一张信用卡付呢,未来我来这个连锁酒店时,由于它对我的了解又不够,没办法给我提供更贴心的服务。

我回来以后跟我团队的人探讨这个问题,有少数人选择现金。有一半非常注重隐私的人,他就选择了用另外一张信用卡。而另外一半希望得到更好服务的人,选择计入房费。不同的人在这个上面有不同的考虑。

还有就是这么一个SPAM,英文有两层意思,一层意思是一个午餐肉罐。还有一个是垃圾邮件,垃圾短信。这也是人类历史上非常重要的发明,应该是在上世纪70年代发明的一种新的营销方式,那时候互联网还没出来,是APA.NET,在90年代的时候,SPAM一度占了很大一部分。

除它之外,还有一个精准营销的问题。商家说我不是胡乱地给你发东西,我是基于我对你行为的理解。基于我对你的画像,来对你进行精准营销和微营销。这按理说也是很好的事情,但问题就在于亲密感和令人发指之间这条红线怎么划分。这让我很烦恼,我浏览网店的时候,把有些货物放到购物车里面,但没有去买,我可能是在京东上做了这个东西。后面我浏览任何网页的时候,就有一个广告老是跟着我,在问你是不是对这个东西感兴趣?你因为某种原因没买,后面这个广告也会不停地跟着你,希望你再去买。但他不知道,事实上我可能已经买了,这就是对我们带来的困扰。

问题来了,你到底在乎吗?不在乎吗?

这个东西即使在技术圈子里面知道的人也不多,叫Do Bot Track,这是浏览器的一个功能,最早是在开源的浏览器里面。后面微软的跟进,最后Google也开始支持。当然Google是很不情愿,一旦把这个打开了以后,它的广告就没办法对你进行精准的营销了。但问题是在于,圈子里面很多人都不知道这个功能,事实上知道这些功能的人,他也没有打开。

另外,大家知道现在量化自我这么一个运动非常火。很多人都戴上手环,这是一个非常著名的手环,它说我会把你的信息给其他人。而且我不能百分之百保证你信息的安全性。但是用户是不是真正在意呢?用户看都没看,就点接受。所以从这两个例子上看,是不是我们大家对于隐私,对于这个数据是不是属于我?数据的安全真正很在意呢?好像是不太在意。

确实也有牛人支持这种观点,凯文·凯利就说在这个互联的时代里面,把自己藏起来是要付出代价的,你把自己的隐私送出去越多,那你获得的服务就越好,这就代表了一个很普遍的观点。

小创:KK虽然是未来学家,但平时不用智能手机,这个观点有些站着说话不腰疼啊喂!(#`O′)

当然也有持不同观点的,比如杰伦·拉尼尔,他是虚拟现实的先驱者,他说你以为你把自己的数据给了那些人,就能获得更好的服务吗?如果这个在线书店能够更多地了解你,了解他,我就可以做差异化的定价,你买这个东西可能要付出的钱,要比其他人买付出的钱要更多。所以他了解了你,并不一定说你能够获得更好的服务,你也许要多付钱,这是两个完全不同的观点。但这是思想家的观点。

我们再看看普通人,这是美国宾夕法尼亚大学做的研究。三个问题,第一个问题,如果说这个商家愿意给你折扣,你愿不愿意无条件地把你的数据给这个商家?这是第一个问题。我想了解一下在座的各位不同意的举个手?可能有一小半朋友在获得折扣后,还是愿意把你的数据给这个商家的。

第二个问题,如果说这个商家愿意给你提供免费的wifi,比如说星巴克给你提供免费的wifi,它会跟踪你上网的行为,来了解你的一些偏好,你愿意还是不愿意?请不愿意的举一下手?也差不多接近一半。

第三个问题,我这个商家是真正地希望能够给你提供更好的服务,所以我可能是需要能够了解一下你的一些数据,估计大家的接受度也是差不多一半。

看看美国的调研,绝大多数普通人事实上是对于自己的数据还是很在意的,并不是因为你商家提供一些小恩小惠,它就愿意把自己的数据无条件地给出来。

所以我今天这个演讲的目的,就是希望大家能够端正一个态度——在大数据时代的一个态度,你不要又不愿意又去忍受,甚至是有些人有斯德哥尔摩综合症,你应该是有一种新的态度。你这个新的态度,也是用了own这个词,你对你自己的数据负责,这是你的数据,你要对你自己负责!

面子,还是里子!

那这个态度核心就是两个,一个叫面子,一个叫里子。面子就是你要真正地去在意你的身份问题,而里子呢,你真正事实上是可以从这个数据里面赚钱的。

先说面子的问题,也就是我标题的前一半,你就是你的数据。你的物理外貌不是特别重要,真正重要的是你的数据呈现出来的。

我们现在知道,比如说我在这里,大家能够看到我是这么一个人。但同时呢,我又有一个数字的影子,叫数据画像。我这个数据人包括了很多很多的东西,比如说数据的足迹,每个人在冲浪的时候,留下了很多数据的足迹。甚至不带手机,在现在的这个社会里面还是会留下很多数据的足迹,北京有一百万个摄象头,你每天至少能够在摄象头里面出现个十几次。

还有现在量化自我,我们要量化我的生理状况,量化我的心理状况,而这些东西都是数据。我们有各种各样不同的数字身份,我们在不同的网站上面,以不同的ID登录,不同的ID还带着不同的密码。前几天我看到一个帖子,他说有个人挺有意思的,他公司要求每三个月改一次密码,所以他就设定了一个很有意义的密码,未来三个月我要怎么改变我自己,怎么来实现我的人生目标,然后我就把这个作为我未来三个月每天登录时候都要输入的密码,蛮好的事情。但是这里面暴露了你的一个目的,暴露了你做事情的意义所在。

还有社交威望问题,我们每个人在社会上,在这个数字世界里面慢慢在培养我的社交威望。在国外有一家公司叫Klaut,会量化你的社交威望。如果是38,非常不幸,为什么呢?你满40的时候,就可以到机场用贵宾休息室了,但你的社交威望还差一点点。

还有你的信用,现在互联网的征信非常广,它的一个理念是什么呢?所有的数据都是新的,这是国外的一个信用评分机构,这个人是700时分很不错,你这个分数可以在P2P的网站Lending Club上借到钱。

还有各种各样的消费行为,价值取向都反映在我们的数据当中,所有电商公司都会对个人进行刻画,你是一个什么样的人,他可能把你刻画成一个中产阶级,有孩子,花销起来精打细算,你会被录入到不同的桶里面,你就是被帖上一个桶的标签。我看到一个最有意思的桶叫“右键一组”,这些人对于技术有非常高的敏感度,跟其他的一些人又不太一样。所有这些组合起来就是你的数据人。

而你真实的人跟数据人是能够相互作用的。一方面,你不断地被量化,被不断地去掉噪声,最后真实刻画成这么一个数据人,或者是你的数字影子。

另外一方面,因为它是一个数据人,他会无时无刻被大数据所影响。刚才说的Facebook,他要控制大家的情绪,就是一种影响。甚至是我们在亚马逊上面买书的时候,你会参考、推荐,这样一种个性化的推荐,就是大数据对你数据人的一种影响,个性化推荐本身是一个矛盾的修辞。说是个性化,但是它的结果又是把你变成跟其他人越来越相似。所以在这么一个虚拟世界里面,你的数据人不断地在变。而这种变化呢?又会反馈到你真实的人上面去,所以你的真实的人和数据人相互作用,循环往复、不断变化。

这样导致一个问题,你越来越依赖于数据的你,而数据的你会给你带来麻烦。你点背的时候,第一个要考虑的不是怨社会,而是要怨数据,互联网、大数据永远把你忠实地记录下来,而且不能擦除,几十年前犯的一个事,现在还能用搜索引擎把它搜出来,永远跟着你走。

第二个数据会被滥用,有个老大哥会有你的数据,会滥用你的数据。

小创:说得很现实,丝毫不像是危言耸听,BIG BROTHER IS WATCHING YOU! 如果一个人没有隐私,那和生活在一九八四里有什么分别!

还有数据可能会带来歧视。它因为一些数据歧视你,给大家举一个例子,还是互联网征信的,它会对每一个人建立一个信用的模型,而这个信用模型里面用什么数据呢?比如说你是金牛座的,那你很有可能在统计意义上面比处女座的人,借钱不还的概率要高一点。或者你这个人老是用IE6,我就认为你是常去网吧上网的人,没有正当的职业。如果老是半夜两、三点上网,没有正当职业,信用降低一点。如果上班都在这个IP地址上网的,突然换了一个IP地址,是不是失业了?

还有一个预测的困扰,刚才讲到未来预测是一个很重要的大数据特性,它有可能预测十几秒以后,你会买什么东西。这还想起来不错,但它也会预测你几十年后,会有什么样的毛病?如果说你几十年后,有40%的概率会患上某种癌症,那保险公司就不太愿意给你保险了。大家看过一部电影,叫做《少数派报告》,里面有个情节,一堆警察破门而入,他说我是哥伦比亚刑审预测犯罪的人,预测你会犯罪,所以预测也会给我们带来麻烦。这是面子的问题,我们要认真地经营这个数据人。

经营的一个目的是什么呢?目的就是把我们真正变成我自己的生意,我真正地去own自己的data。

上面这句蛮有意思的,它说I AM NOT A BUSINESSMAN,这是歌手JC说的,别把我当做生意人,我自己就是生意。一定要让大家有意愿去做,为什么要去做呢?这还是拉尼尔给大家秀了两张图,一张是钟型曲线,绿色部分是高收入阶层,很有钱,但是少数。红色部分是贫穷阶层,也占少数,中产阶级是占绝大多数。

但是现在互联网让中产阶级尾巴化,互联网有一个理念是什么?叫赢家通吃,老大、老二能活,老三就必须死。它赢家通吃了以后,把财富完全攫取在它的口袋里,而中产阶级就是那儿的常委。为什么?拉尼尔给头部那些人取了一个名字,叫塞壬服务器,古希腊神话里面的海妖。所以那些互联网的巨头,给你免费的服务,给你精准的服务,让你把这个数据给它,它越来越富,你越来越穷。

我们要看看互联网是不是做错了什么?首先一个,互联网本身网络是去中心化的。但是数据变得中心化了,这是一个问题。

第二个网络本身是非常开放和自由的,而且我们可以通过社会化的服务,把我们一些创新的门槛降低。但问题是在这个过程当中,数据使用是不透明的,数据使用缺乏信任,我们能不能去改变这么一个现状?

首先,法律法规应该先行,也就是说,我怎么能够利用法律法规来保障我的数据由我做主。第一是数据的拥有权,到底谁真正拥有这个数据。我们很多数据是我主动给出的数据,拥有权肯定在我。比如说我登录一个网站,填入了我的私人信息,这个数据的拥有权在我。还有一些数据是观察数据,我是被观察的人,而其他人是观察的人,那这些数据是属于观察的人,还是被观察的人?还有一些数据是推理出来的数据,这个数据拥有权属于谁?如果说我不幸挂了,这个数据拥有权能不能继承或者转移?如果两个人离婚了,那这个数据拥有权怎么定义。

第二点是数据隐私权,什么数据是一定不能给你看的。第三个是数据许可权,这个许可权是可以撤销的,可以转移的,今天在Facebook里面,明天不想在这个里面待了,把数据全部拿出来,转到腾讯里面去。第四是数据审计权,我能不能去审计你对我数据的使用。

最后一个是数据分红权,数据有一个外部性,当时我采集的时候,是为了这么一个目的采集的。但未来它可以服务于另外一个目的,反复产生新的价值。对于未来产生新价值的时候,我能不能分红?所有这些需求都是需要法律保障的。在中国这些东西还缺位。甚至美国和欧洲定义的也不完整,这个是需要未来十年去解决的。

这有两个东西,两手都要抓的,一个叫做商业模式,另外一个叫做技术,你必须有好的商业模式和新的技术,来去解决数据可控的问题,解决数据在一个信任缺位的世界里面,怎么能够去产生价值。

商业模式第一个就是要定价,对数据要进行定价。这是金融时报给的一个计算器,我在上面算了一下,我的数据价值0.66美金,当然就是让你回答了几十个问题,这几十个问题价值0.66美金,可能是一千个人打包卖给谁,这是一种定价。

另外一个网站可以分析你所有Facebook里面的内容,你的朋友,你发的帖子,你的活动,给你算出来你的数据多少钱?这个还不错,380美金。

有一家新的初创公司,索性就这么说,我每月给你8美金,你把你的Facebook、Twitter、银行给我,我去找广告主变现去,每个月8美金还不错。

还有一个哥们就有意思了,自己把自己的数据放到众筹网站上面,筹到了213美金,这就是把你的数据进行定价的方式。

除了定价以外还有货币化,这里面列出来了很多公司,比如说Personal Cloud,你去一个卖车的网站上面,你用这个帐号去登录,一登录了以后,它根据你的背景,根据你的一些行为,去推荐。聚信立是反过来,你在它的浏览器里面用淘宝登录,就把你淘宝消费的记录全抓下来了,然后你也可以用你的移动帐号登录,你也可以用你的京东帐号登录,它根据这些消费数据,给你算出来一个信用,你有了这个信用可以申请信用卡,你也可以去P2P借贷去,享受某一个贷款利率。它让你自己登录了以后,把你的数据授权给它,它给你的数据带来价值。

比如说reputation.com,跟踪你在互联网上的数据,有时候你的数据是负面的,帮你解决。

Hard shake可以实时给你发一些信息,你实时给它做一些调研报告,给你一部分钱。下面这两家公司更好地帮助你利用你的数据,跟数据的使用方做更好的匹配,让你数据更好的变现。所以这些公司现在都还很小,但是大家要知道,边缘创新都是从小公司开始的。大公司一开始是看不起,最后来不及了。

我个人做技术的,在技术上面,我认为有近期、中期、远期三个路线。

首先近期我非常推崇OPENPDS,MIT做的一个公司,在湛庐也发过一本书,《智慧社会—社会物理学》,它就是一个数据库,不同的应用,不同的互联网服务想要使用这个数据的时候,不能直接拿,可以把一段代码发给这个数据库。比如说这个潘多拉想要你了解个人对音乐的一些偏好,可以跑到你的数据库里面,跑一段代码,它不能把你的原始数据抓出去,跑一段代码,然后了解你是什么样的人,我给你推荐什么样的音乐。这里面的好处是在于,现在每个人的数据都在一起,而不是分布在Facebook、潘多拉各个地方,我在一个地方,这样就不会出现每一个数据拥有方都是数据孤岛的问题,它能够更全面地去了解每个人。但同时呢,你又不能掌握我的数据,这是近期一个很好的选择方案。

中期,我给大家讲一个有意思的东西,这跟比特币有关。我个人并不特别看好比特币,但是我非常看好它下面这个基础设施,叫区块链。现在有很多的用途,我可以用区块链颠覆金融,我能够发股票,我能够发债权,做分布式的股权交易,我可以做资产的置换,都用区块链,比现在所有的方式都好。但是也有人说区块链可以颠覆通讯,现在通讯都是国家安全局可以监控的,未来有一个非常私秘的,我上面发个帖子,NSA是看不到的。但是更多的有识之士相信区块链有可能颠覆未来社会运行的方式,颠覆未来整个的基础设施。在这么一个站里面,大家可以看到,未来的这个数据层,互联网数据层有可能就是建筑在这个区块链的基础上。在上面叠加网络层、应用层。

现在事实上已经有很多很好的项目,大家感兴趣的话,可以去参考一下。ethereum基于去中心化的互联网进行开发的框架。MaidSafe去中心化的存储,OPEN MUSTARD SEED,MIT做的一个系统,未来个人数据也许就建筑在这些新的基础设施之上。

远期我认为未来的万维网,是Web of Data。

◆◆◆

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复“每日一课”查看【每日一课】手机在线视频集锦

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

PPV课其他精彩文章:


1、回复“干货”查看干货 数据分析师完整知识结构

2、回复“答案”查看大数据Hadoop面试笔试题及答案

3、回复“设计”查看这是我见过最逆天的设计,令人惊叹叫绝

4、回复“可视化”查看数据可视化专题-数据可视化案例与工具

5、回复“禅师”查看当禅师遇到一位理科生,后来禅师疯了!!知识无极限

6、回复“啤酒”查看数据挖掘关联注明案例-啤酒喝尿布

7、回复“栋察”查看大数据栋察——大数据时代的历史机遇连载

8、回复“数据咖”查看数据咖——PPV课数据爱好者俱乐部省分会会长招募

9、回复<span style="margin: 0px; padding: 0p

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2015-06-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

算法值得信任吗?O’Reilly创始人给出了四条评估原则

1606
来自专栏新智元

IBM预言5年内量子计算将成主流,沙粒大小超微计算机无处不在

【新智元导读】在顶级科技盛会Think 2018上,IBM发布了未来5年五大科技预测,包括砂砾一样大小的计算机,人工智能将让海洋重现蔚蓝,量子计算将在未来5年成...

3338
来自专栏大数据文摘

可穿戴式设备如何突破市场困局?

1596
来自专栏编程

程序员真的干到 35 岁就干不动了吗?

很多人说程序员职业生涯很短,35岁就干不动了?下面分享两个大神的体验 一 ? 好吧,暴露年龄就暴露年龄吧。 今年40岁,一直做软件相关工作。除了刚毕业写过几年代...

2027
来自专栏大数据人工智能

大数据应用经典案例TOP50详细剖析

1. 梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价。

9637
来自专栏人称T客

管理软件“移动第二”还能活多久?移动优先成创业者杀手锏

可能说这句话有些过头,就像此前有网友说过,面对移动时代不转型必死,转型也未必保证不死,因为不是被趋势干死,就是死在顺应趋势的路上。 T哥听到移动优先的策略还...

3066
来自专栏镁客网

超市零售业困局凸显,硬科技或成起死回生关键

1385
来自专栏大数据文摘

地图搜索预测人流动向,政府监管与公民隐私如何兼顾?

1514
来自专栏大数据文摘

凯文·凯利:个人数据才是大未来

1827
来自专栏华章科技

凯文·凯利:大数据时代没有旁观者

日前,互联网教父、科技商业预言家的凯文·凯利在斯坦福大学进行长达3小时的分享,畅谈他对未来20年重大科技商业潮流的见解。以下为演讲内容整理干货。

782

扫码关注云+社区