清华数据院院长韩亦舜:大数据时代的数据伦理问题探究

回复“清华大数据”,可以下载ppt全文+以往讲座干货。

本篇文章由清华大数据产业联合会官方微信公众账号数据派(ID: datapi)和大数据文摘(ID: BigDataDigest)联合发布。

导读:5月26日,2015年贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会在贵阳召开,数据开放与隐私保护作为一个专门的分论坛,在同天下午举办。清华大学数据科学研究院执行副院长在会上做了大数据伦理与道德的分享。大数据文摘今日带您走进数据开放与隐私保护论坛,聆听韩亦舜院长对数据引发伦理道德问题的看法。

韩亦舜

清华大学数据科学研究院执行副院长,关注数据开放,数据伦理以及数据隐私研究

以下是演讲实录

刚才几位嘉宾就数据的安全问题,隐私问题分享了观点,我今天从不同的角度说一些有待探讨的观点。

我不知道大家是否听说过,曾经在国外伦理课上有一个经典的故事,说的是一个轨道车按照正常轨道向前行驶,但是突然刹车失灵,前面轨道上有5个人。司机还有一个选择,选择旁边一条道,旁边的轨道上有1个人。那5个人违规了,1个人没有违规,如果撞死这1个人,显然这个人是无辜的,但是一般认为撞死1个人的代价小。这就遇到了伦理的困境。今天大数据时代,我们会面对同样的问题。我们把情景改为是一部谷歌的自动驾驶车,想一下自动车遇到这种情况会怎么样,也许他可能比当年那个有轨车司机做决断的时候想得更多算的更多,能发现这1个人跟5个人的身价,有没有犯罪记录,到底撞谁合适。其实我们面临的很多东西数据是算不出来的。

这是一类伦理问题。还有在数据伦理上遇到另一个挑战,会不会产生大数据时代的弃儿。今天我们都是用手机打车了,我们的父母,那些不会用智能手机的人,出门还打得到车吗?我是今年才开始用手机打车的,之前每次打不到车的时候我都恨自己为什么不学会启用手机打车软件。我还算是信息时代的赶潮人,但是我们的父母怎么办呢,他们很有可能将来与这个数据时代差距拉得越来越大,很多人会成为信息时代的弃儿。该怎么办?还有,如果你曾经有过犯罪记录,将来走到哪里都会被查到有案底而受到歧视怎么办?怎样才能正常地回归社会?

接下来,我们讲去年最后一天发生的那个不该发生的事情,上海发生踩踏事件死了很多人,也有很多官员受处分。最让人遗憾的是之后网上发了很多报告说这个事情可以避免。在座的搞技术的人都知道,我们用手机定位是可以看到人流的变化趋势,就可以采取应急措施。可惜这些技术在我们该用的时候都没有用上,这个背后什么问题呢?

我们讲信息孤岛,还有一个责任孤立的问题。拥有公共安全移动数据的机构,并不需要对公共安全事件负责。如果给处分的时候把拥有公共安全数据的人也包括进来,可能他们就不会有不同的思考。我们都说安全大事,信息安全是头等大事,它也变成谁都不愿意碰的话题。2014年年初就发生了一个踩踏事件,只是在稍微偏远的地方,大家传播得不太广就没有引起重视。现在上海的外滩还会不会再发生?除了公安部门规定多少人不能组织群众集会,要申办单位自己有保护措施等,是不是涉及公共安全的数据仍然没有开放没有利用。所以我就问一句,数据安全或者保护数据就一定对吗,这里也有一个伦理问题,你拿的是社会公共安全的数据你不用起来,最后造成社会公共安全事故,你觉得这对吗?

第三个例子是"人肉"。我不知道各位有没有参与过"人肉",我这里提一个最新的"人肉"案例,发生在成都那个女孩子超车被打的事情。我不知道在座的有没有参与或传播这个事,批评这个女孩子赞那个男孩子?我觉得有一个事不对,就算她再怎么不对,那个男孩子都不应该下车打人。大家后来收到过进一步的信息吗,女孩子开房的信息都在网上传,太可怕了,这就是网络暴力。今天互联网的传播力太强,甚至会导致出现网络暴力。有时候大家可能觉得我们用“人肉”方式把抽烟的官员,带表的官员挖出来,大家感觉大快人心,但我们要清楚“人肉”不是公器,不能作为一个普遍的工具。如果我们任由这种思想发展、这种形式存在,对社会是有危害的。今天就算这个女的超别人车不对,中间双方又互相别车什么的,我们就该站道德的高度上践踏别人的权利吗?把别人女孩子开多少次房都发到网上?中国原来就有一句古话好事不出门,坏事传千里。政府干部们苦于做了好事传不出去,有一点坏事马上传开。当有一些不负责任的言论遇到社会心理扭曲的时候,网络的危害就很容易被扩大。记得几年前就有网络暴力歪曲事实,最后害了男女恋爱双方其中一方跳楼这种悲剧。也许男女双方跟传播网络言论的人没有什么关系,因为这种舆论压力把别人害死了,而且跟事实还不符。这很可怕。

刚才讲的这几个例子说明大数据时代,出现了一些新关系新问题。过去就有伦理道德一说,大数据时代有了数据伦理道德。大家想一想大数据时代的到来,可以让在遥不可及的地方,如果没有互联网,没有交通工具,没有通讯工具就根本不会认识的人,不会跟他发生一点关系的人联系在一起。像这样的人与人组合是大数据时代才有的新关系。互联网时代完全没有关系的人也会伤害到其他人。传到我手上说那个开房记录跟成都那个女的没有什么关系,但是这个传播伤害了别人。这个大数据时代产生特殊的人与人之间的关系,是数据关系。

我们通常讲道德,伦理,也没有什么严格定义,我们就这么认为吧。核心部分是法律规定,法律以外就是在道德伦理范畴,我把道德跟伦理稍微区分了一下,道德广义一些,伦理就是人跟人具体发生关系了。你在街上扔一个东西,开车的时候扔一个垃圾别人说这个人不道德,不会说这个人不伦理。如果你侵犯别人隐私不光是不道德,还是伦理的问题。

我们提倡一个观点,就是要建立在大数据时代的伦理原则,挖掘数据的时候问问你自己到底要干嘛;有的是生成数据,生成数据的时候要对你生成的数据负责。能不能提倡一个传责自负?记得我在大学读书的时候,也发生过现代陈世美跟秦香莲那样的事情,当时是贴大字报,那个也是传播信息,只是没有现在这么快,伤害也就小一些。今天你传播了就要对你传播的内容负责。当然我们需要考虑对公众人物,对普通人物,对公众行为和对个人行为的区别对待。公众人物有时候很希望别人关注他,他想着法把一些信息甚至对一般人来说是隐私的信息暴露出来。这时你传播一个公众人物信息的责任和你传播一个素不相识人信息的责任会不一样。我们要探讨数据时代人与人之间的关系怎么确定?最后一个伦理原则即便抛开大数据时代也是对的,那就是我们的古训:“己所不欲勿施于人”。

再讲讲利己主义的悖论。隐私问题:我们现在一方面希望得到个性化服务,一方面希望保护自己的隐私。当女生定制一件合体的裙子时候,你已经把三围告诉别人,而且让别人寄到你家里。为什么你告诉别人,你不图的就是个性化,这是一个悖论。不要过分强调个人隐私。如果你想要隐私,不许医生使用你的病例在别人身上,医生可以不给你治病。因为医生治病能力是在大量别人病例的基础上建立起来的。第二个悖论服务。是我们家的例子,就是住的地方信号不好,投诉几次移动公司说你们小区的人都不同意建基站,我们一方面希望有很好的通话质量,又不想自己住的周边放基站,这都是伦理的思考。当然还有一方面希望别人把数据公开出来,一方面找种种借口不开放自己的数据。

这里面涉及很多新时代的问题,新的挑战,但我认为我们价值观会重塑。什么是隐私?有些在今后不再成为隐私,你走在公众场合下,你就没有了行为方面的隐私。我今天讲的每句话都得负责任,所以我说的话都不是隐私。数据的权属问题,我们刚才专家提到,有没有权把自己信息删掉,如果有一个犯罪分子对你进行了侵害,我们到网上查它的踪迹的时候,结果说对不起,他10分钟之前把自己的信息删了,作为受害者你愿意吗,肯定不愿意,很多事情是双刃剑。信息安全问题也是,没有绝对的安全,我们一环一环扣起来,争取能够发现问题解决问题。现代社会权力和义务是对等的,没有对数据的绝对权力,个人没有,企业没有,政府也没有。

今天铺天盖地的数据向我们袭来,我们有很多新问题还没有解决好,包括数据道德伦理教育。法律永远不可能解决所有的问题,我们需要道德伦理,要进行伦理道德教育。希望伦理道德教育能够作为基础教育一部分,包含数据时代人与人之间关系的新特点;面对利益冲突的时候,运用大数据理念分析各方的关注点以达到新的平衡。在道德伦理教育中要有正确的舆论引导,要建立基于数据伦理道德的新公序良俗。

大数据给我们出了这么多难题,我个人还是很看好大数据。因为毕竟这个大数据让我们把这个社会、这个世界和我们自己看得更清楚了;大数据因为它增加了信息透明度,有利于建立社会的公平正义。大数据时时在提醒我们行为规范,大家既然觉得自己害怕一些做的“坏事”暴露出去,那就少做或者不做。我在清华的时候听学生们说在中国人民银行的网站上可以查自己的信用记录,我能够隐约感觉到学生们在意自己的信用记录了。有越来越多的人在意自己的信用记录,对于我们中国这样一个没有很好的建立起信用体系的社会来说,是一个好事。说明大家开始有这个意识了。

另外毕竟跟过去相比大数据让我们更接近事实,一个人的DNA数据有几个T,这个是不是跟十万年前一样不敢说,但是这个数据可能一万年前就是存在的,只不过那时我们不知道。我们今天突然知道这些数据的存在感觉挺恐怖的。但是大家想一想,在16世纪到17世纪的时候,人类刚刚发明望远镜,我们突然发现某一亮点原来是一个大星球;我们肉眼看手上什么都没有,拿显微镜一看,看到很多细菌在那里走感觉很恐怖。我们今天发现很多我们不曾接触的数据,感觉一下子乱了章法。人类就是在不断的认识世界中前行。我们今天对世界认知的颗粒度超过以往,我们要看清这个世界。大数据还能够记录违背法律及公序良俗的行为,帮助我们建立更好的秩序。大家都希望这个社会变得更美好,大数据能够帮助我们让这个社会更美好。

今天提出这些问题,还是希望引起大家的思考,能够带来大家对大数据的兴趣以及大数据相关问题的深入讨论!谢谢大家!

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2015-05-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏大数据文摘

消失的中国互联网元老陈天桥:为神经科学捐助10亿,不担心机器人崛起

即使你没听说过“盛大游戏”,也一定听说过“传奇”。把风靡一时的网游“传奇”引入中国的陈天桥,是国内网游界当之无愧的元老,马化腾也表示曾将他作为学习的对象。

1100
来自专栏大数据文摘

未来战争,军事大数据决定主动权

3345
来自专栏罗超频道

史蒂夫鲍尔默退休:WIN-TEL时代的崩塌

微软CEO史蒂夫·鲍尔默(Steve Ballmer)决定在一年内退休。微软已成立包含比尔盖茨在内的特别委员会,协调退休前工作,在公司内外遴选接班人。年初各方便...

4027
来自专栏ATYUN订阅号

AI诊断皮肤癌,准确率竟达91%!

斯坦福大学科学家利用现在的谷歌算法创建了一个数据库,目的是训练神经网络。它最初用来判断猫和够的AI项目,现在可以用来诊断癌症。 —2016年,仅美国就有约一万人...

3608
来自专栏守候书阁

2018,先立几个flag

首先稍微说明一下,关于前端入行两年--教会了我这些道理这篇文章。是总结我前端工作经验的,不是2017年的总结。关于2017年的总结,之前也写了一篇文章写博客的这...

1123
来自专栏数据科学与人工智能

【数据】数据驱动业务的七种类型

我们总说数据驱动业务,可平时看到的,却总是业务部门追着数据部门屁股要数据。哪里是驱动业务了,分明是被人牵着鼻子走啊!很多同学都有类似的疑惑:到底数据分析对企业有...

39310
来自专栏罗超频道

贴作者、刷广告,头条、一点、BAT和门户们资讯大战为何拼命烧钱?

最近留意到,北京、上海等地的地铁公交机场等公共场所出现了大量一点资讯的广告,在我印象中这是一点资讯第一次大规模投放户外广告。来自微信公众账号“开八”的消息显示,...

3786
来自专栏VRPinea

NAB大会精彩不断,VR相机市场竟火爆如斯?

2956
来自专栏鹅厂网事

腾讯NOC运营外包管理探索之路

"鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网...

6258
来自专栏Java架构师进阶

IT人永远不老,老程序员价值何在?

IT人永远不老?做梦,怎么可能。无论你现在是多么风华正茂,青春洋溢,终有成熟、老去的那天。

1114

扫码关注云+社区

领取腾讯云代金券