大数据时代引发“歧视”忧虑,但不该就此因噎废食

大数据越来越被视为一种战略性资产,它可以通过其强大的预测技术来改造组织。

据社会研究人员小组研究,大数据对公众和社会的影响,当涉及到帮助系统做出决定时,应用方法可能并不总是公正的。

最近,纽约大学组织的学生为社会刑事司法改革的活动,集中使用大数据在机器学习和数据挖掘,以推动公共和私人部门的行政决定问题。

其中包括政策研究人员、技术人员和记者,讨论在使用大数据的同时,抛开固有的偏见和歧视,通过无意中设置的规则和流程来增加我们的决策能力。

在这种情况下,使用规则的数学程序编码来实现特定的目标。批评者认为这些算法可能会延续偏见和加强内置的假设。

最近,政府机构开始仔细观察新兴领域。上周,白宫发布的一份报告警告称,如果没有正确的应用数据收集可能会损害公民的权利。该报告呼吁,“如何最好的鼓励这些技术的潜力,同时最大限度的减少对隐私、公平对待和其他美国核心价值的风险”。

2014年的报告题为“大数据的不同影响”,普林斯顿大学信息技术政策中心的程序员梭伦巴洛克斯指出,“数据挖掘算法技术的倡导者认为,他们是消除人类偏见的决策过程。但是,数据的算法与它所使用的数据一样好。”

巴洛克斯研究新兴的应用机器学习来提高道德认识问题的影响。他补充道,“数据挖掘可以继承之前决策者的偏见或社会上持续存在的普遍偏见。”

换句话来说,人类产生的机器学习系统上运行的数据是由人类设计的算法。因此,人类创造的数据隐含偏见。

在两年前的研究中,美国联邦贸易委员会(Federal Trade Commission)提出类似的问题。尽管监管部门承认大数据所带来的好处,但滥用数据编译此类信息的公司存在歧视某些群体的风险。

数据歧视的指控

哈佛大学的数据隐私实验室负责人Latanya Sweeny表示,大数据歧视指向几年前开展的一项案例研究。

此案涉及到谷歌在互联网上某些种类的搜索结果。Sweeny在她的研究中发现,出现黑人名字的逮捕记录比例比白人多18%。谷歌已经解决了这个问题,尽管他们从未公开表示他们做了什么来纠正这个问题。

在过去几年中,大数据的扩散已经看到指控其他的不当使用和偏见。这些指控是五花八门的,从网上的价格歧视和地理定位结果到犯罪预测技术,在一些公共工程决策中缺乏足够代表性的数据样本。

大数据的优势是可以平衡应用现代技术以解决社会问题的风险。然而,一些质疑者认为,民主化数据在本质上影响着人们,从数据从业者到专家。

大数据将停留在这里

一些拥护者表示,问题不在于“大数据歧视”,但失败的数据会让专业人员曲解数据挖掘的结果的风险和统计学习的核心。他们还补充表示,带来的好处远远大于担忧。

纽约大学斯特恩商学院的分析中心主任Anindya Ghose说,“在我的学术研究和行业咨询中,我已经看到了企业、组织和消费者使用数据驱动决策、利用数据科学和业务分析的巨大利益。”

Ghose还表示:“老实说,我不理解这些人在大数据的运用中关于对数据分析影响的恐惧和愤世嫉俗。

她表示,兑愤世嫉俗者和我们自己的一些忠告是:“大家仍有必要处理好大数据技术引发的这些伦理纠纷问题,否则大数据分析的应用层次就很难再进一步。”

内容来源:汇通网

原文发布于微信公众号 - 灯塔大数据(DTbigdata)

原文发表时间:2016-05-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏罗超频道

微博九岁为何没有衰老迹象?诀窍在于这两个字

我的第一条微博发布于2009年11月18日,算是微博早期用户,跟微博一起成长了九年。

10320
来自专栏程序员互动联盟

程序员必备的三大核心竞争力

任何职业都有其内在的底蕴,作为一个程序员需要具备的几个竞争力是啥,如何让自己做一个不过时并且一直保持市场竞争力的程序员,特别是一些入行还不是很长时间的程序员是要...

370130
来自专栏数说工作室

工作日鸡血 | 怎样雇佣一个数据科学家?不要给他们出测试题,编程、统计、数学才是需要考虑的!

新的一周开始了,各位宝宝们,加油哦! 此前我们看到的文章都是从面试、求职者角度出发的,本文从招聘者角度出发,为有数据科学家招聘需求的机构提供了9点建议。知己知彼...

30250
来自专栏罗超频道

微博正在被抖音挖墙脚?

今日头条正在以抖音为急先锋与腾讯展开一场以小博大的对决,微博、快手、百度好看以及美拍等短视频平台,反而显得有些寂寞。不过,事实并非如此,在这场短视频大战中,没有...

12440
来自专栏大数据挖掘DT机器学习

一名数据分析师的职业规划

我小时候的理想是将来做一名数学家,可惜长大了发现自己天赋不够,理想渐行渐远,于是开始考虑现实,开始做一些人生规划,我一直在思考将来从事何种职业,专注什么样的领...

65240
来自专栏量子位

视频网站Netflix说:以后俺们的顾客是AI,人类靠边站(???)

问耕 编译自Quartz 量子位·QbitAI 出品 [手动黑人问号脸] 这届巴展怎么了,怎么这么爱谈人工智能,怎么这么爱语出惊人??? 继前日孙正义语出惊人之...

36660
来自专栏人称T客

移动CRM选型报告:总体满意度分析 老将失意新兵抢眼

移动信息化研究中心调查发现,移动CRM市场的企业用户总体满意度处于较为健康的水平,产品整体满意度均值为82.2。 目前移动CRM产品主要有三种衍生发展路径,第一...

23430
来自专栏鹅厂优文

游戏人工智能 读书笔记 (三) 游戏和人工智能的相互影响

Chapter 1.3 Why Games for Artificial Intelligence

26370
来自专栏钱塘大数据

【干货】打包带走!各类大数据分析和制作工具

导读:本文就给大家推荐一些用于数据分析的“必备神器”,其中很多工具是亲测过认为非常强大的,希望大家能从中找到对自己有帮助的工具。 1.微信大数据分析工具 新榜:...

41690
来自专栏数据科学与人工智能

华为诺亚方舟实验室主任李航:用漂亮的方式解决污浊的问题

机器学习的春天 “他说自然语言处理是“泥臭い”(污浊)的,用漂亮的方法是解决不了的;我说我的结论正好相反,正因为自然语言处理是“泥臭い”的,才必须用漂亮的方法去...

62790

扫码关注云+社区

领取腾讯云代金券