为推动无偏见的AI研究,IBM将发布大型人脸识别数据集

【概要】随着人工智能(AI)技术的广泛应用,确保AI技术没有偏见变得越来越重要。IBM计划发布一个大型的、无偏见的人脸图像数据集,以推动无偏见的人脸识别研究。

与以往相比,人类社会对人工智能系统中的偏见问题更加关注,尤其是用于识别和分析人脸图像的系统。在IBM,科研人员采取以下措施来确保以负责任的方式来创建并训练面部识别技术:

(1)导致面部分析领域出现偏见的最大问题之一是缺乏训练系统的各种数据。因此,科研人员打算在2018年秋天公开以下数据集,以作为技术行业和研究界的工具:

IBM研究院(IBM Research)的科学家正在构建的一个超过100万张图像的注释数据集,可以用于提高对面部分析偏见的理解。图像将使用属性进行注释,利用Flickr图像中的地理标记来平衡来自多个国家/地区的数据和主动学习工具,以减少样本选择偏差。目前,可用的最大面部属性数据集包含20万个图像,因此这个具有一百万个图像的新数据集将是一个巨大的进步。

一个最多包含3.6万张图像的注释数据集—其中肤色、性别和年龄呈均匀分布,由IBM Research注释,能够为人们评估其技术提供更加多样化的数据集。这将为算法设计人员识别和解决面部分析系统中的偏见提供特别帮助。解决偏见问题的第一步是确认存在偏见--这就是该数据集的目标所在。

(2)2018年早些时候,IBM极大地增强了用于面部分析的Watson视觉识别服务的准确性,这使得面部分析的错误率降低了近十倍。IBM正在举办一个技术研讨会(由IBM Research与马里兰大学合作),以确定并减少将于2018年9月14日与ECCV 2018联合使用的面部分析系统中的偏见。使用IBM面部图像数据集的竞赛结果将公布在该研讨会上。此外,IBM的研究人员将继续与广大的利益相关者、用户和专家合作,以了解可能影响AI决策的其他偏见和漏洞,从而不断改善系统。

人工智能拥有改善人们生活和工作方式的重要力量,但前提是对人工智能系统的开发和培训是负责任的,且该类系统能够产生让我们信任的结果。确保系统接受平衡的数据培训和消除偏见对建立这种信任至关重要。

随着对AI应用的不断增加,防止偏见进入AI系统正在成为最受关注的问题。IBM相信任何技术--无论多么准确--都不能够或不应该取代人类的判断力、直觉和专业知识。像人工智能这样的先进创新技术的威力在于它们能够增强而非取代人类的决策能力。因此,任何使用AI的组织(包括视觉识别或视频分析功能)都必须对使用AI的团队进行培训,以了解偏见(包括隐性和无意识的偏见),对其进行监控,并知道如何消除偏见。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2018-07-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序员笔记

读书「精进」

1976
来自专栏企鹅号快讯

谷歌再出黑科技!人工智能模拟的人声和真人几乎难以分辨

谷歌再出黑科技 用人工智能模拟出来的声音 几乎可以和真人以假乱真 在我们的印象中,机器的声音都是冰冷的电子音,虽然人类也一直致力于研究让机器“说人话”,但搞出来...

4306
来自专栏大数据文摘

硕士学位还是初创公司:哪一个是建立深度学习职业的切入点?

931
来自专栏量子位

LeCun列传:曾因AI理论遭人唾弃,如今终成一代大神

李杉 陈桦 若朴 编译自BuzzFeed 量子位 出品 | 公众号 QbitAI 距离Facebook门罗帕克总部约3000英里之外,在曼哈顿市中心一栋老旧的米...

3146
来自专栏机器人网

科学家想这样给人工智能“去偏”……

人工智能本来并不存在偏见,它不会因为无法通过逻辑来解释的理由而“想”某些东西是真的或假的。不幸的是,从创建算法到解释数据,机器学习中存在着人类的偏见,并且直到现...

2867
来自专栏新智元

【重磅】DeepMind进军星际争霸2,谷歌Facebook打响通用AI战争

【新智元导读】7日,Facebook刚刚宣布开源史上最大的《星际争霸》游戏数据集STARDATA。今天(10日)DeepMind在官方博客上宣布开源星际争霸2 ...

3804
来自专栏AI科技评论

观点 | 微软科学家谈机器学习的公平性问题:对性别和种族避而不谈并不是一个好方法

AI 科技评论按:ACM Fellow、微软杰出科学家和管理总监 Jennifer T. Chayes 近日以 ACM 的名义发表了一篇文章,介绍了机器学习中的...

3758
来自专栏量子位

AI没有偏见?它们从人类的语言中学会了性别和种族歧视

李杉 编译自 IEEE Spectrum 量子位 出品 | 公众号 QbitAI 在性别和种族问题上,人工智能能够消除人类的偏见吗? 《科学》上发表的一项最新研...

3785
来自专栏数据猿

【案例】恒丰银行——基于大数据的精准营销模型应用

数据猿导读 恒丰银行探索的精准营销系统打通银行内外部数据,并利用人工智能技术,对数据进行深度挖掘,打造个性化理财推荐系统,预测客户需求和价值,实现细分客群精准触...

6255
来自专栏SDNLAB

未来2年内,SD-WAN将会爆发式增长

根据国外公司Heavy Reading的调查,约有84%的电信行业受访者认为SD-WAN技术对电信运营商寻求自动化运维和降低服务成本至关重要。 ? 在121位调...

2695

扫码关注云+社区