微软改进Face API,显著降低肤色识别错误率

AiTechYun

编辑:chux

微软宣布,它已经更新了其面部识别技术,显着提升了系统识别肤色的能力。

这一改进解决了最近的担忧,即商业上可用的面部识别技术更准确地识别出肤色较浅的人的性别,而不是深色的肤色,而且他们在肤色较浅的男性身上表现最好,而肤色较深的女性则表现最差。

随着新的改进,微软表示它能够将颜色较深的男性和女性的错误率降低20倍。对于所有女性来说,公司表示错误率降低了9倍。总体而言,该公司表示,通过这些改进,他们能够显着降低人口统计数据的准确度差异。

对于肤色较深的女性,误差率更高,这凸显了行业范围内的挑战:人工智能技术只能与用于训练它们的数据水平一样。如果面部识别系统要在所有人中表现良好,那么训练数据集需要表现出多种肤色以及诸如发型,珠宝和眼镜等因素。

负责微软面部识别技术开发的团队通过Azure Cognitive Services为客户提供Face API,与微软的偏见和公平专家合作,改进称为性别分类器的系统,专注于改善性能所有肤色的结果。

Face API团队进行了三项重大更改。他们扩展并修改了训练和基准数据集,推出了新的数据收集工作,通过专注于肤色,性别和年龄,进一步改进训练数据,并改进了分类器以产生更高精度的结果。

微软纽约研究实验室的高级研究员,AI系统公平性,问责性和透明度专家Hanna Wallach说,“我们谈过不同的方式来检测偏见并实现公平。我们讨论了数据收集工作,以使培训数据多样化。我们谈到了不同的策略,在部署它们之前对我们的系统进行内部测试。”

认知服务团队的主要项目经理Cornelia Carapcea说,Wallach和她的同事们提供了“对偏见的更细致的理解”,并帮助她的团队创建了一个更强大的数据集,在肤色问题上负责。

超越技术挑战

Ece Kamar是华盛顿州雷蒙德市微软研究实验室的高级研究员。她的研究专注于人工智能工具,帮助工程师识别培训数据中的盲点,比如暗色皮肤女性的代表性不足,这可能导致AI系统在性别分类任务中出现不可接受的错误。

她表示,改善Face API中性别分类器的性能主要是一项技术挑战。她说:“收集更多捕捉到我们世界多样性的数据,并小心如何衡量绩效是减轻这些问题的重要步骤。”

她说,一个更加细微的挑战是,要学习如何以及何时去减少反映并放大社会偏见的AI系统,而不是因为数据集不完整或算法不足,而是因为人类社会存在偏见。

Wallach解释说:“如果我们正在训练机器学习系统以模拟在有偏见的社会中做出的决策,并使用该社会生成的数据,那么这些系统必然会重现其偏见。”

Wallach的团队正在制定最佳实践,以便从构思和数据收集到模型培训,部署和监控,从这些类型的AI驱动产品和服务的整个开发流程中检测和减轻偏见和不公平。

“这是一个真正思考我们在系统中反映什么价值的机会,”Wallach说,“它是否是我们想要反映在我们的系统中的价值。”

寻找答案

例如,如果您在网上搜索“首席执行官”这个词,那么你很可能会得到有关世界各地公司和组织的高级领导职位的信息,其中包括一些图片,最有可能是男性。

这并不奇怪,因为财富500强CEO中不到5%是女性。

在微软,这促使Bing搜索引擎工程师不断探索与Bingla等专家合作,他们正在寻找如何最好地展示反映董事会,学术界和社交媒体关于缺乏女性首席执行官,以及改变这种状况的努力。

Bing团队的主要项目经理Michael Golebiewski表示,“当我们思考这种偏见时,我们开始考虑如何教用户分辨偏见,如何向用户解释社会正在发生的事情,以及如何帮助用户探索这些事情。”

“这是一个还没有完整答案的领域。这也是我们开始考虑如何在用户搜索时与用户进行对话的一个领域。”

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-06-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【机器学习】人工智能\\机器学习\\统计学\\数据挖掘之间有什么区别?

前段时间,作者在 stats.stackexchange.com(译注:国外的一个系列问答网站,其中Stack Overflow是其中一个子站)看到一个很有意思...

2415
来自专栏ATYUN订阅号

研究团队用神经网络训练机器人在动态环境中找到并抓取物体

机器人可能会制造汽车和翻转汉堡,但是它们是否可以在凌乱的办公桌或卧室地板上找到并车钥匙,并把它递给你?昆士兰科技大学(QUT)的机器人研究人员现在已经使用神经网...

1124
来自专栏云计算

云端生存思考之三:算法制胜,工程亦然

什么是云计算?云计算代表的是社会的量化管理趋势,以大数据的形式表达出来。由于宣传的原因,人人以为大数据就是统计,云计算就是Hadoop,其实我们工程领域的某些计...

2035
来自专栏机器之心

专访 | 网易有道 CEO 周枫:需求为先的 AI 技术赋能

机器之心原创 作者:邱陆陆 机器翻译领域正经历又一次骤雨疾风般的变革。2014 年,Yoshua Bengio 组做出了第一个循环网络编码器-解码器神经机器翻译...

3428
来自专栏企鹅号快讯

智能刷脸,打开新“视界”

不久前,在2017年美国国家标准与技术研究院组织的全球人脸识别技术测试上,一支中国人工智能技术团队超过来自俄罗斯、美国、法国的对手,成为第一个获得冠军的中国团队...

2099
来自专栏PaddlePaddle

技术|深度学习行业应用及就业方向大猜想

一直以来,大家都在盛传深度学习是工程师的风口,但是对于深度学习和行业的联系却很少被提及。

1271
来自专栏AI科技评论

地平线机器人CEO余凯:人工智能和深度学习的下一个风口在哪(含22页PPT)

雷锋网按:本文根据余凯在微软亚洲研究院召开的“让世界充满 AI-人工智能研讨会”上所做的报告《 “AI Inside”无处不在的未来 》编辑整理而来,在未改变原...

3944
来自专栏专知

【行业报告】AMiner发布最新人工智能芯片研究报告

【导读】随着AI技术的发展,从基础算法,底层硬件,工具框架到实际应用场景,目前人工智能已经全面开花。 作为人工智能核心的底层硬件AI芯片,也同样经历了多次的起伏...

681
来自专栏新智元

AI算法透明不是必须,黑箱和可解释性可简化为优化问题

来源:nytimes、wired 作者:Vijay Pande、David Weinberger 【新智元导读】由于AI算法内部的运作往往是不透明的,AI的黑箱...

3638
来自专栏镁客网

「深度」科学家眼中完美的计算机长什么样?

1563

扫码关注云+社区