专栏首页ATYUN订阅号IBM研究人员通过探索缺失的事物来解释机器学习模型

IBM研究人员通过探索缺失的事物来解释机器学习模型

AiTechYun

编辑:chux

在《白额闪电》(The Adventure of the Silver Blaze)中,福尔摩斯并不是通过能看到的线索解决了案件,而是通过注意到某一事物的缺失。在这种情况下,那只没有吠叫的狗帮助确定了罪魁祸首。

人类能够从缺失的东西中进行推断和学习的事实,并没有广泛应用于机器学习,但这是IBM研究人员团队想要改变的一部分。在今年早些时候发表的一篇论文中,该团队概述了使用缺失结果来更好地理解机器学习模型如何工作的方法。

“深度学习的一个缺陷是它或多或少类似于黑匣子,”该研究小组的成员之一Amit Dhurandhar解释说。“所以很难确定为什么要做出某个决定。答案可能是准确的,但在许多人类关键应用中,比如药物,这是不够的。”

为了更好地理解机器学习算法如何做出决策,IBM团队创建了一个“对比解释”系统:寻找缺失的信息,以便更好地理解机器学习模型是如何得出其结论的。这在实践中意味着,例如,如果机器学习模型正在识别狗的照片,则该方法不仅可以用于显示机器模型用于识别狗(如毛皮和眼睛)的内容,而且还有识别出一只狗必须没有的内容(比如它没有翅膀)。

与IBM团队无关的卡内基梅隆大学机器学习系副教授Pradeep Ravikumar说:“这是一个简单的想法,但这是一个非常重要的想法。”

Ravikumar指出,IBM的方法非常适合于在机器学习模型正在进行二元区分的领域做出决定,即某些东西存在或不存在,这意味着,例如有人被拒绝贷款,这不仅可以解释为信用报告中存在的内容(比如违约),还可以解释内容中没有的(比如这个人没有大学学位)。

在这篇论文中,IBM团队能够成功地将这种方法用于三种不同类型的数据集:大脑的fMRI图像,手写数字和采购欺诈数据集。在所有这些数据集中,研究人员能够更好地理解机器学习模型如何做出决策。

研究人员写道:“有趣的是,相关的消极因素在许多领域发挥着至关重要的作用,其中,解释很重要。因此,当不同类别的输入相互接近时,它们似乎是最有用的。例如,它们在区分流感或肺炎的诊断时更重要。”

Dhurandhar说,使用这种方法的关键是通过更好地理解人工智能,人类能够与这些模型一起工作,以获得比人类或机器学习模型自行完成任务得到的结果更好。另外,了解计算机为什么会做出决定会让人们更倾向于使用该模型的建议。

“人们想知道他们为什么被推荐东西,”他说。“一旦他们知道了,就会提高他们的购买意愿。”

本文分享自微信公众号 - ATYUN订阅号(atyun_com)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 不只是软件,在线也可以免费下载百度文库了。

    不管是学生,还是职场员工,下载各种文档几乎是不可避免的,各种XXX.docx,XXX.pptx更是家常便饭,人们最常用的就是百度文库,豆丁文库,道客巴巴这些下载...

    课代表
  • 理工男图解零维到十维空间,烧脑已过度,受不了啦!

    让我们从一个点开始,和我们几何意义上的点一样,它没有大小、没有维度。它只是被想象出来的、作为标志一个位置的点。它什么也没有,空间、时间通通不存在,这就是零维度。

    钱塘数据
  • 中国互联网协会发布:《2018中国互联网发展报告》

    在2018中国互联网大会闭幕论坛上,中国互联网协会正式发布《中国互联网发展报告2018》(以下简称《报告》)。《中国互联网发展报告》是由中国互联网协会与中国互联...

    钱塘数据
  • ISUX Xcube智能一键生成H5

    腾讯ISUX
  • 【倒计时7天】2018教育部-腾讯公司产学合作协同育人项目申请即将截止!

    腾讯高校合作
  • SQL中GROUP BY用法示例

    GROUP BY我们可以先从字面上来理解,GROUP表示分组,BY后面写字段名,就表示根据哪个字段进行分组,如果有用Excel比较多的话,GROUP BY比较类...

    Awesome_Tang
  • 知识体系解决迷茫的你

    最近在星球里群里都有小伙伴说道自己对未来的路比较迷茫,一旦闲下来就不知道自己改干啥,今天我这篇文章就是让你觉得一天给你 25 个小时你都不够用,觉得睡觉都是浪费...

    桃翁
  • 【系统设置】CentOS 修改机器名

    ken.io
  • 复杂业务下向Mysql导入30万条数据代码优化的踩坑记录

    从毕业到现在第一次接触到超过30万条数据导入MySQL的场景(有点low),就是在顺丰公司接入我司EMM产品时需要将AD中的员工数据导入MySQL中,因此楼主负...

    haifeiWu
  • 考研英语-1-导学

    英二图表作文要重视。总体而言,英语一会比英语二难点。不过就写作而言,英语二会比英语一有难度,毕竟图表作文并不好写。

    用户1335799

扫码关注云+社区

领取腾讯云代金券