专栏首页专知机器学习是“炼金术”?

机器学习是“炼金术”?

梯度下降依赖于试验和错误来优化算法,目标是在三维景观中使其最小化。

图片来源:ALEXANDER AMINI/SCIENCE

加州旧金山谷歌人工智能(AI)研究人员Ali Rahimi去年12月对其所在研究领域进行了一次猛烈的抨击,并获得了40秒的掌声。在一次AI会议上,Rahimi指责机器学习算法,即计算机通过反复试验和纠错来学习已经成为某种形式的“炼金术”。他说,研究人员并不知道为什么有些算法会起作用而另一些则不会,他们在选择一个AI架构而非另一个时也没有严格的标准。在近日于加拿大温哥华举行的关于学习陈述的国际会议上报告的一篇论文中,Rahimi和合作者列举了他们所看到的“炼金术问题”,并为提高AI的严格性开了“药方”。

“这个领域有一种痛苦。”Rahimi说,“我们很多人觉得自己在使用一种完全不同的技术。”

这个问题与AI的再现性问题截然不同,由于实验和出版实践的不一致,研究人员无法复制彼此的结果。它也不同于机器学习中的“黑箱”或“可解释性”问题:解释某一特定AI如何得出结论的难题。正如Rahimi所言,“我试图把机器学习系统的“黑箱”与转变为黑箱的整个领域区分开来。”

他说,如果不深入了解构建和训练新算法所需要的基本工具,研究人员创建AI就会像中世纪的炼金术士一样诉诸于谣言。加州山景城谷歌计算机学家Francois Chollet补充道:“人们被狂热崇拜所吸引”,依赖的是“民间传说和魔法咒语”。他举例说,他们采用宠物的方法调整AI的“学习速率”(一个算法在每个错误之后会在多大程度上进行纠正),而不是了解为什么一个算法比其他的更好。在其他情况下,AI研究人员训练其算法只是在黑暗中磕磕碰碰。例如,他们执行所谓的“随机梯度下降”,以此优化一个算法的参数,以获得尽可能低的失败率。然而,尽管有数千篇关于这一主题的学术论文,以及无数应用该方法的途径,这一过程仍然依赖于尝试和纠错。

Rahimi的论文强调了被浪费掉的努力以及可能导致的次优表现。例如,它指出,当其他研究人员从最先进的语言翻译算法中去掉大部分的复杂性时,它实际上能够把英语更好地翻译成德语或法语,而且效率更好,这表明其创建者并没有完全理解那些额外部分有什么好处。相反,英国伦敦推特网机器学习研究人员Ferenc Huszar说,有时候,附加在算法上的铃声和哨声是唯一优秀的部分。他说,在某些情况下,算法的核心存在技术缺陷,这意味着其得出的好结果“完全归因于在上面应用的其他技巧”。

Rahimi对了解哪种算法最有效提供了若干建议。他说,对于初学者来说,研究人员应该像翻译算法那样进行“切除研究”:一次删除一个算法的某些部分,以查看每个组件的功能。他呼吁进行“切片分析”,在此过程中,需要对一个算法的性能进行详细分析,以了解某些地方的改进是否会在其他方面产生成本。他还说,研究人员应该对其算法进行许多不同条件和设置的测试,并报告所有测试的性能。

加州大学伯克利分校计算机学家、Rahimi炼金术主题演讲论文的共同作者Ben Recht表示,AI应向物理学取经,该领域的研究人员经常把问题缩小到更小的“玩具问题”。他说:“物理学家在设计简单的实验以找到现象的解释方面非常惊人。”一些AI研究人员已经开始采用这种方法,在处理大型彩色照片之前,先在小黑白手写字符上测试图像识别算法,以更好地理解该算法的内部机制。

伦敦深度思维计算机科学家Csaba Szepesvari表示,该领域还需要减少对竞争性测试的重视。他说,现在如果一篇论文报告的算法优于某些基准,而非阐明该软件的内部工作原理,就更有可能被发表。这就是花哨的翻译算法通过同行评审的方式。“科学的目的是产生知识,”他说,“你需要生产出别人可以使用并可以以它为基础的东西。”

并非所有人都同意Rahimi和Recht的批评。脸谱网纽约首席AI科学家Yann LeCun担心,把太多的精力从尖端技术转移到核心理解上,可能会减缓创新,阻碍AI的实际应用。“这不是炼金术,而是工程学。”他说,“工程学是散乱复杂的。”

Recht发现一个适合系统性且容许冒险研究的地方。“我们两者都需要。”他说,“我们需要了解故障来自哪里,这样就可以建立可靠的系统;我们必须向前推进边界,这样就能沿着这条路线拥有更好的系统。”(晋楠编译)

本文转载自科学网

http://news.sciencenet.cn/htmlnews/2018/5/412136.shtm

文章分享自微信公众号:
专知

本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!

作者:晋楠
原始发表时间:2018-05-14
如有侵权,请联系 cloudcommunity@tencent.com 删除。
登录 后参与评论
0 条评论

相关文章

  • NIPS机器学习炼金术之争,Twitter机器学习研究员参战

    新智元报道 编辑:胡祥杰 【新智元导读】LeCun阿里炼金术战火再升级:俩人在Facebook上展开了直接的对话,火药味甚浓。Twitter机器学习研究员发表了...

    企鹅号小编
  • 科研人员批评机器学习已成“炼金术”

    继2017年底在人工智能大会上批评机器学习已成为“炼金术”后,谷歌科研人员Ali Rahimi与其他科研人员一起在“国际学习表征大会”(Internationa...

    人工智能快报
  • 机器学习正遭遇“可重复性危机”,或已成“炼金术”?

    机器学习以其特有的优势逐渐在科学研究中得到大量应用,然而,其内在的“黑箱”特点也带来了一系列问题,有研究者认为正是机器学习的这种不可解释性导致了当下科学研究的“...

    AI科技评论
  • 什么是机器学习

    什么是机器学习 机器学习是一帮计算机科学家想让计算机像人一样思考所研发出的计算机理论,他们曾经说过,人和计算机本身没有区别,同样都是一大批互相连接的信息传递和...

    云时之间
  • 什么是机器学习?

    除了机器学习(ML)工作定义之外,我们还旨在简要概述机器学习的基本原理,让机器“思考”的挑战和局限性,以及今天深入解决的一些问题学习(机器学习的“前沿”),以及...

    亚乐记
  • 什么是机器学习?

    输入“什么是机器学习?” 进入Google搜索将打开一个Pandora的论坛,学术研究和虚假信息框,而本文的目的是在我们的机器学习研究人员小组的直接帮助下简化机...

    陈哈哈
  • 什么是机器学习

    看到很多的小伙伴对于机器学习有这么大的兴趣,同时发现也有很多刚刚接触机器学习的小伙伴并不了解什么是机器学习.所以我想尽自己的微薄之力来谈谈我对与机器学习的理解....

    云时之间
  • 什么是机器学习

    1. 引言(Introduction) 1.1 Welcome 1.2 什么是机器学习(What is Machine Learning) 1.3 监督学...

    用户2188327
  • 谷歌研究员再批:机器学习慢慢变成新时代的炼金术

    新智元
  • 漫画:什么是机器学习?

    感谢作者 玻璃猫 (订阅号 梦见 ID dreamsee321) 投稿,如需转载,请与作者联系授权事宜。

    华章科技
  • 漫画:啥是机器学习?

    本节我们会以生动有趣的漫画来介绍关于人工智能(AI)相关的故事,你将会学习到:机器学习的概念和分类。

    用户1260737
  • 什么是机器学习技术?

    问题导读 1.什么是机器学习? 2.机器学习可以来做什么? 3.机器学习技术可以被应用于哪三种不同方式? 这篇博客文章由微软研究院的杰出科学家J...

    用户1410343
  • 漫画:什么是机器学习?

    这就是瑞雪兆丰年的故事。头年的瑞雪和来年的丰收,本是两个看起来并不相关的现象,但是智慧的农民伯伯通过几十年甚至几代人的经验,总结出了两个现象之间的规律。

    小灰
  • 什么是多模态机器学习?

    每一种信息的来源或者形式,都可以称为一种模态。例如,人有触觉,听觉,视觉,嗅觉;信息的媒介,有语音、视频、文字等;多种多样的传感器,如雷达、红外、加速度计等。以...

    用户1150922
  • 视频教学:什么是机器学习

    YJango
  • “爸爸,什么是机器学习呀?”

    原作:Daniel Tunkelang 安妮 编译自 Quora 量子位 出品 | 公众号 QbitAI 爸爸,什么是机器学习呀? 难以回答!抓了抓开始脱发的脑...

    量子位
  • Tomaso Poggio:深度学习需要从炼金术走向化学

    记者 | 周翔 AI科技大本营1月28日消息,《麻省理工科技评论》新兴科技峰会EmTech China在北京召开,营长也受邀参加,会上有多位人工智能领域的重磅大...

    AI科技大本营
  • 吴恩达机器学习笔记3-什么是机器学习

    机器学习领域的创始人Arthur Samuel(亚瑟·塞缪尔)早在1959年就给机器学习(Machine Learning,ML)下了定义:机器学习是这样的一个...

    讲编程的高老师
  • 【机器学习】什么是机器学习:一次权威定义之旅

    在这篇文章中,我想要解决一个很简单的问题:机器学习是什么? 你可能对机器学习感兴趣或者稍稍了解。如果有一天你和朋友或同事聊起机器学习,那么一些人可能会问你“机...

    陆勤_数据人网

扫码关注腾讯云开发者

领取腾讯云代金券