机器学习是“炼金术”?

梯度下降依赖于试验和错误来优化算法,目标是在三维景观中使其最小化。

图片来源:ALEXANDER AMINI/SCIENCE

加州旧金山谷歌人工智能(AI)研究人员Ali Rahimi去年12月对其所在研究领域进行了一次猛烈的抨击,并获得了40秒的掌声。在一次AI会议上,Rahimi指责机器学习算法,即计算机通过反复试验和纠错来学习已经成为某种形式的“炼金术”。他说,研究人员并不知道为什么有些算法会起作用而另一些则不会,他们在选择一个AI架构而非另一个时也没有严格的标准。在近日于加拿大温哥华举行的关于学习陈述的国际会议上报告的一篇论文中,Rahimi和合作者列举了他们所看到的“炼金术问题”,并为提高AI的严格性开了“药方”。

“这个领域有一种痛苦。”Rahimi说,“我们很多人觉得自己在使用一种完全不同的技术。”

这个问题与AI的再现性问题截然不同,由于实验和出版实践的不一致,研究人员无法复制彼此的结果。它也不同于机器学习中的“黑箱”或“可解释性”问题:解释某一特定AI如何得出结论的难题。正如Rahimi所言,“我试图把机器学习系统的“黑箱”与转变为黑箱的整个领域区分开来。”

他说,如果不深入了解构建和训练新算法所需要的基本工具,研究人员创建AI就会像中世纪的炼金术士一样诉诸于谣言。加州山景城谷歌计算机学家Francois Chollet补充道:“人们被狂热崇拜所吸引”,依赖的是“民间传说和魔法咒语”。他举例说,他们采用宠物的方法调整AI的“学习速率”(一个算法在每个错误之后会在多大程度上进行纠正),而不是了解为什么一个算法比其他的更好。在其他情况下,AI研究人员训练其算法只是在黑暗中磕磕碰碰。例如,他们执行所谓的“随机梯度下降”,以此优化一个算法的参数,以获得尽可能低的失败率。然而,尽管有数千篇关于这一主题的学术论文,以及无数应用该方法的途径,这一过程仍然依赖于尝试和纠错。

Rahimi的论文强调了被浪费掉的努力以及可能导致的次优表现。例如,它指出,当其他研究人员从最先进的语言翻译算法中去掉大部分的复杂性时,它实际上能够把英语更好地翻译成德语或法语,而且效率更好,这表明其创建者并没有完全理解那些额外部分有什么好处。相反,英国伦敦推特网机器学习研究人员Ferenc Huszar说,有时候,附加在算法上的铃声和哨声是唯一优秀的部分。他说,在某些情况下,算法的核心存在技术缺陷,这意味着其得出的好结果“完全归因于在上面应用的其他技巧”。

Rahimi对了解哪种算法最有效提供了若干建议。他说,对于初学者来说,研究人员应该像翻译算法那样进行“切除研究”:一次删除一个算法的某些部分,以查看每个组件的功能。他呼吁进行“切片分析”,在此过程中,需要对一个算法的性能进行详细分析,以了解某些地方的改进是否会在其他方面产生成本。他还说,研究人员应该对其算法进行许多不同条件和设置的测试,并报告所有测试的性能。

加州大学伯克利分校计算机学家、Rahimi炼金术主题演讲论文的共同作者Ben Recht表示,AI应向物理学取经,该领域的研究人员经常把问题缩小到更小的“玩具问题”。他说:“物理学家在设计简单的实验以找到现象的解释方面非常惊人。”一些AI研究人员已经开始采用这种方法,在处理大型彩色照片之前,先在小黑白手写字符上测试图像识别算法,以更好地理解该算法的内部机制。

伦敦深度思维计算机科学家Csaba Szepesvari表示,该领域还需要减少对竞争性测试的重视。他说,现在如果一篇论文报告的算法优于某些基准,而非阐明该软件的内部工作原理,就更有可能被发表。这就是花哨的翻译算法通过同行评审的方式。“科学的目的是产生知识,”他说,“你需要生产出别人可以使用并可以以它为基础的东西。”

并非所有人都同意Rahimi和Recht的批评。脸谱网纽约首席AI科学家Yann LeCun担心,把太多的精力从尖端技术转移到核心理解上,可能会减缓创新,阻碍AI的实际应用。“这不是炼金术,而是工程学。”他说,“工程学是散乱复杂的。”

Recht发现一个适合系统性且容许冒险研究的地方。“我们两者都需要。”他说,“我们需要了解故障来自哪里,这样就可以建立可靠的系统;我们必须向前推进边界,这样就能沿着这条路线拥有更好的系统。”(晋楠编译)

本文转载自科学网

http://news.sciencenet.cn/htmlnews/2018/5/412136.shtm

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-05-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

能把晦涩难懂的研究工作讲清楚,Distill就奖你10000美刀

Root 编译整理 量子位 出品 | 公众号 QbitAI 在机器学习研究圈里,大家可能都有这样的赶脚: 大部分从事机器学习研究的人,不太擅长写作,无法清晰地呈...

3226
来自专栏AI科技大本营的专栏

癌症治疗新曙光:AI助力科学家更好地观察人类活体细胞

在微软联合创始人保罗·艾伦的资助下创立的艾伦细胞科学研究所(Allen Institute for Cell Science)最近公布了一项研究成果,利用卷积神...

1183
来自专栏TensorFlow从0到N

TensorFlow从0到1 - 3 - 人类学习的启示

? 机器学习 上一篇TensorFlow的内核基础介绍了TF Core中的基本构造块,在介绍其强大的API之前,我们需要先明了TF所要解决的核心问题:机器学习...

3306
来自专栏大数据文摘

机器也有品味:谷歌最新算法让街景图具有专业摄影师审美

1452
来自专栏专知

音乐演奏家恐将失业,Facebook首次提出音乐风格翻译

2616
来自专栏AI科技评论

【深度】Nature:我们能打开人工智能的“黑箱”吗?

编者按:人工智能无处不在。但是在科学家信任人工智能之前,他们首先应该了解这些人工智能机器是如何运作的,这也就是文中所提到的“黑箱”问题。在控制论中,通常把所不知...

3166
来自专栏PPV课数据科学社区

图表有陷阱,读图需谨慎!

无论你就职于哪个公司,每到年底你都免不了制作或处理一些图表。不管是个人总结、业绩表现还是财务报告,图表以其清晰直观的形式受到许多管理层的追捧。公司也逐渐开始将复...

2926
来自专栏人工智能LeadAI

TensorFlow从0到1丨第3篇:人类学习的启示

上一篇TensorFlow的内核基础介绍了TF Core中的基本构造块,在介绍其强大的API之前,我们需要先明了TF所要解决的核心问题:机器学习。 什么是机器学...

4294
来自专栏大数据文摘

VR如何巧妙填补传统数据视觉化的漏洞

1794
来自专栏专知

【干货】追本溯源:5种受生物启发的人工智能方法

【导读】1月15日,机器学习研究人员Luke James(简介见文末)发布一篇博文,介绍了5种受到生物启发的人工智能方法,包括人工神经网络(人脑神经元)、遗传算...

3557

扫码关注云+社区