前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Bengio NIPS 最新论文:用线性分类探测器理解中间层,更好地诊断神经网络模型

Bengio NIPS 最新论文:用线性分类探测器理解中间层,更好地诊断神经网络模型

作者头像
新智元
发布2018-03-23 17:30:32
7500
发布2018-03-23 17:30:32
举报
文章被收录于专栏:新智元新智元

【新智元导读】本文介绍 Bengio 和他的学生 Guillaume Alain 的最新论文,这篇论文也被即将于 12 月举行的著名会议 NIPS 接收。本文中,作者引入了一叫做“线性分类探测器”的概念,用于理解一个神经网络模型中各个中间层的作用。使用这种方法,他们顺利地诊断出模型中的一些问题,增进了对深度神经网络的理解,在设计和诊断深度学习模型时都有帮助。

本文中,作者引入了“线性分类探测器”的概念,从熵(Shannon entropy)——描述随机变量所含信息状态的经典方法——的概念讲起,然后试着将这一概念用于理解神经网络模型中间层的作用,从而测量每一层额外获得了多少信息(答案:从技术上讲几乎没有)。

在这种方法失败后,作者又提出了一种新的框架,这一次,他们提出了不同的问题,那就是如果使用给定层的输入对一个最优线性分类器进行训练,这个最优线性分类器的性能会如何?结果证明,这一强大的概念对于理解深度神经网络在训练中以及训练后所涉及的动态十分有用。

论文:使用线性分类探测器理解中间层

作者:加拿大蒙特利尔大学 Guillaume Alain & Yoshua Bengio

摘要

神经网络模型以身为黑箱著称。我们提出了一种新的方法,更好地理解中间层的作用和动态。这对于设计神经网络模型有直接的影响,使专家能够证明某些探索法(heuristics),例如 Inception 模型里的 auxiliary head。我们使用线性分类器的方法,称之为“探测器”(probe),一个探测器只能使用给定中间层的隐藏单元作为判别特征(discriminating features)。此外,这些探测器不能影响模型的训练阶段,一般都在训练完成以后才被加上去。探测器允许使用者在训练的多个步骤中对模型的状态进行可视化。我们展示了这种方法如何更好地理解一个已知的模型,并且诊断可能存在的问题。

熵很重要,计算的便利性也很重要

论文要点

一个有问题的 128 层神经网络模型。从第 0 层到第 64 层会跳过一个连接。作者使用探测器检测每一层,看如果它们是线性分类器的话表现会如何。结果发现,模型完全无视第 1 到第 63 层,哪怕训练很长时间也不行。使用探测器,作者从视觉检测中发现了模型的问题。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-10-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档