首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

卷积神经网络全新的富有吸引力的AI架构

卷积神经网络(CNN)因其在目标识别和分类任务中的成功应用而被计算机视觉应用界所青睐。CNN是由堆叠在一起的多个神经元组成的。在神经元之间计算卷积需要大量的计算,因此通常使用池化来减小网络层的大小。卷积方法可以通过简单的计算来学习数据的许多复杂特征。通过对输入进行矩阵乘法和求和,我们可以得出问题的答案。

基本的卷积神经网络

我总是听到CNN到底有多优秀。但是他们什么时候会失败呢?

CNN在解决物体识别和分类问题方面确实取得了巨大的成功。然而,它们并不完美。如果输入CNN的对象处于一个CNN不熟悉的方向,或是出现在CNN从未见过的地方,那么它的预测任务很可能失败。

例如,如果你把一张脸颠倒过来,网络将不再能够识别眼睛、鼻子、嘴巴以及它们之间的空间关系。类似地,如果改变面部的特定区域(即切换眼睛和鼻子的位置),网络也可以识别脸部,但是它已经不是真正的脸部了。CNN只学习到了图像中的统计信息,但是他们没有学习基本的思维,即到究竟什么样子才会被称作是脸。

关于CNN为何不能学习思维的理论,人工智能之父杰弗里·辛顿(Geoffrey Hinton)针对于用于缩小网络规模和计算需求的池化操作哀叹道:

“在卷积神经网络中使用的池化操作是一个大错误,它工作得如此好就是一个灾难!”

池化层破坏信息,使得网络无法学习更高级的思维。因此,他着手开发一种新的体系结构,这种体系结构并不很依赖于这种池化操作。

什么是胶囊网络

Hinton 和 Sabour 从神经科学中借用了一些想法,即认为大脑被组织成了叫做胶囊 的模块。这些胶囊特别擅长处理物体的姿态(位置、大小、方向)、变形、速度、反照率、色调、纹理等特征。

他们推测,大脑肯定有一种机制,将低层次的视觉信息传递到它认为能最好的处理这些信息的胶囊。针对卷积神经网络模型性能不足的领域问题,人们提出了胶囊网络和动态路由算法。

胶囊表示图像中特定实体的各种特征。一种非常特殊的特征是图像中实例化实体的存在。实例化实体是诸如位置、大小、方向、变形、速度、反照率、色调、纹理等参数。表示其存在的一个简单方法是使用单独的逻辑单元,其输出是实体存在的概率。为了得到比CNN更好的结果,我们应该使用一个迭代的协议路由机制。这些特性称为实例化参数。在经典的CNN模型中是没有得到图像中目标的这些属性的。平均/最大池层减少了一组信息的大小,同时减少了其尺寸大小。

性能测试

在对10000幅图像的测试数据集进行测试时,我们对MNIST数据集的准确率达到99.61%,对FASHION MNIST数据集的准确率达到92.22%。

胶囊网络的优点和缺点

相比其他先进的技术,对MNIST数据集用胶囊网络有着最高的成功率。

使用较小的数据集将更加成功。(通过迫使模型在胶囊中学习特征变量,它可以更有效地用更少的训练数据推断出可能的变量。)

routing-by-agreement算法使我们能够区分有重叠图像的对象。

更容易用激活向量理解图像。

胶囊网络能够保留诸如同变性、色调、姿势、反照率、质地、变形、速度和对象位置等信息。

和一些出色的模型相比,CIFAR10 在数据集的表现上并不成功

没有在大规模的数据集上测试

由于采用协议路由算法,训练模型需要更多的时间。

不同路由算法的胶囊网络模型的应用表明,它是一个需要更多实验和正在发展的课题。

如上面的图例所示,当仅仅改变Kim Kardashian的图片方向,预测的准确度就会大幅下降。右边的图片,我们能很容易地看出来一只眼睛和她的嘴巴都放在错误的位置,这不是一个人该有的模样。然而,我们却看到这张图是被预测为是人的可能性是0.9。

一个被训练地很好的CNN模型在这个方法上会有一些问题。除了很容易地被特征被放置在错误位置的图片欺骗,对于不同方向的图片,CNN模型也很容易辨认不明。

毫无疑问,CNN会受到对抗性攻击的影响。这是一个会引起安全问题的重要约束,尤其当我们将一个隐形样式嵌入到对象中使其看起来像其它东西时。但是,正如我们已知,我们可以通过胶囊网络来解决这个问题!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190107A0JRPN00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券