专栏首页arxiv.org翻译专栏具有密集连接性的卷积网络(cs Machine learning)
原创

具有密集连接性的卷积网络(cs Machine learning)

最近的研究表明,如果卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接,则可以进行更深入,更准确和有效的训练。在本文中,我们接受了这一说法,并介绍了密集卷积网络(DenseNet)。该网络以前馈的方式将每一层连接到其他每一层,层次结构为具有L层以及L连接的传统卷积网络-每个层与其后一层之间有一个连接-我们的网络具有L(L + 1)/ 2个直接连接。对于每个层,前面所有层的功能映射都可以输入,而它自己的功能映射可以使用所有后续层的输入。DenseNets具有几个引人注目的优势:它们减轻了梯度消失的问题,鼓励功能复用,并大幅提高参数效率。我们在四个竞争激烈的对象识别基准测试任务(CIFAR-10,CIFAR-100,SVHN和ImageNet)上评估了我们提出的体系结构。DenseNets在大多数方面都获得了超越现有技术的显着改进,同时需要更少的参数和计算即可实现高性能。

原文题目:Convolutional Networks with Dense Connectivity

原文:Recent work has shown that convolutional networks can be substantially deeper, more accurate, and efficient to train if they contain shorter connections between layers close to the input and those close to the output. In this paper, we embrace this observation and introduce the Dense Convolutional Network (DenseNet), which connects each layer to every other layer in a feed-forward fashion.Whereas traditional convolutional networks with L layers have L connections - one between each layer and its subsequent layer - our network has L(L+1)/2 direct connections. For each layer, the feature-maps of all preceding layers are used as inputs, and its own feature-maps are used as inputs into all subsequent layers. DenseNets have several compelling advantages: they alleviate the vanishing-gradient problem, encourage feature reuse and substantially improve parameter efficiency. We evaluate our proposed architecture on four highly competitive object recognition benchmark tasks (CIFAR-10, CIFAR-100, SVHN, and ImageNet). DenseNets obtain significant improvements over the state-of-the-art on most of them, whilst requiring less parameters and computation to achieve high performance.

原文作者:Gao Huang,Zhuang Liu,Geoff Pleiss,Laurens van der Maaten,Kilian Q. Weinberger

原文地址:https://arxiv.org/abs/2001.02394

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 从人体密集联系的部位学习3D人体形状和姿态(CS CV)

    尽管通过最新基于学习的方法取得了有价值的成果,但使用单像重建3D人体形状和姿态仍具有挑战性。常见的不对齐问题的出现是由于图像到模型空间的映射是高度非线性的,并且...

    DANDAN用户6837186
  • 用于人体感知和动作的基于端到端像素的深度主动推理(cs AI)

    我们提出了一种基于像素的深度主动推理算法(PixelAI),该算法受到人体感知的启发,并已成功验证了机器人的人体感知和动作作为一个用例。我们的算法结合了神经科学...

    DANDAN用户6837186
  • “为什么'芝加哥'具有欺骗性?” 建立面向人类的模型驱动教程(cs AI)

    为了使用机器学习模型支持人类决策,我们经常需要阐明模型中嵌入的对人类不显着,未知或违反直觉的模式。尽管现有方法着重于借助实时帮助来解释机器预测,但我们探索了模型...

    DANDAN用户6837186
  • TadGAN:基于生成对抗网络的时间序列异常检测 (CS)

    时间序列异常可以提供与各个领域面临的关键情况相关的信息,从金融和航空航天到IT、安全和医疗领域。然而,在时间序列数据中检测异常尤其具有挑战性,因为异常的定义模糊...

  • 【译】(数字化)平台思维的艺术

    作者: Amit Kaul (Vice President, Emerging Technology) & Ryan Murray (Director, Dig...

    JimmyLv_吕靖
  • 【论文推荐】最新7篇聊天机器人(Chatbot)相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

    【导读】专知内容组整理了最近七篇聊天机器人(Chatbot)相关文章,为大家进行介绍,欢迎查看! 1. Touch Your Heart: A Tone-awa...

    WZEARW
  • OTEANN:使用人工神经网络估算拼字法的透明度 (CS CompLang)

    为了将口语翻译成书面语言,大多数字母表启用了明确的音韵到字母规则。 但是,一些书写系统已经偏离了这个简单的概念,并且在测量偏离多少方面几乎没有研究。 在这项研究...

    shellmik
  • 松乐日志 2017 Week#52

    区块链技术造福食品和农业领域 Blockchain Technology Can Benefit Food and Agriculture 今年的重大事件之一是...

    企鹅号小编
  • 缺乏奖励的流形分析中的期权发现(CS AI)

    事实证明,选项是强化学习的有效工具,有助于改进探索和学习。 在本文中,我们提出了一种基于频谱图理论的方法,并推导了一种系统地发现选项而无需访问特定奖励或任务分配...

    RockNPeng
  • 10 Books that could Make you a Better C++ Programmer

    I just recently read a post by Programming Zen on 10 recent books that will make...

    ke1th

扫码关注云+社区

领取腾讯云代金券