开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >从AI顶会最佳论文，看深度学习的理论基础

从AI顶会最佳论文，看深度学习的理论基础

作者头像

计算机视觉研究院

发布于 2021-03-15 08:35:05

3850

发布于 2021-03-15 08:35:05

举报

文章被收录于专栏：计算机视觉战队

欢迎关注“计算机视觉研究院”

计算机视觉研究院专栏

作者：Edison_G

如同物理大时代寻求统一的量子力学，深度学习也许也需要一个统一的理论框架。

MIT 教授 Tomaso Poggio 曾在他的系列研究中 [1] 表示深度学习理论研究可以分为三大类：

表征问题（Representation）：为什么深层网络比浅层网络的表达能力更好？
最优化问题（Optimization）：为什么梯度下降能找到很好的极小值解，好的极小值有什么特点？
泛化问题（Generalization）：为什么过参数化仍然能拥有比较好的泛化性，不过拟合？

19 年顶会关于理论的研究

统计数据可见附录A：https://www.jiqizhixin.com/articles/2020-01-01-20。

一般偏算法或模型的论文，阅读起来还是非常友好的，论文会介绍直观想法、形式化过程及最终结果。但偏理论的论文会要求很多领域知识，尤其是坚实的数学基础。文章后面会具体介绍几项代表性研究，但现在，我们还是先看看整体都是什么样的。

有问题的泛化性

论文 [2] 一作 Vaishnavh Nagarajan 说：「之前的研究大多数都基于一致性收敛考虑泛化边界，但我们的研究表明这类问题很可能是局限的。」目前 Rademacher Complexity、Covering Numbers 和 PAC-Bayes 等众多前沿泛化边界分析都可能存在问题。

正如上式所示，即使再精炼，一致性收敛边界可能推导出约等于 1，但真实的泛化差距可能接近于 0。这样的结果是非常虚的，它并起不到什么作用。

VGG-19 在 CIFAR-10 上的测试效果，从左到右分别是迭代 30K、60K、112K 的结果。选自：arXiv:1803.03635。

参考文献：

[1]Theoretical Issues in Deep Networks: Approximation, Optimization and Generalization, arXiv:1908.09375

[2]Uniform convergence may be unable to explain generalization in deep learning, arXiv:1902.04742

[3]The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks, arXiv:1803.03635

[4]Rates of Convergence for Sparse Variational Gaussian Process Regression, arXiv:1903.03571

[5]Neural Ordinary Differential Equations, arXiv:1806.07366

[6]Solving Imperfect-Information Games via Discounted Regret Minimization, arXiv:1809.04040

[7]Nonparametric density estimation & convergence of GANs under Besov IPM losses, arXiv:1902.03511

[8]A Simple Theoretical Model of Importance for Summarization, arXiv:1801.08991

[9]Density estimation by wavelet thresholding, David L Donoho et al.

© THE END

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2021-03-01，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自计算机视觉战队微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.

相关产品与服务

图像处理

图像处理基于腾讯云深度学习等人工智能技术，提供综合性的图像优化处理服务，包括图像质量评估、图像清晰度增强、图像智能裁剪等。

产品介绍产品文档

精选特惠用云无忧