首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

揭秘深度学习成功的数学原因:从全局最优性到学习表征不变性

来源:机器之心 本文长度为4900字,建议阅读7分钟 本文为深层网络的若干属性,如全局最优性、几何稳定性、学习表征不变性,提供了一个数学证明。 近年来,深度学习大获成功,尤其是卷积神经网络(CNN)在图像识别任务上的突出表现。然而,由于黑箱的存在,这种成功一度让机器学习理论学家颇感不解。本文的目的正是要揭示深度学习成功的奥秘。通过围绕着深度学习的三个核心要素——架构、正则化技术和优化算法,并回顾近期研究,作者为深层网络的若干属性,如全局最优性、几何稳定性、学习表征不变性,提供了一个数学证明。 论文:Ma

07

重新思考深度学习里的泛化

2017 ICLR提交的“UnderstandingDeep Learning required Rethinking Generalization”必然会打乱我们对深度学习的理解。 这里是一些总结:1.神经网络的有效容量对于整个数据集的brute-force内存是足够大的。2.即使对随机标签的优化仍然会很容易。事实上,与对真实标签的训练相比,训练时间只增加了一个小的常量。3.随机化标签只是一种数据变换,使的学习问题的所有其他属性保持不变。作者实际上引入了两个新的定义来表达他们观测的内容去描述关于“显式”和“隐式”正则化的讨论。删除,数据增加,权重共享,常规正则化都是显式正则化。隐含正则化是早期停止,批量规范和SGD。这是一个非常奇怪的定义,我们后续会讨论。

03
领券