开发者社区

文档建议反馈控制台

技术百科

搜索技术百科

技术百科

发布

技术百科首页 >梯度下降算法 >梯度下降算法如何处理局部最小值（Local Minima）？

梯度下降算法如何处理局部最小值（Local Minima）？

修改于 2023-07-25 22:12:41

687

词条归属：梯度下降算法

梯度下降算法在处理复杂函数时可能会陷入局部最小值，而无法达到全局最小值。下面是一些处理局部最小值的方法：

多次随机初始化

通过多次随机初始化模型参数，可以增加算法找到全局最小值的机会。

使用随机梯度下降算法

随机梯度下降算法每次只使用一个样本来更新模型参数，可以避免陷入局部最小值。

使用带动量的梯度下降算法

带动量的梯度下降算法可以避免陷入局部最小值，并且收敛速度更快。

使用自适应学习率的梯度下降算法

自适应学习率的梯度下降算法可以根据梯度的大小自动调整学习率，从而避免陷入局部最小值。

使用正则化技术

正则化技术可以减少过拟合的风险，从而避免陷入局部最小值。

相关文章

如何改进梯度下降算法

编程算法神经网络批量计算

基于梯度下降训练神经网络时，我们将冒网络落入局部极小值的风险，网络在误差平面上停止的位置并非整个平面的最低点。这是因为误差平面不是内凸的，平面可能包含众多不同于全局最小值的局部极小值。此外，尽管在训练数据上，网络可能到达全局最小值，并收敛于所需点，我们无法保证网络所学的概括性有多好。这意味着它们倾向于过拟合训练数据。

2019-09-04

1.3K0

Facebook FAIR实验室田渊栋等人最新论文：别担心深度网络中的虚假局部极小值

深度学习人工智能

【导读】近日，Facebook FAIR实验室、南加州大学与卡耐基梅隆大学提出《Gradient Descent Learns One-hidden-layer CNN: Don't be Afraid of Spurious Local Minima》文章证明了在高斯分布的输入和L2损失的条件下（1）对于两层的神经网络，存在虚假的局部极小，但是梯度下降可以以一定概率收敛到全局最优点，给出了单隐层神经网络梯度下降的多项式收敛保证。（2）梯度下降的训练过程分为两个部分，一个缓慢的开始阶段和一个线性速率的收敛

2018-04-11

8790

优化算法之Gradient descent with momentum

人生逆境时，切记忍耐；人生顺境时，切记收敛；人生得意时，切记看谈；人生失意时，切记随缘；心情不好时，当需涵养；心情愉悦时，当需沉潜。

触摸壹缕阳光

2020-02-26

9850

干货 | 分析梯度下降的轨迹，更好地理解深度学习中的优化问题

AI 科技评论按：神经网络的优化本质上是一个非凸问题，而简单的基于梯度的算法在实践中似乎总是能够解决这类问题。这种现象是深度学习的核心支柱之一，而目前有许多理论科学家家正试图解开这个谜：为什么基于梯度的方法能够在深度学习的优化中行之有效。

2018-12-27

9430

路径规划-人工势场法(Artificial Potential Field)

机器人编程算法

人工势场法是一种经典的机器人路径规划算法。该算法将目标和障碍物分别看做对机器人有引力和斥力的物体，机器人沿引力与斥力的合力来进行运动。

2022-04-28

1.6K0

点击加载更多

词条知识树 8个知识点