文章/答案/技术大牛

发布

即使当二阶导数为负时，scipy.optimize.minimize牛顿-CG也会停止

scipy.optimize.minimize中的牛顿-CG（Newton-Conjugate Gradient）算法确实可能在二阶导数为负的情况下停止，但这并不意味着算法无法正确处理这种情况。牛顿-CG算法在每次迭代中会计算目标函数的海森矩阵（Hessian Matrix），并尝试通过其逆来更新解。海森矩阵是正定的是牛顿法收敛的充分必要条件，但在实际应用中，由于数值计算的误差，有时计算出的海森矩阵可能不是正定的，或者二阶导数的符号在迭代过程中发生变化。

牛顿-CG算法在二阶导数为负时停止的原因

数值误差：在计算海森矩阵时，可能会由于数值精度的问题导致矩阵不被正定。
二阶导数变化：目标函数的二阶导数可能在迭代过程中发生变化，即使最初是正的，也可能在接近最优解时变为负的。

如何确保牛顿-CG算法的正确性

检查海森矩阵的正定性：在每次迭代后，可以检查海森矩阵是否正定。如果发现不是正定的，可以采取相应的措施，比如使用拟牛顿法（如BFGS）来代替牛顿-CG。
调整容忍度：牛顿-CG算法对误差容忍度（tolerance）非常敏感，适当调整tol参数可能有助于算法在二阶导数为负的情况下也能继续收敛。

牛顿-CG算法的相关信息

基础概念：牛顿-CG算法是一种利用二阶导数信息的优化算法，它通过迭代逼近函数的最小值。
优势：收敛速度快，特别是在目标函数的二阶导数信息可用时。
类型：无约束优化算法。
应用场景：适用于需要快速收敛到最优解的问题，尤其是在科学计算和工程设计中。

通过上述分析，我们可以看到，即使二阶导数为负，牛顿-CG算法也有可能停止，但这并不一定意味着算法失效。通过适当的调整参数和检查海森矩阵的正定性，可以进一步提高算法的稳定性和收敛性。

页面内容是否对你有帮助？

有帮助

没帮助

即使当二阶导数为负时，scipy.optimize.minimize牛顿-CG也会停止

、、

尝试最小化sigmoid曲线f(x)=1/(1+exp(-x)) (在负无穷大处收敛到0，在无穷大处收敛到1) scipy.optimize.minimize(lambda x: 1/(1+np.exp(x)*(np.exp(x)-1))/(np.exp(x)+1)**3,jac = lambda x:1/(np.exp(-x/2)+np.exp(x/2))**2,method = 'Newton-CG这意味着，算法只是简单地停在它所在的位置，并声称最小值为</e

浏览 12提问于2018-01-30得票数 0

回答已采纳

3回答

提高学习多项logistic回归的速度

、

# training the modelclf = LogisticRegression(solver='newton-cg

浏览 7提问于2020-07-09得票数 0

1回答

算法中的一个奇怪的错误

、

我编写了这样的函数，它根据牛顿-拉夫森算法从Cauchy分布数值计算MLE： mlec <- function(x,theta0=median(x),numstp=100,eps=0.01){

浏览 1提问于2014-10-25得票数 3

回答已采纳

1回答

错误拐点

、

Point {i}') 然而，我得到了以下情节：我预计拐点会减少

浏览 9提问于2022-12-01得票数 0

回答已采纳

2回答

Python Newton Raphson Decimal Root

、、

我有一个函数(牛顿-拉夫森算法)：“数字”：根的期望精度。

浏览 1提问于2016-12-23得票数 1

回答已采纳

1回答

用隐式Euler和共轭梯度线性求解器求解非零Dirichlet BCs的热方程

、、

许多用户询问如何在内部线性求解器中使用非零Dirichlet BCs和共轭梯度来求解热方程u_t = u_xx。这是一个常见的简化PDE问题，在转移到更难的抛物线PDE之前。在DifferentialEquations.jl中如何做到这一点？

浏览 47提问于2019-02-06得票数 6

回答已采纳

2回答

神经网络体系结构设计

、、

我生成了一个非常简单的数据集，它由一个凸区域组成，如下所示：当我使用具有L= 1或L=2个隐藏层(加上输出层)的体系结构时，一切都很好，但是一旦我添加了第三个隐藏层(L = 3)，我的性能就会下降到略好于机会有谁能帮我理解为什么在这么简单的任务上增加一个额外的隐藏层会让我的表现下降呢？下面是我的性能与使用的层数的函数关系的图像：添加了部分由于注释：我使用早期停止(在40000次反向支持迭代之后)作为停

浏览 5提问于2013-11-15得票数 10

回答已采纳

1回答

Lightgbm (或其他具有二阶近似损失的树实现)是如何处理L1损失的？

、、、

我一直在试图弄清楚Lightgbm无手L1是如何丢失的(MAE，MAPE，HUBER) 然而，对于L1损耗，损耗梯度的绝对值为常数，其绝对值为0。然而，即使使用恒量的恒量，对我来说也是没有意义的:例如，当使用MAE时，梯度是误差的标志，而平方梯度没有给我们提供信息。这是否意味着当梯度为常数

浏览 0提问于2020-02-09得票数 2

4回答

Python -实现了一个数值方程求解器(牛顿-拉夫森)

、、

我警告你，这可能会让人困惑，我编写的代码更像是一张思维图，而不是已完成的代码。我正在努力实现牛顿-拉夫森方法来求解方程.我不知道怎么写这个在Python中，从最后的近似(xn)中计算下一个近似(xn+1)。我必须使用一个循环，以接近真实的答案，当近似之间的变化小于变量h时，循环应该终止。 def导数</em

浏览 0提问于2013-12-18得票数 3

4回答

CardView:让子项目重叠

、、

我已经知道负边距的用法了，但我的主要问题是有谁能解决这个问题吗？

浏览 3提问于2017-04-27得票数 7

回答已采纳

3回答

在二叉树中，检查给定的节点是否为叶节点

、、

我已经编写了代码来查找给定节点是否是叶节点，它在肯定的情况下工作得很好，即当输入的节点是叶节点时，代码遍历到节点，如果它是叶节点，则给出输出并停止，但是当输入的节点不是叶节点时，负情况是失败的，即使代码已经通过节点并且不是叶节点，代码也会继续遍历整个树。return true;return (isLeaf(node.left, data) || isLeaf(node.right, data));如果找到了节点并且它不是叶

浏览 1提问于2015-12-13得票数 4

回答已采纳

1回答

反向传播vs Levenberg Marquardt

、、

有人知道反向传播和Levenberg-Marquardt在神经网络训练中的区别吗？有时我看到LM被认为是一种BP算法，有时我看到相反的情况。我们将非常感谢您的帮助。谢谢。

浏览 23提问于2019-09-14得票数 0

2回答

如何结合多个目标进行优化？

、、

我想找到x和y的值，这样：那么，如何将这两个函数组合成一个表达式，然后将其最小化(使用类似牛顿的方法)？我的第一次尝试是100

浏览 2提问于2017-08-25得票数 3

6回答

为什么我们在计算反向传播算法时要取传递函数的导数？

、、

求导数背后的概念是什么？有趣的是，为了以某种方式教授一个系统，我们必须调整它的权重。但我们为什么要用传递函数的导数来做这件事。在推导中有什么对我们有帮助。我知道导数是连续函数在给定点的斜率，但它与问题有什么关系？

浏览 0提问于2016-03-03得票数 5

3回答

归一化数据下具有tanh错误饱和度的神经网络

当输出误差评估发生时，神经元饱和错误。如果期望输出为1，而实际输出为-1，则错误为1-(-1)= 2。当我将它乘以激活函数error*(1-output)*(1+output)的导数时，由于2*(1-(-1)*(1-1)，误差几乎变成了0。如何避免这种饱和度错误？

浏览 0提问于2012-11-30得票数 11

回答已采纳

4回答

在最少的计算次数中找到全局最大值

、

然而，这个算法仍然没有使用我计算的点处的导数的强度。

浏览 0提问于2016-04-14得票数 0

1回答

为曲线设置nls参数

当绘制它们时，它们会产生一条平坦的S曲线，大部分数据点最终接近于零值。一小部分数据点远离创造了几乎两条J曲线，一条向下，一条向上。我需要找到数据向上或向下急剧变化的拐点。这可能是我数学中的一个问题，但在我看来，如果我能平滑和拟合一条曲线，并得到一个方程，我就可以取曲线的二阶导数，从二次导数变化的符号处确定拐点。我在excel中试了一下，用曲线得到了近似的拟合，得到了开始的公式，但是数据中有一点“摆动”，所以即使我想手动完成，也不可能确定任何一个拐点(但

浏览 1提问于2013-01-25得票数 0

回答已采纳

0回答

ListView拇指偏移量中的SeeKBar未按预期工作

、、

为了完成这项工作，我在SeekBar中使用了setThubOffset()方法，偏移量为负，偏移量在拇指移动时起作用。 

浏览 3提问于2017-01-03得票数 0

1回答

如何使光滑样条插值设置导数仅在特定的点，在Python？

、、、、

例如，假设数组X定义对象的位置，点对点，我希望用样条表示可行的轨迹，但也要确保速度(一阶导数)在起点和终点都为零，其他点对导数没有约束。在这个例子中，我也希望在相同的点上加速度(二阶导数)等于零。我试过的我知道BPoly类scipy.interpolate的方法scipy.interpolate，但这构成了一个关键问题，即当没有在任何点指定导数时，该算法不能保证平稳过渡，正如注意到的。我也尝试了什么是提议的，但正如预期，同样的问题出

浏览 11提问于2020-02-10得票数 3

2回答

分段贝塞尔曲线通过垂线检验吗？

、、

考虑一条具有N段的分段三次Bezier曲线，该曲线由4N个控制点定义。如何确定此曲线是否通过垂直线测试？也就是说:是否存在点x，y1，y2使得y1!=y2并且(x，y1)和(x，y2)都位于曲线上？另外，返回点x，y1，y2的值是很好的，但不是必须的，如果这样的点存在的话。

浏览 3提问于2021-07-13得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

即使当二阶导数为负时，scipy.optimize.minimize牛顿-CG也会停止

牛顿-CG算法在二阶导数为负时停止的原因

如何确保牛顿-CG算法的正确性

牛顿-CG算法的相关信息

相关·内容

即使当二阶导数为负时，scipy.optimize.minimize牛顿-CG也会停止

提高学习多项logistic回归的速度

算法中的一个奇怪的错误

错误拐点

Python Newton Raphson Decimal Root

用隐式Euler和共轭梯度线性求解器求解非零Dirichlet BCs的热方程

神经网络体系结构设计

Lightgbm (或其他具有二阶近似损失的树实现)是如何处理L1损失的？

Python -实现了一个数值方程求解器(牛顿-拉夫森)

CardView:让子项目重叠

在二叉树中，检查给定的节点是否为叶节点

反向传播vs Levenberg Marquardt

如何结合多个目标进行优化？

为什么我们在计算反向传播算法时要取传递函数的导数？

归一化数据下具有tanh错误饱和度的神经网络

在最少的计算次数中找到全局最大值

为曲线设置nls参数

ListView拇指偏移量中的SeeKBar未按预期工作

如何使光滑样条插值设置导数仅在特定的点，在Python？

分段贝塞尔曲线通过垂线检验吗？

扫码

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐