l-bfgs_最大熵l-bfgs算法伪代码_如何使用牛顿或L-BFGS作为优化器？ - 腾讯云开发者社区

、

我想使用Mallet的优化功能。我从开始，结果如下： 0.33083508103423664, -0.5006075619899537 Exiting L-BFGS on termination #1: value difference below tolerance (oldValue: 19.33277696022755 newValue: 19.333313133013398 正如预期的那样，结果接近0.33和-0.5。但是，“在终止#1时退出L-BFGS”是什么意思？

浏览 4提问于2018-08-16得票数 2

1回答

spark线性回归模型迁移到1.6.1后的训练失败

、

我用火花-毫升来训练线性回归模型。它非常适用于spark版本1.5.2，但现在对于1.6.1，我得到了以下错误： java.lang.AssertionError: assertion failed: lapack.dppsv returned 228. 它似乎与一些低水平的线性代数库有关，但它在火花版本更新之前工作得很好。在这两个版本中，我在培训开始前都会收到相同的警告，表示它不能加载BLAS和LAPACK。 [Executor task launch worker-6] com.github.fommil.netlib.BLAS - Failed to load implementati

浏览 3提问于2016-06-03得票数 0

回答已采纳

0回答

第三方库的使用

、

我对使用带有第三方库的Alea GPU很感兴趣，并且正在尝试了解我的选择。具体来说，我对使用很感兴趣。我是F#生态系统的新手，但确实有CUDA和函数式编程的经验。我一直在使用L-BFGS库作为实现逻辑回归的程序的一部分。如果我能假设这个库是正确的，并用类型安全的F#编写我的其余代码(包括在GPU上运行的代码)，那就太好了。这似乎是可能的。假设我知道如何将L-BFGS库集成到F#程序中，那么引入Alea GPU会导致任何问题吗？我试图避免的是使用Alea在F#中重写L-BFGS。然而，也许这实际上是使用F#的最简单方法。如果Alea有任何用于非线性优化的工具，我可能会使用这些工具。

浏览 23提问于2017-01-04得票数 2

回答已采纳

2回答

Mallet CRF SimpleTagger性能调优

、、、

对于使用过条件随机场(CRF)的Java库Mallet的SimpleTagger类的任何人来说，这是一个问题。假设我已经对可用的最大CPU数量使用了多线程选项(这就是这种情况)：我应该从哪里开始，如果我需要它运行得更快，我应该做些什么？一个相关的问题是，是否有一种方法可以做一些类似于随机梯度下降的事情，从而加快训练过程？我想要做的培训类型很简单： Input: Feature1 ... FeatureN SequenceLabel ... Test Data: Feature1 ... FeatureN ... Output: Feature1 ... FeatureN Sequen

浏览 0提问于2011-03-28得票数 5

回答已采纳

2回答

相当于C++中的python:scipy.optimize()？

、、、、

具体地说，我正在寻找像scipy.optimize.fmin_l_bfgs_b这样的优化器函数。有人能帮帮我吗？或者提供指针？谢谢!

浏览 2提问于2012-05-18得票数 6

2回答

TypeError: MLPClassifier()得到了一个意想不到的关键字参数‘算法’

、

我刚刚安装了scikit-learn v0.18 dev软件包。当我在iPython上调用以下内容时； >>> from sklearn.neural_network import MLPClassifier >>> clf = MLPClassifier(algorithm='l-bfgs', alpha=1e-5, hidden_layer_sizes=(5, 2), random_state=1) 没有错误。但是，当我编写python脚本文件并在其上运行代码时，我会得到以下错误： clf = MLPClassifier(algorit

浏览 8提问于2016-02-19得票数 4

回答已采纳

1回答

如何使用scipy优化函数

、、、、

我正在学习使用scipy和keras进行图像风格迁移。我正在尝试运行示例代码，但在使用scipy.optimize.fmin_l_bfgs_b时遇到错误： x, min_val, info = fmin_l_bfgs_b(evaluator.loss, x.flatten(),fprime=evaluator.grads, maxfun=20, epsilon=1e-7) 但我得到一个错误： ValueError: failed to initialize intent(inout) array -- expected elsize=8 but got 4 其中evaluator是类Evalu

浏览 26提问于2018-10-11得票数 1

2回答

用于窗口上多维函数最小化的数值库

、

我们需要在数值上最小化一个以三维向量为输入的函数。函数是平滑的，所以梯度算法将是一个很好的选择。然而，我习惯了GSL，不幸的是需要gcc。不过，我们必须在使用VC++ 2010的Windows上工作。我找到了一个适用于windows的GSL端口，但最后一次提交是在2006年，我怀疑它是否适用于我们的设置。 windows上有哪些库，并且推荐使用哪些库？我们只需要解决这一个问题，所以库越专业越好。我们使用的是C++，所以应该有一个C或C++接口可用。

浏览 1提问于2011-10-25得票数 2

1回答

ML (Spark 1.6.2)中Logistic回归的优化程序

、、

亲爱的Apache Spark Comunity：我已经读了Spark的文档好几个星期了。我在MLlib中阅读了Logistic回归，我意识到Spark使用了两种优化例程(SGD和L-BFGS)。但是，目前我正在阅读ML中的LogistReg文档。我无法清楚地看到开发人员使用的是哪种优化方法。我如何请求此信息？非常感谢凯文·艾萨克·卡巴哈尔

浏览 13提问于2016-07-28得票数 1

1回答

SparkR MLlib & spark.ml:最小二乘和广义线性模型优化

、、、

谁能解释一下如何在SparkR操作glm中指定优化方法？当我尝试用glm拟合OLS模型时，我只能指定"normal"或"auto"作为求解器类型。SparkR不能解释求解器规范"l-bfgs"，这使我相信当我指定"auto"时，SparkR只是假定"normal“，然后使用LS法方程解析地估计模型系数。用随机梯度下降和L-BFGS拟合GLM在SparkR中是不可用的，还是我写错了下面的评估？ m <- SparkR::glm(y ~ x1 + x2 + x3, data = df, solver = "l-

浏览 1提问于2016-07-12得票数 2

1回答

Pyspark k重交叉验证平均RMSE

、

我使用Pyspark在数据集上运行线性回归和k重交叉验证。目前我只能确定最佳模型的均方根误差。但我想要在交叉验证中评估的所有模型的平均RMSE。如何在交叉验证中获得所有评估模型的平均RMSE？ from pyspark.ml.regression import LinearRegression from pyspark.ml.evaluation import RegressionEvaluator from pyspark.ml.feature import VectorAssembler from pyspark.ml.evaluation import BinaryClassifica

浏览 9提问于2018-12-17得票数 2

3回答

具有来自UFLDL的Tanh激活的稀疏自动编码器

、、、

我一直在研究UFLDL教程(在matlab/octave中)：并且已经在不同的数据集上尝试了稀疏自动编码器。我尝试在时间序列数据上运行它，但遇到了问题。由于输入数据具有负值，因此S型激活函数(1/1 + exp(-x))是不合适的。在tanh中进行替换时，优化程序minfunc (L-BFGS)失败(步长小于TolX)。我大幅降低了TolX常量，但没有任何变化。我将输出层改为线性，输入层保持为sigmoid，但这不是一个更好的解决方案。自动编码器的输出被放大一个常数(0.5)，这使得成本函数变差。所以..。简而言之：为什么Tanh激活函数不能与L-BFGS一起工作？(或者是其他问题)？

浏览 2提问于2012-07-11得票数 1

1回答

vowpal wabbit如何与梯度下降算法一起工作？

我一直在尝试理解vowpal的wabbit算法。有没有人能帮我理解大众汽车以及如何实施它？

浏览 3提问于2014-09-02得票数 3

2回答

使用LinearRegression时断言错误

、、、

我试图帮助一个朋友，他试图在一个信号中使用LinearRegression。数据包含20,000条记录和两列(时间和脉冲)，我正在Databricks‘中运行它。我的方法非常简单和偏颇，我知道，我试图添加更多的人工特性，为此，我创建了这个简单而又有用的函数。 def featuresCreator(x, grad, acc): if (grad > 0): return [x ** grad] else: return [x ** grad] + featuresCreator(x, grad - acc, acc) featuresUDF = udf(lamb

浏览 5提问于2016-05-31得票数 3

回答已采纳

1回答

带噪声函数的共轭梯度

、

好的，我正在做RMS prop或SGD来让神经网络学习它的参数。但是，过了一段时间，训练和验证错误似乎都停滞不前了(除了随机波动:我正在使用dropout)。因此，我决定尝试使用共轭梯度来精化值。很明显我还是不想让它过大，所以我保留了辍学...但是，当然，这会使优化函数变得嘈杂。所以，我想我的问题是:共轭梯度(或L-BFGS等)需要无噪音功能吗？或者它们可以在有噪音的情况下工作吗？谢谢!

浏览 1提问于2015-06-02得票数 0

1回答

当使用随机梯度下降和幕府NeuralNetwork时，所有的分类都是相同的

、、、、

我试图将一些样本分类为1或0，但是当使用随机梯度下降作为优化算法时，所有的东西都被分类为1或0。当使用默认值(L-BFGS)时，它按预期工作，并将样本分类为1和0。我试着调整动量、学习率、批量大小、衰减和误差系数，但每次的误差都是相同的。任何帮助都将不胜感激！ num_feats = X_train.get_num_features() layers = DynamicObjectArray() layers.append_element(NeuralInputLayer(num_feats)) layers.append_element(NeuralLogisticLayer(16)) l

浏览 7提问于2018-03-06得票数 0

回答已采纳

2回答

逻辑回归中Mllib如何选择变量

、、、、

我有一个关于星火中MLlib的问题。(关于Scala) 我正在努力理解LogisticRegressionWithLBFGS和LogisticRegressionWithSGD是如何工作的。我通常使用SAS或R进行逻辑回归，但为了能够分析大数据，我现在必须在Spark上这样做。变量选择是如何完成的？在LogisticRegressionWithLBFGS或LogisticRegressionWithSGD中有不同变量组合的尝试吗？一个接一个地测试变量的重要性？还是用兴趣变量进行相关计算？是否有计算BIC、AIC来选择最佳型号？因为模型只返回权重和拦截..。我如何理解那些星火函数，并与我习

浏览 0提问于2015-05-04得票数 4

2回答

用optim与GARCH的收敛性

、

我试图用optim函数为R中最优的GARCH模型寻找参数。然而，我的价值观是高价值的，这是没有道理的。我在MATLAB中用fminsearch实现了一个类似的算法，效果更好。不过，我想在R. 这是我的密码： lklh.garch = function(theta){ value = 0 value = log(dnorm(returns[1], 0, theta[4])) sigma = theta[4]^2 for(i in 2:1001) { variance = (1-theta[1]-theta[2])*theta[3]+the

浏览 4提问于2013-08-30得票数 2

回答已采纳

1回答

使用带有tensorflow和随机网络元素的外部优化器

我一直在使用来自openopt的l优化器使用Tensorflow。很容易设置回调，以允许Tensorflow计算l-bfgs的梯度和损失评估，但是，我很难在训练过程中引入像退出这样的随机元素。在线性搜索过程中，loss对损失函数进行多次评估，而损失函数需要与先验梯度计算在同一网络上运行。但是，对于tf.nn.dropout函数的每一次计算，似乎都会创建一组新的退出。我正在寻找一种方法来修复丢失函数的多重评估中的退出，然后允许它在loss的梯度步骤之间进行更改。我假设这与tensorflow中的控制流操作有关，但是对于如何使用这些操作并没有一个很好的教程，对我来说它们有点神秘。谢谢你的帮忙!

浏览 2提问于2016-05-04得票数 3

回答已采纳

8回答

.NET在数值计算中的速度

、、、、

根据我的经验，.NET比原生代码慢2到3倍。(我实现了用于多变量优化的L-BFGS )。我把stackoverflow上的广告追踪到了速度真的很惊人，速度接近原生代码。他们怎么能这样做呢？他们说：问: NMath是“纯粹的”.NET吗？答:答案在一定程度上取决于你对“纯.NET”的定义。NMath是用C#编写的，外加一个小的托管C++层。但是，为了提高基本线性代数运算的性能，NMath依赖于原生的英特尔数学内核库(包含在NMath中)。但是没有COM组件，没有DLLs-只有.NET程序集。此外，在托管C++层中分配并由本机代码使用的所有内存都是从托管堆中分配的。有人能给我解释一下吗

浏览 88提问于2009-12-02得票数 18

回答已采纳

1回答

SGD分类器和Logisitc回归有什么区别？

、、、

据我理解，SGD分类器和Logistic回归似乎相似。损失=对数的SGD分类器实现Logistic回归，损失=铰链实现线性支持向量机。我还了解到logistic回归采用梯度下降作为优化函数，SGD采用随机梯度下降，收敛速度要快得多。但这两种算法中哪一种会在哪种情况下使用？另外，SGD和Logistic回归有什么相似之处，它们又有何不同？

浏览 0提问于2018-09-07得票数 10

1回答

优化算法中的起始值

、

我正在尝试使用C#的Accord.net数学包中的L-BFGS解算器。但是，我找不到如何定义优化的起始值。我们如何定义它呢？根据官方示例，以下语法定义了优化过程中x的初始值。然而，在下面的示例中，它不能正常工作-就好像算法使用了另一个起点一样。 //Target function to minimize; public double f(double[] x) { double z = Math.Cos(x[0])-0.2*x[0] + x[1] * x[1]; //Function with multiple local minima : x ~ { (2n+1)pi , 0 }

浏览 15提问于2019-05-29得票数 1

回答已采纳

1回答

使用相同的代码和数据，FBProphet预测结果会有很大不同

、、

我使用的是Python3.5，使用相同的代码和数据，FBProphet的预测结果会有很大的不同，但使用相同的代码和数据集的每次运行的预测y^可能会有很大的不同。以下是我的FBprophet预测代码 m = Prophet(interval_width=1) m.fit(df) future = m.make_future_dataframe(periods=365) future.tail() forecast = m.predict(future) 这篇文章提到，我们可以选择不同的预测算法，从牛顿到L-BFGS，牛顿应该提供更多可重复的结果。

浏览 70提问于2020-10-14得票数 0

1回答

在斯坦福NER中，单词是如何转换为向量的

、

我正在看斯坦福大学的NER，我想知道这些单词是如何表示的。当使用线性CRF训练模型时，它们是否使用Word2Vec或Glove转换为向量。更多的研究表明，数据存储在CRFDatum结构中。有没有人能详细说明一下？

浏览 11提问于2017-07-21得票数 0

回答已采纳

1回答

不能在R上运行LBFGS

、

我试图在R上运行R，但我总是能得到这样的结果： L-BFGS optimization terminated with status code = -1001 fx = -0.0119691 我尝试了不同的设置，但我一直得到相同的结果。 TI <- read.csv("Alphabet01-2000.csv", header = TRUE) TIn <- TI[9:28] relPreisBew <- TI[8] x <- vector(mode = "numeric", length = 20L) i <- integer()

浏览 4提问于2016-06-06得票数 3

2回答

实现二阶导数的自动微分:遍历计算图的算法？

、、

我正在尝试为Python统计软件包实现 (问题公式类似于优化问题公式)。计算图是使用操作符重载和工厂函数生成的，例如sum()，exp()等。我已经使用反向累加实现了梯度的自动微分。然而，我发现实现二阶导数(黑森导数)的自动微分要困难得多。我知道如何进行单独的第二部分梯度计算，但我想不出一种智能的方法来遍历图形并进行累加。有没有人知道好的文章，给出了二阶导数的自动微分算法，或者开源库实现了相同的算法，我可以试着学习一下？

浏览 2提问于2010-07-04得票数 9

回答已采纳

1回答

如何管理一系列gsl_vector

、

我有一个作业要写一个迭代求解器(L-BFGS)，它需要保存10个向量。并用最新的向量更新，同时删除最旧的向量。我正在使用gsl_vector进行所有其他计算，因此我想直接保存它们。我首先想到的是使用vector、vector.push_back和vector.erase。但是我发现很难使用它，因为gsl_vector对象是由指针声明的。如果我push_back指针，我仍然必须保留指针变量，这与我手动管理保存的10个变量没有区别。如果你能提供一些关于如何管理这种情况的指导，我们将不胜感激。下面是一个简短的示例代码： vector<gsl_vector*> storage(10)

浏览 15提问于2019-08-20得票数 0

回答已采纳

2回答

C++中非线性系统的求解

、、

我对数学和C++相当精通，可以轻松地在Matlab中完成以下工作。我只是想知道如何在C++中实现这一点，因为我对库可用性或其他解决问题的方法知之甚少：我希望‘解决’或近似一个系统，并获得6个系数。B= a0*x*x + a1*y*y + a2*x*y + a3*x + a4*y + a5。这里，B，x，y是有46个元素的数。我想我想缩小一下: a0*x*x + a1*y*y + a2*x*y + a3*x + a4*y + a5 -B 怎么继续？

浏览 3提问于2014-08-22得票数 0

回答已采纳

1回答

错误LNK2019: GPLVM代码中未解析的外部符号_lbfgs_

、、、

我正在尝试在VS10 中构建GP-LVM方法的公开可用的C++实现它使用了这里提供的"fortran-2-c"ed LAPACK：这样我以后就可以把它集成到我的PhD研究中了。我解决了所有其他错误，但这一次我仍然坚持： 1>COptimisable.obj : error LNK2019: unresolved external symbol _lbfgs_ referenced in function "public: void __thiscall COptimisable::lbfgsOptimise(void)" (?lbfgsOptimi

浏览 5提问于2012-11-22得票数 1

2回答

利用Optim.jl对Julia进行Logistic回归

、、

我试图在Julia中实现一个简单的正则logistic回归算法。我想使用Optim.jl库来最小化我的成本函数，但是我无法让它工作。我的成本函数和梯度如下： function cost(X, y, theta, lambda) m = length(y) h = sigmoid(X * theta) reg = (lambda / (2*m)) * sum(theta[2:end].^2) J = (1/m) * sum( (-y).*log(h) - (1-y).*log(1-h) ) + reg return J end function gra

浏览 1提问于2015-09-21得票数 7

回答已采纳

1回答

取Func<double[]，double>的负数

、、、

我有一个数学函数-exp{-(x - 1)²} - exp{-0.5*(y - 2)²}，它使用函数及其导数传递给BFGS算法。 Func<double[], double> f = (x) => Math.Exp(-Math.Pow(x[0] - 1, 2)) + Math.Exp(-0.5 * Math.Pow(x[1] - 2, 2)); Func<double[], double[]> g = (x) => new double[] { // df/dx = -2 * e^(-(x - 1)²)(x - 1). -2 *

浏览 4提问于2014-02-10得票数 1

回答已采纳

1回答

用网格法计算R输入函数的梯度误差

、、、、

我现在正在处理一个问题，我正在尝试使用Python中的Tensorflow概率优化器来解决我已经在R中定义的一个简单的优化问题。以下是几个步骤：步骤1:定义用于解决Rosenbrock香蕉函数的原始Python问题： import contextlib import functools import os import time import numpy as np import pandas as pd import scipy as sp from six.moves import urllib from sklearn import preprocessing import te

浏览 5提问于2021-04-08得票数 0

1回答

torch.optim.LBFGS()不更改参数

、、、

我试图优化图像角的坐标。类似的技术在Ceres中也能很好的工作。但在torch.optim，我遇到了一些问题。特别是，由于某些原因，优化器不会更改正在优化的参数。我没有太多的经验，所以我很确定错误是微不足道的。不幸的是，阅读这些文档对我没有多大帮助。优化模型类： class OptimizeCorners(torch.nn.Module): def __init__(self, real_corners): super().__init__() self._real_corners = torch.nn.Parameter(real_corners)

浏览 9提问于2022-07-18得票数 1

回答已采纳

1回答

二次规划与拟牛顿法

、

昨天，我发布了一个关于SVM Primal Form实现的一般概念的问题： "lejlot“帮助我理解了我正在解决的是一个QP问题。但是我仍然不明白我的目标函数是如何表示为QP问题的 () 我也不明白QP和拟牛顿法有什么关系我所知道的是，拟牛顿方法将解决我的QP问题，这个问题应该是由我的目标函数(我看不出其中的联系) 有人能给我讲讲这个吗？？

浏览 0提问于2014-05-23得票数 1

1回答

“主”java.lang.OutOfMemoryError:斯坦福自定义实体识别模型训练中的Java堆空间错误

、、、

我正在尝试训练一个自定义的NER模型来识别41个实体(训练集大约有6000行) 当我尝试运行中提供的培训命令时： java -cp stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier -prop austen.prop 这是我面临的错误： Exception in thread "main" java.lang.OutOfMemoryError: Java heap space at edu.stanford.nlp.optimization.AbstractCachingDiffFunction.en

浏览 1提问于2019-07-08得票数 1

回答已采纳

4回答

使用Tensorflow 2.0的枕优化器进行神经网络训练

、、、、

在Tensorflow 2.0的引入之后，枕木接口(tf.contrib.opt.ScipyOptimizerInterface)被删除。但是，我仍然希望使用scipy.optimize.minimize(method=’L-BFGS-B’)优化器来训练一个神经网络(keras模型序列)。为了使优化器工作，它需要输入一个函数(X0 ) ，其中x0是一个形状数组(n，)。因此，第一步将是“扁平”权重矩阵，以获得一个具有所需形状的向量。为此，我修改了提供的代码。这提供了一个函数工厂，用于创建这样一个函数(X0)。但是，代码似乎不起作用，损失函数也没有减少。如果有人能帮我解决这个问题，我会非常感激的

浏览 61提问于2019-11-25得票数 1

1回答

Cleartk - Mallet分类器在0个实例上训练，尽管那里有数据

、

我正在使用Cleartk (V.2.0) simple pipeline为CAS中的单个句子开发二进制分类器。然而，即使生成了训练数据，分类器在训练期间也不会拾取它，请参见下面的内容。我正在使用，特别是下面的代码片段： AnalysisEngineFactory.createPrimitiveDescription( <name-of-your-cleartk-annotator>.class, CleartkAnnotator.PARAM_IS_TRAINING, true, DirectoryDataWriterFactory.PARAM_OUTPUT

浏览 1提问于2014-10-03得票数 0

6回答

在命名实体识别中，BILOU标签意味着什么？

、

标题很好地概括了这个问题。我注意到，在一些论文中，人们提到了NER的BILOU编码方案，而不是典型的生物标签方案(例如Ratinov和Roth在2009年发表的这篇论文)。通过使用2003年的CoNLL数据，我知道 B stands for 'beginning' (signifies beginning of an NE) I stands for 'inside' (signifies that the word is inside an NE) O stands for 'outside' (signifies that the word

浏览 7提问于2013-06-15得票数 48

回答已采纳

2回答

Julia中的最大似然

我正在尝试使用最大似然来估计Julia中的正态线性模型。我使用了以下代码来模拟这个过程，其中只有一个截取和一个匿名函数，每个Optim文档都是关于不变的值： using Optim nobs = 500 nvar = 1 β = ones(nvar)*3.0 x = [ones(nobs) randn(nobs,nvar-1)] ε = randn(nobs)*0.5 y = x*β + ε function LL_anon(X, Y, β, σ) -(-length(X)*log(2π)/2 - length(X)*log(σ) - (sum((Y - X*β).^2) / (2σ^

浏览 0提问于2018-06-14得票数 2

2回答

非凸优化器

、、

我使用python2.7，并且需要找到多变量标量函数的最大值。换句话说，我有这个函数： def myFun(a,b,c,d,e,f): # complex calculation that takes about 30 seconds return res # res is a float 这个函数不是凸的。我为每个参数a，b，c，d，e和f指定了最小和最大可能值。我需要找出什么参数组合近似地导致myFun的最大值。我将为它提供一个良好的起点。我尝试了一个强力网格搜索，但考虑到我的函数需要很长时间来计算，它是不可行的。我已经调查过scipy包了。我特别了解了函数。这对我

浏览 3提问于2016-03-03得票数 7