均方误差损失函数计算_Keras损失函数不随均方误差减小_PyTorch计算均方误差和最小均方误差 - 腾讯云开发者社区

、

损失函数是机器学习的重要组成部分。平方损失是最流行的损失函数之一。均方误差测量估计值和估计值之间的平均平方差。估计值表示为\hat y，估计值表示为y。 {\displaystyle \operatorname {MSE} ={\frac {1}{m}}\sum _{i=1}^{m}(y_{i}-{\hat y_{i}})^{2}.} 在距离/差异的背景下，MSE和平方损失似乎做同样的工作。 “平方损失”和“均方误差”之间的关系是什么？

浏览 0提问于2019-06-04得票数 5

2回答

机器学习中的损失函数和RMSE有什么不同？

、

有人能解释一下机器学习中损失函数和均方根误差(RMSE)之间的区别吗？

浏览 2提问于2017-08-12得票数 2

1回答

在keras中训练LSTM模型时，损失值到底提供了什么？

、、、

我有一个LSTM模型，它根据今天的流出量、温度和降雨量来预测明天的流出量。 model = Sequential() model.add(LSTM(units=24, return_sequences=True, input_shape=(X_Train.shape[1],X_Train.shape[2]))) model.add(Dropout(0.2)) model.add(LSTM(units=50)) model.add(Dropout(0.2)) model.add(Dense(20, activation='relu')) model.ad

浏览 371提问于2020-09-30得票数 0

3回答

Keras均方误差损失层

、、、、

我目前正在实现一个自定义损失层，在这个过程中，我偶然发现了objectives.py文件1中均方误差的实现。我知道我在理解这个损失计算时遗漏了一些东西，因为我总是认为平均是在每个小批量(张量的0轴)中的每个样本上单独进行的，但看起来平均实际上是在最后一个轴上进行的，在单个向量中，这意味着它是在所有输出上进行的。我在处理自定义损失层时偶然发现了这一点，因为它需要对一些输出的损失进行折扣，因为在特定位置的训练输出是一个特定值。不管怎样，我对均方误差的理解是不正确的吗？为什么Keras会使用最后一个轴，从而将1xn输出向量转换为1x1输出向量？谢谢。

浏览 1提问于2017-01-18得票数 5

1回答

计算这组点(X，Y)相对于给定回归模型的均方误差。

、、

我是机器学习的新手。我试图找出给定回归模型的最小均方误差，线性回归线(模型)：y=7.93+1.12x。X和Y的数据值为(23，41)，(34，45)，(45，49)，(56,67)，(67，84)，(78,100)。

浏览 2提问于2020-10-19得票数 0

回答已采纳

4回答

为什么不使用均方误差来解决分类问题呢？

、、、、

我试图用LSTM解决一个简单的二进制分类问题。我正在努力找出正确的网络损失函数。问题是，当我使用二元交叉熵作为损失函数时，训练和测试的损失值要比使用均方误差(MSE)函数要高。在研究中，我发现了二元交叉熵用于分类问题，MSE用于回归问题的理由。然而，在我的情况下，我得到了更好的准确性和较小的损失值与MSE的二进制分类。我不知道如何证明这些结果是合理的。为什么不使用均方误差来解决分类问题呢？

浏览 0提问于2019-05-06得票数 11

回答已采纳

2回答

model.evaluation : model.prediction与Keras损失不匹配

、、、、

我应用了本教程 (在不同的数据集上)，该模型不计算单个输出的均方误差，因此我在比较函数中添加了以下行： mean_squared_error(signal_true,signal_pred) 但在测试数据上，预测的损失和均方误差与model.evaluation的损失和均方误差不同。来自model.evaluation (损失、mae、mse)的错误(测试集)： [0.013499056920409203, 0.07980187237262726, 0.013792216777801514] 来自单个目标(输出)的错误： Target0 0.16785138866628

浏览 7提问于2020-03-26得票数 1

4回答

概率回归损失函数

、、、、

我试图用神经网络来预测一个概率，但是很难确定哪一个损失函数是最好的。交叉熵是我的第一个想法，但其他资源总是在标签为\{0, 1\}的二进制分类问题中讨论它，但在我的例子中，我有一个实际的概率作为目标。这些选项中的一种显然是最好的，还是它们在极端0/1区域附近的差别很小，它们都是有效的？假设x是我的模型的最后一层的输出。交叉熵： \text{target} * -\log(\text{sigmoid}(x)) + (1 - \text{target}) * -\log(1 - \text{sigmoid}(x)) 使用Sigmoid的均方误差： (\text{sigmoid}(x)

浏览 0提问于2019-02-09得票数 9

2回答

scikit评分标准-学习的LassoCV

、、、

我在使用scikit-learn的函数。在交叉验证期间，默认情况下使用的是什么？我希望交叉验证是基于“均方误差回归损失”。在LassoCV中可以使用这个度量吗？我们可以为指定一个评分标准，所以也可以使用LassoCV吗？

浏览 3提问于2017-05-22得票数 3

回答已采纳

2回答

Keras给出的“损失”值是什么意思？

、、、

我将神经网络设置为使用均方误差，如下所示。据我理解(并阅读文档)，这意味着如果一行的正确结果为0.7，而净额预测为0.8，则此条目对损失的贡献率为(0.8 - 0.7)平方= 0.01。 from keras.models import Sequential from keras.layers import Dense #...build up neural network layers here... net.compile(optimizer = 'adam', loss = 'mean_squared_error') net.fit(training_

浏览 0提问于2019-02-08得票数 2

回答已采纳

1回答

keras计算2D CNN回归的损失值是通过keras点的方式计算的吗？

、

我在2D图像上使用CNN的keras进行回归，以均方误差作为损失函数。损失值在100范围内。要知道每个像素的平均误差，是否应该将其除以总像素数？或者显示的损失值是像素？

浏览 2提问于2017-10-28得票数 1

1回答

如何计算输出层中多个神经元的均方误差损失

、、、

我有一个前馈回归网络(在具有TensorFlow后端的Keras中)，具有单个隐藏层(30个神经元)和具有2个神经元(对于复信号的虚部和实部)的输出层。...My问题是如何准确计算均方误差损失？因为对于每个时期，我在"history object“中只得到一个数字。最终，我想在每个时期提取每个输出神经元的单独损失数，在Keras中可能吗？

浏览 5提问于2021-07-07得票数 0

1回答

能量函数和损失函数有什么区别？

、、、、

在论文中，我看到了两个定义：能量函数E(X, Y)通过推理过程最小化:目标是求出Y的这种值，使得E(X, Y)取最小值。损失函数是利用训练集来衡量能量函数质量的一种方法。我理解损失函数的含义(很好的例子是均方误差)。但是你能解释一下能量函数和损失函数之间的区别吗？你能给我一个ML或DL中能量函数的例子吗？

浏览 0提问于2018-05-15得票数 8

回答已采纳

1回答

为什么Keras不需要自定义损失函数的梯度？

、、、、

据我所知，为了通过梯度下降来更新模型参数，该算法需要在某个点计算误差函数E关于输出y: dE/dy的导数。然而，我已经看到，如果你想在Keras中使用自定义损失函数，你只需要定义E，而不需要定义它的导数。我遗漏了什么？每个丢失的函数将具有不同的导数，例如：如果损失函数是均方误差: dE/dy = 2(y_true - y) 如果损失函数是交叉熵: dE/dy = y_true/y 再说一次，模型怎么可能不问我导数是什么？模型如何根据E的值来计算损失函数相对于参数的梯度？谢谢

浏览 14提问于2018-01-12得票数 8

1回答

多类分类中的成本函数是什么？

、、

我很难知道什么是神经网络的损失函数。对于二进制分类问题，它是均方误差，如下面的视频所描述的：还是像这里定义的交叉熵，和为什么？此外，在多重分类的情况下，我认为有类似softmax的东西，但我不知道它是如何工作的。有人能给我解释清楚吗？谢谢！

浏览 1提问于2017-09-08得票数 1

回答已采纳

2回答

误差函数的选择是否影响模型参数？

、、、

假设我在一个特定的训练集上训练了一个多元线性回归模型，并且模型参数\theta=[\theta_1,\theta_2,\ldots, \theta_n]是通过最小化一个成本函数来确定的，比如均方误差。现在，如果出于某种原因，我决定将错误函数的选择从MSE改为MAE (平均绝对误差)，这会改变我的模型参数\theta还是保持不变？

浏览 0提问于2018-11-26得票数 0

回答已采纳

1回答

神经网络:隐层计算误差

、、

我是新的神经网络，并试图建立一个超简单的神经网络超过一个隐藏层。在神经网络训练阶段调整权值时，权值的调整程度部分取决于该神经元对下一层神经元的“误差”程度。因此，我们需要知道下一层的错误。只需要一个隐藏层就可以计算出这一点，因为我们的训练数据已经为我们提供了预期的输出，所以我们只需要使用输出层(简单地说，目标输出)。当存在多个隐藏层时，计算误差就变得非常重要。也就是说，如果我们有10个隐藏层，而我们位于第5层，我们如何知道第6层的错误是什么？谢谢

浏览 5提问于2017-04-22得票数 5

回答已采纳

2回答

均方误差在梯度下降中的应用

、、、

我最近从零开始写线性回归算法，以了解它背后的数学是如何工作的(这之前是个黑匣子)，所以我开始区分成本函数。没有意识到它，我使用平方误差的成本函数- MSE，但没有除以数据集的长度。有什么好处(更快的方法，最小或其他)使用均方误差比仅仅求和误差的平方？

浏览 0提问于2018-06-14得票数 4

回答已采纳

1回答

如何让CatBoost get_object_importance与AUC协同工作？

、、

我复制了示例。该示例试图提高RMSE (更低->更好)。我有限的理解是，CatBoost将试图在幕后最小化LogLoss。在这个例子中，较低的LogLoss似乎与较低的均方根相关。 RMSE on validation datset when 0 harmful objects from train are dropped: 0.25915746122622113 RMSE on validation datset when 250 harmful objects from train are dropped: 0.25601149050939825 RMSE on validati

浏览 2提问于2018-08-25得票数 0

1回答

对于二进制映射，哪种损失函数是正确的？

、、

我建立了一个3层神经网络来执行二进制映射(2016输入，288输出)。我得到了很好的结果，均方误差和随机梯度体面。我的问题是:当输出是二进制时，是否有更合适的回归损失函数？

浏览 0提问于2019-01-11得票数 1

5回答

L2损失与均方损失

我看到一些文献认为L2损失(最小平方误差)和均方误差损失是两种不同的损失函数。然而，在我看来，这两个损失函数基本上是计算相同的东西( 1/n因子差)。所以我想知道我是不是错过了什么？是否存在使用两个损失函数之一的方案？

浏览 0提问于2018-01-01得票数 29

1回答

线性回归损失函数

如何确定平均绝对误差还是均方误差更适合线性回归？是否还有其他常用的线性回归损失函数？

浏览 0提问于2018-12-03得票数 1

1回答

不同成本函数的利弊

我已经看到了和Andrew的神经网络成本函数，并且我注意到，Andrew的成本函数与神经网络的书籍不同。安德鲁·吴使用J(Θ)=−(1/m)∑∑y *log((hΘ(X)+(1−y)*log(1−(hΘ(X)，而本书使用均方误差。每个错误公式的优缺点是什么？

浏览 3提问于2020-01-21得票数 1

回答已采纳

1回答

循环输出的成本函数？

、、

现在，我正试图得到一个神经网络来对图像进行着色。我想在HSV颜色空间里做。问题是色调通道是循环的。色调的归一化值在0到1之间。例如，模型预测0.99，但实际色调为0.01。与正常的均方误差损失，这似乎是远远的。然而，距离实际上更接近0.02。如何得到角点中的循环损失函数？

浏览 1提问于2016-05-30得票数 2

回答已采纳

2回答

训练集神经网络的历元和均方误差计算

、

我的问题是关于神经网络训练的。我已经搜索过了，但是没有很好的解释。那么，对于第一个问题，如何计算均方误差？(我知道这很愚蠢，但我真的不明白) 第二:当神经网络进行训练时，我们输入一个由许多对(输入及其期望输出)组成的训练集。现在我们应该在什么时候计算均方误差？当我们已经得到所有的配对时，它是这样的吗？或者我们为每一对计算它？如果是针对每一对，那么在训练集内的所有对都被采用之前，当误差达到最小期望误差时，存在这种可能性。第三:训练集的一个循环的时值是否增加？或者，当每对(输入和期望输出)都被占用时，它会增加吗？(我知道这是另一个愚蠢的问题，但请容忍它) 非常感谢

浏览 1提问于2014-01-02得票数 4

回答已采纳

2回答

Matlab:均方误差

、、

嗨，我是Matlab的新手，我很难理解均方误差背后的逻辑。我已经得到了一个信号，我可以生成它并计算出信号的SNR，有没有办法找到原始信号和SNR信号之间的均方误差？ % Number of Samples. n = 1:512; % Given Signal signal = exp(-5*(n-250).^2/100000).*cos(pi*(n-250)/6); % Range of SNR Snr = 30:-5:-10 % Calculate and display MSE between the original signal and noisy signal ？

浏览 1提问于2015-05-01得票数 0

3回答

如何利用神经网络学习陡峭函数？

、、、

我正在尝试使用神经网络来学习以下功能。 📷 📷 我总共有25个特点和19个产出。上面的图像显示了两个特征相对于其中一个输出的分布情况。该神经网络包含7个层，256个神经元具有漏神经网络的激活。最后一层是线性层。问题是输出太陡，而神经网络在峰值上有很大的误差。如何修改目标变量或神经网络，使其在峰值上产生一个较小的平均绝对误差(基本上使下面的误差图变平)？下面是错误图 📷 我试过但没用的东西- 使用日志转换目标变量。增加神经网络的规模，希望一个足够大的神经网络能够适应任何情况，但训练损失仍然很大。使用平均绝对，均方和百分比损失，我在这里问了同样的问题，https://stats.stackex

浏览 0提问于2022-09-22得票数 1

1回答

如何在Keras中实现加权均方误差函数

、、

我在Keras中定义了加权均方误差如下： def weighted_mse(yTrue,yPred): data_weights = [w0,w1,w2,w3] data_weights_np = np.asarray(data_weights, np.float32) weights = tf.convert_to_tensor(data_weights_np, np.float32) return K.mean(weights*K.square(yTrue-yPred)) 我给出了每个预测的权重列表。这些预测是成形的，例如：(25,4)。这是通过维数4的最终

浏览 1提问于2018-10-24得票数 4

1回答

用于多项式分类的h2o随机森林计算均方误差

、、、

为什么h2o.randomforest在训练多项式分类问题时，要计算袋外样本的均方误差？我也用h2o.randomforest做过二分类，它用来在out of bag sample和training上计算AUC，但对于多分类随机森林计算均方误差，这似乎很可疑。请看这张截图。我的目标变量是一个包含4个因子水平model1，model2，model3和model4的因子。在屏幕截图中，您还会看到这些因素的混淆矩阵。有人能解释一下这种行为吗？

浏览 0提问于2015-10-25得票数 0

1回答

成本函数与误差最小化

在线性回归模型中，如何定义成本函数。另外，在定义了成本函数之后，如何最小化错误项？

浏览 0提问于2020-01-21得票数 0

1回答

线性回归中梯度下降与正态方程的差异

、、

嗨，我是线性回归的新手。我想知道机器学习线性回归中b/w梯度下降和均方误差的差异是什么？和机器学习在线性回归中何时使用梯度下降和均方误差？或者什么时候在线性回归中使用哪一种算法？有人能解释一下吗？

浏览 0提问于2018-10-04得票数 1

1回答

matlab中的交叉验证

、

我在的文档中读到过，mcr = crossval('mcr',X,y,'Predfun',predfun)函数在matlab中计算错误分类率，但是如果它适用于10倍交叉验证，那么我们就会有10个不同的错误分类值，因为我们做了10次测试，每次测试都会产生一个结果，但是mcr值是单的还是标度的，那么它是取平均错误分类率还是取minimum..etc呢？

浏览 2提问于2015-03-24得票数 0

回答已采纳

1回答

tensorflow非对称损失函数

、、

我想实现一个不对称的损失函数，比如这里提到的在TensorFlow中。我目前使用的是均方误差损失函数： mse = tf.reduce_mean(tf.squared_difference(out，Y)) 我想替换为mse = tf.reduce_mean(asymetric_squared_difference(out，Y，alpha)) 我查看了定义tf.squared_difference的位置，找到了，它说明tensorflow/python/ops/gen_math_ops.py 编辑:在多次挖掘之后，从ops.math_grad行999到1012调用SquaredDiffer

浏览 1提问于2018-07-12得票数 1

1回答

scikit中的随机森林回归-用标准MAE代替MSE学习的速度比MSE慢了150倍

、、、、

我试图用criterion = mae (平均绝对误差)代替mse (均方误差)进行随机森林回归。它对计算时间有很大的影响。大约需要6分钟( mae)而不是2.5秒( mse)。大约慢了150倍。为什么？如何减少计算时间？同样的情况发生在决策树上。差异不大，但每棵树的比例大致相同。

浏览 4提问于2020-06-28得票数 1

回答已采纳

2回答

logistic回归和线性回归有什么区别？

、、、、

我知道线性回归做“回归”，logistic回归做“分类”。当我们实现这两种方法时，我能注意到的唯一不同是损失函数:线性回归使用均方误差这样的损失函数，logistic使用交叉熵。还有什么我不知道的区别吗？

浏览 0提问于2018-09-14得票数 1

回答已采纳

2回答

Keras模型每个(最后一层)输出的个别损失

、、、、

在训练ANN进行回归时，Keras将训练/验证损失存储在中。对于带有的最后一层中的多个输出，即均方误差或均方误差：在多输出情况下，损失代表什么？它是所有产出的个人损失的平均/平均数还是其他什么东西？我可以单独访问每个输出的损失而不实现自定义丢失函数吗？任何暗示都将不胜感激。 EDIT------------ model = Sequential() model.add(LSTM(10, input_shape=(train_X.shape[1], train_X.shape[2]))) model.add(Dense(2)) model.compile(loss='

浏览 0提问于2018-08-30得票数 1

1回答

橙类产品中的袋外误差

、

在橘子里有什么方法可以看得出来吗？小部件测试和评分只报告均方误差、均方误差、平均绝对误差、确定系数和均方偏差。

浏览 0提问于2021-01-31得票数 2

1回答

我能用我自己的成本函数吗？

、

在编译模型时，将参数丢失传递给编译函数。例如： Model.compile(损失=‘均方_误差’，优化器=‘adam’)但是我很好奇在Keras中是否有一种方法可以传递我自己的成本函数？

浏览 2提问于2018-06-18得票数 2

回答已采纳

1回答

多输出回归问题的多重损失

、、、

因此，我正在尝试训练CNN模型来预测4个实值输出(回归问题)，我尝试使用均方误差作为损失函数，我的问题是，如果我将输出层分为4个不同的输出层，具有4个不同的损失(4 MSE)，这是否会使网络在最后一层的权重单独更新方面表现更好。谢谢

浏览 59提问于2020-01-28得票数 2

1回答

AutoKeras中的“标量测试损失”意味着什么？

我使用以下代码： import autokeras as ak regressor = ak.StructuredDataRegressor(max_trials=100) regressor.fit(x=train_dataset.drop(columns=['MPG']), y=train_dataset['MPG']) # Evaluate the accuracy of the found model. print('Accuracy: {accuracy}'.format( accuracy=regressor.evaluat

浏览 0提问于2020-03-15得票数 0

回答已采纳

1回答

如何在LightGBM中使用R2-分数作为损失函数？

、、、、

我试图在LightGBM中为回归问题实现一个自定义丢失函数。内在指标对我没有多大帮助，因为它们会惩罚离群点.有没有办法将r2_score从sklearn中用作LightGBM的损失函数？

浏览 0提问于2020-04-01得票数 2

回答已采纳

1回答

使用Tensorflow Hub模块作为自定义tf.Estimator的基础时的tf.Estimator.predict()问题

、

我正在尝试创建一个自定义的tensorflow tf.Estimator。在传递给tf.Estimator的model_fn中，我从Tensorflow Hub导入了Inception_V3模块。问题:在对模型进行微调(使用tf.Estimator.train)之后，基于tf.Estimator.evaluate (这是针对回归问题)使用tf.Estimator.predict获得的结果不如预期的好。我是Tensorflow和Tensorflow Hub的新手，所以我可能会犯很多新手错误。当我尝试对相同的验证数据使用tf.Estimator.predict()时，问题就出现了。 tf.E

浏览 4提问于2019-02-16得票数 0

1回答

Keras中心损耗

我想在Keras中实现用解释的中心丢失我开始创建一个具有两个输出的网络，如： inputs = Input(shape=(100,100,3)) ... fc = Dense(100)(#previousLayer#) softmax = Softmax(fc) model = Model(input, output=[softmax, fc]) model.compile(optimizer='sgd', loss=['categorical_crossentropy', 'center_loss'],

浏览 4提问于2016-10-21得票数 9

回答已采纳

2回答

具有预训练卷积基的keras模型中损失函数的奇异行为

、、、、

我试图在Keras中建立一个模型，从图片中进行数值预测。我的模型有densenet121卷积基，顶部有几个额外的层。除了最后两个层之外，所有层都设置为layer.trainable = False。我的损失是均方误差，因为这是一个回归任务。在培训期间，我得到了loss: ~3，而对同一批数据的评估给出了loss: ~30 model.fit(x=dat[0],y=dat[1],batch_size=32) 1/1 32/32 ============================== -s 11 0s /步进损耗：2.5571 model.evaluate(x=dat[0],y=da

浏览 0提问于2018-07-01得票数 10

回答已采纳

1回答

Keras "acc“度量-一种算法

、、

在Keras中，我经常看到人们用均方误差函数和"acc“作为度量标准来编译模型。 model.compile(optimizer=opt, loss='mse', metrics=['acc']) 我一直在读关于acc的文章，却找不到算法吗？如果我将我的损失函数更改为二进制交叉熵作为一个例子，并使用'acc‘作为度量标准呢？这是与第一种情况相同的度量标准，还是Keras基于损失函数改变这个acc -所以在这种情况下是二进制交叉熵？

浏览 0提问于2019-03-13得票数 1

回答已采纳

1回答

反向传播中的误差计算(梯度下降)

、

有人能解释一下反向传播中误差的计算吗?在许多代码示例中都可以找到，例如： error=calculated-target // then calculate error with respect to each parameter... 这对于平方误差和交叉熵误差是相同的吗？多么? 谢谢..。

浏览 2提问于2017-07-27得票数 0

1回答

Keras损失权重

、、、

我的模型有两个输出层，年龄和性别预测层。我想为每个输出层的损失分配不同的权重值。我有下面这行代码来做这件事。 model.compile(loss=[losses.mean_squared_error,losses.categorical_crossentropy], optimizer='sgd',loss_weights=[1,10]) 我的问题是，损失权重对模型性能的影响是什么？如何配置损失权重，以便模型能够更好地预测年龄？

浏览 0提问于2018-02-05得票数 4

回答已采纳

1回答

keras中的层，就像matlab中的regressionlayer？

、、

我正在尝试用keras编写示例中已经编写好的Matlab Model的代码：他们最终定义了一个名为regressionLayer的层。我想知道在keras或pytorch中应该使用什么。我只是在keras中添加了sigmoid激活，而不是这个regressionLayer。但我怀疑这是否正确，因为我似乎没有得到想要的输出，这似乎是原因之一。 model.add(Conv2D(1, (129,1), strides =(1,100),padding='same', input_shape=(129,8,18),activation='

浏览 55提问于2019-08-07得票数 0

1回答

一种H2O分割(节点改进)方法

、、

H20在中表示，回归gbms的特征拆分是基于平方误差的减少。这个平方误差是基于节点残差，即(resid - mean resid)^2，还是真实的响应，即( response - mean response)？我用的是伽马/泊松分布。在伽马/泊松的情况下，损失就是偏差，那么为什么要使用平方误差呢？

浏览 9提问于2020-11-18得票数 0

1回答

Keras模型的精度优化而非损失

、、、、

如果我正确地理解了损失函数对模型的重要性，它将指导基于最小损失值的模型的训练。因此，例如，如果我希望我的模型被训练，以便有最小的平均绝对误差，我应该使用MAE作为损失函数。例如，为什么有时你看到有人想要达到最好的精度，但建立模型以最小化另一个完全不同的功能？例如： model.compile(loss='mean_squared_error', optimizer='sgd', metrics='acc') 为什么上面的模型被训练来给我们最好的acc，因为在它的训练期间，它将尝试最小化另一个功能(MSE)。我知道，当已经训练的时候，模型的度量将给

浏览 1提问于2019-06-07得票数 2

回答已采纳