文章/答案/技术大牛

发布

社区首页 >问答首页 >加权均方误差的需要

问加权均方误差的需要
EN

Data Science用户

提问于 2020-01-11 16:01:21

回答 2查看 6.8K关注 0票数 2

我们将MSE和RMSE作为回归问题的评价指标。对于一些问题，人们使用加权均方误差(WMSE)作为评价指标。

以下是WMSE公式：

谁能解释一下WMSE的真正需求以及何时不使用MSE？

提前谢谢。

machine-learning

keras

regression

model-evaluations

model-selection

回答 2

Data Science用户

发布于 2020-01-11 16:10:19

加权均方根( MSE )是一种在总分上比其他预测误差更重要的方法。如果您使用MSE作为模型的性能度量，特别是在模型培训(损失函数)或验证(超参数设置)期间，这是非常有用的。

在你举的例子中，更重要的是点击次数更多的案例。如果您使用此WMSE作为性能指标进行验证，则在单击次数较多的情况下，您的模型将比使用MSE的情况更好。

请注意:使用的平方误差((predictedClicks - observedClicks)^2)是一个绝对平方误差(我本来期望有一个相对误差)，因此已经随着点击次数的增加而增加。因此，在这种情况下，这种加权方式可以提高点击次数较多的情况下的性能。

票数 3

Data Science用户

发布于 2021-01-29 01:23:19

我正遇到这个问题。我正在研究负载和吞吐量之间的相关性。字面上(加载，吞吐量)对。但是，如果您正在测量一个实际的系统，通常是负载1000，您可能永远得不到负载的数据，比如load 1,2,3等(即: Google的吞吐量仅限于1用户？)我们永远不会得到它的数据。)所以，我想要做的是正确地权衡我拥有的所有数据。在观测数据中，每个观测都有一个权重，这基本上是将它包含在MSE中的次数。我无法弥补"Google负载1时的吞吐量“，因为这种情况从未发生过。

这意味着MSE方程需要适当的加权。如果你想一想，这通常是做统计的情况！如果度量f(20)=1001000x，但只测量f(5)=2.32x，而f(1)却从未实际测量.所以，在费率上。说是字节/秒..。保持单独的字节和持续时间计数。如果发生两次，您必须重2.3字节/秒作为2次测量。

票数 0

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/66326

复制

相似问题

问加权均方误差的需要
EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问加权均方误差的需要EN

回答 2

Data Science用户

Data Science用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问加权均方误差的需要
EN