首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >加权均方误差的需要

加权均方误差的需要
EN

Data Science用户
提问于 2020-01-11 16:01:21
回答 2查看 6.8K关注 0票数 2

我们将MSE和RMSE作为回归问题的评价指标。对于一些问题,人们使用加权均方误差(WMSE)作为评价指标。

以下是WMSE公式:

谁能解释一下WMSE的真正需求以及何时不使用MSE?

提前谢谢。

EN

回答 2

Data Science用户

发布于 2020-01-11 16:10:19

加权均方根( MSE )是一种在总分上比其他预测误差更重要的方法。如果您使用MSE作为模型的性能度量,特别是在模型培训(损失函数)或验证(超参数设置)期间,这是非常有用的。

在你举的例子中,更重要的是点击次数更多的案例。如果您使用此WMSE作为性能指标进行验证,则在单击次数较多的情况下,您的模型将比使用MSE的情况更好。

请注意:使用的平方误差((predictedClicks - observedClicks)^2)是一个绝对平方误差(我本来期望有一个相对误差),因此已经随着点击次数的增加而增加。因此,在这种情况下,这种加权方式可以提高点击次数较多的情况下的性能。

票数 3
EN

Data Science用户

发布于 2021-01-29 01:23:19

我正遇到这个问题。我正在研究负载和吞吐量之间的相关性。字面上(加载,吞吐量)对。但是,如果您正在测量一个实际的系统,通常是负载1000,您可能永远得不到负载的数据,比如load 1,2,3等(即: Google的吞吐量仅限于1用户?)我们永远不会得到它的数据。)所以,我想要做的是正确地权衡我拥有的所有数据。在观测数据中,每个观测都有一个权重,这基本上是将它包含在MSE中的次数。我无法弥补"Google负载1时的吞吐量“,因为这种情况从未发生过。

这意味着MSE方程需要适当的加权。如果你想一想,这通常是做统计的情况!如果度量f(20)=1001000x,但只测量f(5)=2.32x,而f(1)却从未实际测量.所以,在费率上。说是字节/秒..。保持单独的字节和持续时间计数。如果发生两次,您必须重2.3字节/秒作为2次测量。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/66326

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档