我们将MSE和RMSE作为回归问题的评价指标。对于一些问题,人们使用加权均方误差(WMSE)作为评价指标。
以下是WMSE公式:

谁能解释一下WMSE的真正需求以及何时不使用MSE?
提前谢谢。
发布于 2020-01-11 16:10:19
加权均方根( MSE )是一种在总分上比其他预测误差更重要的方法。如果您使用MSE作为模型的性能度量,特别是在模型培训(损失函数)或验证(超参数设置)期间,这是非常有用的。
在你举的例子中,更重要的是点击次数更多的案例。如果您使用此WMSE作为性能指标进行验证,则在单击次数较多的情况下,您的模型将比使用MSE的情况更好。
请注意:使用的平方误差((predictedClicks - observedClicks)^2)是一个绝对平方误差(我本来期望有一个相对误差),因此已经随着点击次数的增加而增加。因此,在这种情况下,这种加权方式可以提高点击次数较多的情况下的性能。
发布于 2021-01-29 01:23:19
我正遇到这个问题。我正在研究负载和吞吐量之间的相关性。字面上(加载,吞吐量)对。但是,如果您正在测量一个实际的系统,通常是负载1000,您可能永远得不到负载的数据,比如load 1,2,3等(即: Google的吞吐量仅限于1用户?)我们永远不会得到它的数据。)所以,我想要做的是正确地权衡我拥有的所有数据。在观测数据中,每个观测都有一个权重,这基本上是将它包含在MSE中的次数。我无法弥补"Google负载1时的吞吐量“,因为这种情况从未发生过。
这意味着MSE方程需要适当的加权。如果你想一想,这通常是做统计的情况!如果度量f(20)=1001000x,但只测量f(5)=2.32x,而f(1)却从未实际测量.所以,在费率上。说是字节/秒..。保持单独的字节和持续时间计数。如果发生两次,您必须重2.3字节/秒作为2次测量。
https://datascience.stackexchange.com/questions/66326
复制相似问题