我是个数据科学新手,有一个典型的问题。我有一个metric1、metric2和metric3的数据集。所有这些指标都是相互依存的。我想在metric3中检测异常。目前,我正在使用numenta.org的Nupic进行分析,它似乎并不有效。是否有任何ML库可以检测多个参数中的异常?
发布于 2014-11-05 21:22:09
一种同时使用metric1和metric2来发现metric3异常的方法是考虑残差分析。
在您的例子中,这需要创建一个预测模型,其中metric1和metric2作为预测变量,metric3作为响应变量。
然后,计算metric3的残差,作为它的预测值减去它的真值。现在,您可以将最低十进制或其他百分位数的所有成员报告为一种异常,而将最高十进制或其他百分位数的所有成员报告为另一种异常。
https://datascience.stackexchange.com/questions/2391
复制相似问题