我有一个响应变量序列,它将在固定间隔的0-100中根据每秒随机生成,当新生成的数据明显大于最后一秒钟的数据时,我希望检测事件,并向我发送警报消息。
因此,我计算了响应变量的差值1滞后,除以时间(斜率),然后用bootstrapping构造响应90%百分位数的95%置信区间,如果新的数据大于上限,我将其定义为异常。
事实上,我拥有的数据量非常大,而且这些数据经常更新。因此,重新采样和计算CI是非常可怕的,甚至可能是一种解决问题的方法。看起来不一定要取样,因为我有很大的样本。
有什么更好的方法吗?谢谢!
发布于 2022-04-18 18:27:40
一种选择是收集一个滞后的经验分布(即,在一个时间步长上发生了多少变化?)然后根据这个经验分布的百分比设定阈值。
这通常是通过延迟来完成的。一个不寻常的延迟事件定义为95%或99%百分位数。
https://datascience.stackexchange.com/questions/11221
复制相似问题