我有一个时间序列数据是可用的离线csv格式。我使用这些数据创建异常检测模型。虽然我可以创建这个模型来预测这个数据集中的异常,但是当数据是实时的时候,我需要使用这个模型。每秒钟数据点就会出现,如果点是异常的,我需要模型来产生异常。
有什么想法,我应该如何实现这一点?
编辑-数据是定期更新的计算机,文件是更新,因为数据是流在这个文件。实时异常检测需要进行预测,因为在对异常进行预测时,必须做出决策才能停止这一过程。
发布于 2019-06-12 16:13:57
这取决于这些问题的答案:
在这样的设置中使用数据库是很常见的。因此,将定期调用ML预测过程,查询该数据库以获取最新实例,并以所需的格式生成预测(可能还会将预测存储在数据库中)。
发布于 2019-06-13 10:42:17
我也有类似的情况,模拟文件数据,就像它们是实时流的一样。您可以使用“计划”/时间库每x秒/毫秒读取一次文件。您需要将代码的整个操作/预测部分放入一个函数中,该函数将触发每个x段的“调度”。希望这能有所帮助。
https://datascience.stackexchange.com/questions/53641
复制相似问题