首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何从数据系列中删除点数以进行演示?

如何从数据系列中删除点数以进行演示?
EN

Data Science用户
提问于 2020-02-05 14:34:57
回答 2查看 111关注 0票数 2

我们监测长期运行的工业引擎,我们有数据系列,我们想要显示在一个网页上的线图表。例如,我们有传感器可以监测发动机上的油温和压力。

在设备的部件上还有其他几个类似的数据系列。

目的是让人类操作员识别发动机中的偏差,以便进行后分析.我们的图表将显示24或48小时的发动机运行,操作人员可以识别温度、压力或其他测量结果的峰值。

因此,它是大量的数据显示在图表上的网页,我们开始在几个地方受到限制。

24小时*3600秒/小时*1个数据点/秒=图表上的86400个数据点。

这一数量的点数正在减缓网页的呈现速度,并且是大量的数据需要传输。

我们希望减少图表上数据点的数量,而不会失去太多的上下文。所以我问:

  • 如何在不丢失很多精度的情况下删除数据点?
  • 在这个场景中通常使用什么技术?

第一个(天真的)想法是将它们分组在5秒窗口中,只返回一个数据点来表示图表上的5秒窗口;

  • 我应该把窗户里的分数平均一下吗?
  • 我应该考虑一下窗户里的最大值吗?

除了对窗口中的数据点进行分组之外,还有其他技术来减少监视的意义吗?

EN

回答 2

Data Science用户

回答已采纳

发布于 2020-02-05 16:17:07

事实上,尽管这个问题看起来很容易概念化,但它并不是一个很简单的问题。有一定数量的技术,以“减少”点的时间序列,其中一种被称为“下采样”。

一个小小的讽刺:https://skemman.is/bitstream/1946/15343/3/SS_MSthesis.pdf

希望这能帮上忙

干杯

票数 1
EN

Data Science用户

发布于 2022-07-06 05:40:53

这取决于人类可以接受的频率:如果操作员能在一分钟内做出反应,那么一分钟内的最大值就足够了。

但是,如果您必须根据最近的值快速作出反应,您可以根据数据的年龄来缩放您的记录频率。

例如,最近的记录(从0到5分钟)的频率为1Hz,而最近的记录(从5分钟到1小时)的频率为0.15Hz (每分钟1次记录),其余的数据为0.003Hz (每5分钟记录1次)。

一个有趣的选择是在峰值附近增加频率。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/67590

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档