首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >X秒采样间隔不均匀

X秒采样间隔不均匀
EN

Data Science用户
提问于 2021-04-29 10:34:04
回答 1查看 29关注 0票数 0

我有以下规范的数据集:

  • 年内以不均匀间隔时间抽取512个样本
  • 每个样本是来自传感器的8秒数据,分辨率为4ms。
  • 样品没有标记

例如,我在第一天采集了5个样本,然后在第5天采集了10个以上的样本等等。

我想要对数据进行聚类,以检查是否可以从单个8秒的样本中推断出机器的操作模式。此外,我还想衡量一年来组件的性能,以便进行预测维护。

目前,我想使用自组织映射进行聚类。我是这门数据科学的新手,目前正在学习。通常的方法是使用间隔均匀的样本。而且,在这些情况下,每个样本都是单个输入(比如一天结束时的股票价值),而不是在时间Y中获取的X秒数据。

我的问题是:如何将这些数据输入到任何模型中?

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-04-29 11:10:43

这取决于您想要如何对数据进行集群,但是这里有一些选项.

  1. 例如,您可以完全忽略时间戳,只需对不同的操作模式进行聚类,只需根据特性的大小就可以了。在这里,只需将值提取到一个新的功能列表中即可。否则,你必须考虑什么是重要的样本。例如,一个包含5个样本和8个样本的快照是否区分了不同的模式?如果是这样的话,基于一天中的样本数来构建你的特征向量。在这样做的过程中,您将从一天中的各种属性(例如大小、样本数量)中为每天创建单个特性,使您能够根据这些特性对它们进行聚类。
  2. 相反,您可以将所有数据重新采样到统一的间隔中,但这可能需要大量的假设,因此会引入噪声。
票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/93722

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档