首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >寻找产业探针的集群

寻找产业探针的集群
EN

Data Science用户
提问于 2022-11-20 19:44:58
回答 1查看 18关注 0票数 0

我对数据科学很陌生,但在过去的几个月里,我开始收集来自不同工业探针(水的温度、压力、Kw消耗等)的许多值样本。我开发了一个程序,每5秒从许多不同的PLC收集许多不同的值,现在我有大约4000万条数据记录。在做了一些基本的分析和可视化之后,我想首先找到每一个探针的数据簇,当然还有异常值,这样我就可以理解当我有“奇怪”的情况时。你能帮我提供一些建议吗?我可以尝试做什么样的分析?

对不起,我知道这个问题看上去很模糊,但我真的处于起步阶段,并试图揭开更多关于我的数据的信息。

EN

回答 1

Data Science用户

回答已采纳

发布于 2022-11-21 08:19:11

尺寸约简UMAPPacMap一样,是理解复杂和大量数据的好方法。

这是一个演示者

然而,4000万是大量的数据:如果你同时获取所有的数据,你可能看不到清晰的集群,而且它可能是无用的:很多工业案例集中在一个时间框架上,而获取所有的数据将导致一个模糊的可视化。

我建议从一个~1000个值数据样本(例如:1天)开始,然后逐步增加。您将能够检测到集群之外的异常值。

此外,您还可以应用一些PCA来理解某些数据依赖关系。

这里有一个与你类似的案例:

https://github.com/bharathsudharsan/Air-Quality-IoT-Analytics

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/116342

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档