开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >什么时候停止收集数据？

问什么时候停止收集数据？
EN

Data Science用户

提问于 2018-12-05 04:41:31

回答 1查看 303关注 0票数 1

我开发了一个迭代过程，通过这个过程，我可以批量收集数据。数据是预定义的3D空间中的点。我正在尝试根据我的数据在那个3D空间中探索和定位集群。在收集了一些批之后，我可以定位并创建集群。然而，当我收集更多的数据时，正在进行一些小的改进，而新的结果并不值得付出努力。如何确定新批次是否“值得”收集？我是否可以用某种度量来衡量我有多少批次是“相似的”，或者一个新的随机批是否会影响整个过程？

EN

回答 1

Data Science用户

发布于 2018-12-07 09:32:32

量化集群在每一批中的变化程度。

如果更改小于阈值，则停止。

票数 1

EN

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/42165

复制

相关文章

InnoDB数据页什么时候合并

云数据库 SQL Server 腾讯云测试服务

我们知道，当从InnoDB表删除数据时，相应的数据是先打上删除标签（deleted mark），而后再由purge线程执行清理工作。

老叶茶馆

2020/07/16

4890

【常用命令】自动统计收集的停止（无效）和启动（有效）

优化器统计信息 optimizer stats statistics auto tasks

SQLplusDB

2020/03/26

9410

停止冻结你的数据至死

解决方案数据对象存储企业存储

告别数据冻结！企业应利用对象存储优化方案，如 AWS S3 Tables 和 Apache Iceberg，实现日志数据长期热存储，释放 ML、网络安全和 BI 潜力。通过并行、分区、高密度压缩等技术，提升查询性能，告别分层存储的低效与高成本，拥抱云原生实时分析新时代！

云云众生s

2025/03/18

510

什么时候使用Dockerfiles（什么时候不使用……）

go 容器镜像服务容器缓存

在这篇文章中，我们将讨论一些使用 Dockerfile 的最佳实践，探索一些注意事项，并使用 Dockerfile 和云原生 Buildpacks 构建应用。你将了解每种工具最擅长的工作是什么，以及如何决定何时使用它们。

CNCF

2021/12/15

1.8K0

什么时候使用Dockerfiles（什么时候不使用……）

在中国我们如何收集数据？全球数据收集大教程

以前都是有小伙伴说想找点数据，自己来试试手，想分析出一些好的东西来。现在我们分享这篇文章给大家，也希望大家可以实现一个小的梦想，数据在这里，分析等你来。

IT阅读排行榜

2018/08/16

1.9K0

在中国我们如何收集数据？全球数据收集大教程

数据收集渠道_数据挖掘数据集

NLP方向：Hugging Face – The AI community building the future.

全栈程序员站长

2022/11/03

1.2K0

什么时候用Goroutine？什么时候用Channel？

go channel goroutine pool range

什么场景下用channel合适呢？通过全局变量加锁同步来实现通讯，并不利于多个协程对全局变量的读写操作。加锁虽然可以解决goroutine对全局变量的抢占资源问题，但是影响性能，违背了原则。总结：为了解决上述的问题，我们可以引入channel，使用channel进行协程goroutine间的通信。 Go语言中的操作系统线程和goroutine的关系：一个操作系统线程对应用户态多个goroutine。 go程序可以同时使用多个操作系统线程。 goroutine和OS线程是多对多的关系，即m:n。 Go

王中阳Go

2022/10/26

9750

Flume：流式数据收集利器

在数据生命周期里的第一环就是数据收集。收集通常有两种办法，一种是周期性批处理拷贝，一种是流式收集。今天我们就说说流式收集利器Flume怎么使用。使用flume收集数据保存到多节点 by 尹会生 1 使用flume 收集数据到hdfs 由于工作的需要，领导要求收集公司所有在线服务器节点的文本数据，进行存储分析，从网上做了些比较，发现flume 是个简单实现，而且非常强大的工具，这里介绍给大家首先下载软件：http://flume.apache.org flume是著名的开源数据收集系统

刀刀老高

2018/04/11

1.3K0

ORACLE数据库收集

oracle 12C静默安装方式 https://www.cnblogs.com/lkj371/p/15291392.html

全栈工程师修炼指南

2022/09/29

4770

OpenTelemetry：深度收集遥测数据

sql duration 服务函数数据

在我们前面的文章中，我们探讨了如何在 Go 项目中集成 OpenTelemetry 并进行基本的追踪。今天，我们将进一步讨论如何使用 OpenTelemetry 收集更丰富的遥测数据，包括关键方法的参数，错误信息，以及查询时间过长的 SQL 语句。

运维开发王义杰

2023/08/10

3230

OpenTelemetry：深度收集遥测数据

Metagoofil 元数据收集工具

apt-get html http

Metagoofil是一个信息收集工具用于提取目标公司元数据的公共文档(pdf、doc、xls、ppt、docx、pptx、xlsx)

意大利的猫

2020/08/19

1.4K0

Hadoop数据收集系统—Flume

syslogTcp(5440) | agentSink("localhost",35856)

大数据和云计算技术

2018/07/26

6490

Hadoop数据收集系统—Flume

收集和存储数据——数据仓库

数据产品的工作比较杂，从数据仓库建模，指标体系建立，到数据产品工具的设计，再到偶尔一些数据分析报告的撰写，甚至一些机器学习的预测模型都要有所了解。大公司可能每个职能都有专门的岗位来负责，小公司的话可能真的要你一条龙了。

三哥

2018/07/31

9150

mysql停止命令停止mysql服务命令

云数据库 SQL Server 数据库 sql

如果没有将mysql注册为系统服务，那么我们可以使用MySQL为我们提供的一些工具来开启，关闭，重启mysql。当然，mysql服务脚本对mysql的操作也是调用这些工具来完成的。这些工具都在mysql的安装目录的bin目录中。贴个图：

it妹

2019/08/21

19.3K0

mysql停止命令停止mysql服务命令

数据模型详解－究竟什么时候物化视图？

nosql 数据库 asp

翻译内容 3.4. Materialized Views 第三段和第四段： Views provide a mechanism to hide from the client whether data is derived data or base data—but can’t avoid the fact that some views are expensive to compute. 视图提供了一种机制就是把数据封装起来，然后客户端调用者不管是原始数据（base data）还是派生数

ImportSource

2018/05/04

1.3K0

数据库PostrageSQL-什么时候会用JIT？

对象存储打包 c++

JIT编译主要可以让长时间运行的CPU密集型的查询受益。对于短查询，执行JIT编译增加的开销常常比它节省的时间还要多。

cwl_java

2021/01/13

3510

微服务编程算法 api

文章起源于我对于模块化、微服务、Serverless 以及单体应用几种不同的架构模式的思考。而这其中的一个原因就是：人们经常从一个极端走另外一个极端。既然单体不好，那么我们就要 FAAS 来替换单体；既然模块化架构有各种问题，那么我们应该回到大单体。

Phodal

2020/06/30

2.1K0

别想收集学生的大数据

一年前，数据分析公司InBloom开始监视纽约州公立学校的所有学生。这些学校向该公司提供了覆盖400多个领域的大量数据，包括从考试成绩、特殊教育注册到孩子有没有吃免费午餐的大量个人细节。这个做法的初衷是想对尽可能多的信息加以汇编，让教师或软件可以根据每个学生的需求来布置作业。事实上，InBloom和全美九个州数以百万计的公立学校学生签了相同的协议，对他们的学业进行跟踪，为他们的学习表现作出评定。此举令InBloom成为个性化学习这个新兴领域中最炙手可热的公司，它们的卖点是可以帮助人满为患、资金匮乏的学校

大数据文摘

2018/05/22

9610

uwsgi停止[通俗易懂]

web.py nginx https java http

必须在uwsgi.ini中配置好 pidfile = 绝对路径 ///uwsgi.pid 这样才有pid文件 uwsgi –stop uwsgi.pid 这样就可以停止了有一点需要注意：如果没有uwsgi.pid 又需要停止uwsgi服务可以netstat -lntp查看一下端口占用然后lsof -i ：端口查看具体的pid 把pid写入再进行停止操作

全栈程序员站长

2022/10/01

2.7K0

setInterval停止

实现代码如下： var refreshIntervalId = setInterval(fname, 10000); /* later */ clearInterval(refreshIntervalId); var intervalID = setInterval(func, [delay, arg1, arg2, ...]); var intervalID = setInterval(function[, delay]); var intervalID = setInterval(code, [d

IT工作者

2021/12/29

2.8K0

相似问题

如何知道什么时候停止训练深层网络？

30

什么时候清理数据？

30

如何收集测试数据？

10

产生的数据是否属于“数据收集”类别？

10

根据我收集图像的方式，目标检测停止了很好的预测

10

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

社区富文本编辑器全新改版！诚邀体验～

全新交互，全新视觉，新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能，全面提升创作效率和体验