首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >什么时候停止收集数据?

什么时候停止收集数据?
EN

Data Science用户
提问于 2018-12-05 04:41:31
回答 1查看 303关注 0票数 1

我开发了一个迭代过程,通过这个过程,我可以批量收集数据。数据是预定义的3D空间中的点。我正在尝试根据我的数据在那个3D空间中探索和定位集群。在收集了一些批之后,我可以定位并创建集群。然而,当我收集更多的数据时,正在进行一些小的改进,而新的结果并不值得付出努力。如何确定新批次是否“值得”收集?我是否可以用某种度量来衡量我有多少批次是“相似的”,或者一个新的随机批是否会影响整个过程?

EN

回答 1

Data Science用户

发布于 2018-12-07 09:32:32

量化集群在每一批中的变化程度。

如果更改小于阈值,则停止。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/42165

复制
相关文章
InnoDB数据页什么时候合并
我们知道,当从InnoDB表删除数据时,相应的数据是先打上删除标签(deleted mark),而后再由purge线程执行清理工作。
老叶茶馆
2020/07/16
4890
【常用命令】自动统计收集的停止(无效)和启动(有效)
优化器 统计信息 optimizer stats statistics auto tasks
SQLplusDB
2020/03/26
9410
停止冻结你的数据至死
告别数据冻结!企业应利用对象存储优化方案,如 AWS S3 Tables 和 Apache Iceberg,实现日志数据长期热存储,释放 ML、网络安全和 BI 潜力。通过并行、分区、高密度压缩等技术,提升查询性能,告别分层存储的低效与高成本,拥抱云原生实时分析新时代!
云云众生s
2025/03/18
510
什么时候使用Dockerfiles(什么时候不使用……)
在这篇文章中,我们将讨论一些使用 Dockerfile 的最佳实践,探索一些注意事项,并使用 Dockerfile 和云原生 Buildpacks 构建应用。你将了解每种工具最擅长的工作是什么,以及如何决定何时使用它们。
CNCF
2021/12/15
1.8K0
什么时候使用Dockerfiles(什么时候不使用……)
在中国我们如何收集数据?全球数据收集大教程
以前都是有小伙伴说想找点数据,自己来试试手,想分析出一些好的东西来。现在我们分享这篇文章给大家,也希望大家可以实现一个小的梦想,数据在这里,分析等你来。
IT阅读排行榜
2018/08/16
1.9K0
在中国我们如何收集数据?全球数据收集大教程
数据收集渠道_数据挖掘数据集
NLP方向:Hugging Face – The AI community building the future.
全栈程序员站长
2022/11/03
1.2K0
数据收集渠道_数据挖掘数据集
什么时候用Goroutine?什么时候用Channel?
什么场景下用channel合适呢? 通过全局变量加锁同步来实现通讯,并不利于多个协程对全局变量的读写操作。 加锁虽然可以解决goroutine对全局变量的抢占资源问题,但是影响性能,违背了原则。 总结:为了解决上述的问题,我们可以引入channel,使用channel进行协程goroutine间的通信。 Go语言中的操作系统线程和goroutine的关系: 一个操作系统线程对应用户态多个goroutine。 go程序可以同时使用多个操作系统线程。 goroutine和OS线程是多对多的关系,即m:n。 Go
王中阳Go
2022/10/26
9750
Flume:流式数据收集利器
在数据生命周期里的第一环就是数据收集。收集通常有两种办法,一种是周期性批处理拷贝,一种是流式收集。今天我们就说说流式收集利器Flume怎么使用。 使用flume收集数据保存到多节点 by 尹会生 1 使用flume 收集数据到hdfs 由于工作的需要,领导要求收集公司所有在线服务器节点的文本数据,进行存储分析,从网上做了些比较,发现flume 是个简单实现,而且非常强大的工具,这里介绍给大家 首先下载软件:http://flume.apache.org flume是著名的开源数据收集系统
刀刀老高
2018/04/11
1.3K0
ORACLE数据库收集
oracle 12C静默安装方式 https://www.cnblogs.com/lkj371/p/15291392.html
全栈工程师修炼指南
2022/09/29
4770
OpenTelemetry:深度收集遥测数据
在我们前面的文章中,我们探讨了如何在 Go 项目中集成 OpenTelemetry 并进行基本的追踪。今天,我们将进一步讨论如何使用 OpenTelemetry 收集更丰富的遥测数据,包括关键方法的参数,错误信息,以及查询时间过长的 SQL 语句。
运维开发王义杰
2023/08/10
3230
OpenTelemetry:深度收集遥测数据
Metagoofil 元数据收集工具
Metagoofil是一个信息收集工具用于提取目标公司元数据的公共文档(pdf、doc、xls、ppt、docx、pptx、xlsx)
意大利的猫
2020/08/19
1.4K0
Hadoop数据收集系统—Flume
syslogTcp(5440) | agentSink("localhost",35856)
大数据和云计算技术
2018/07/26
6490
Hadoop数据收集系统—Flume
收集和存储数据——数据仓库
数据产品的工作比较杂,从数据仓库建模,指标体系建立,到数据产品工具的设计,再到偶尔一些数据分析报告的撰写,甚至一些机器学习的预测模型都要有所了解。大公司可能每个职能都有专门的岗位来负责,小公司的话可能真的要你一条龙了。
三哥
2018/07/31
9150
收集和存储数据——数据仓库
mysql停止命令 停止mysql服务命令
如果没有将mysql注册为系统服务,那么我们可以使用MySQL为我们提供的一些工具来开启,关闭,重启mysql。当然,mysql服务脚本对mysql的操作也是调用这些工具来完成的。这些工具都在mysql的安装目录的bin目录中。贴个图:
it妹
2019/08/21
19.3K0
mysql停止命令 停止mysql服务命令
数据模型详解-究竟什么时候物化视图?
翻译内容 3.4. Materialized Views 第三段和第四段: Views provide a mechanism to hide from the client whether data is derived data or base data—but can’t avoid the fact that some views are expensive to compute. 视图提供了一种机制就是把数据封装起来,然后客户端调用者不管是原始数据(base data)还是派生数
ImportSource
2018/05/04
1.3K0
数据库PostrageSQL-什么时候会用JIT?
JIT编译主要可以让长时间运行的CPU密集型的查询受益。对于短查询,执行JIT编译增加的开销常常比它节省的时间还要多。
cwl_java
2021/01/13
3510
停止复用
文章起源于我对于模块化、微服务、Serverless 以及单体应用几种不同的架构模式的思考。而这其中的一个原因就是:人们经常从一个极端走另外一个极端。既然单体不好,那么我们就要 FAAS 来替换单体;既然模块化架构有各种问题,那么我们应该回到大单体。
Phodal
2020/06/30
2.1K0
别想收集学生的大数据
一年前,数据分析公司InBloom开始监视纽约州公立学校的所有学生。这些学校向该公司提供了覆盖400多个领域的大量数据,包括从考试成绩、特殊教育注册到孩子有没有吃免费午餐的大量个人细节。这个做法的初衷是想对尽可能多的信息加以汇编,让教师或软件可以根据每个学生的需求来布置作业。 事实上,InBloom和全美九个州数以百万计的公立学校学生签了相同的协议,对他们的学业进行跟踪,为他们的学习表现作出评定。此举令InBloom成为个性化学习这个新兴领域中最炙手可热的公司,它们的卖点是可以帮助人满为患、资金匮乏的学校
大数据文摘
2018/05/22
9610
uwsgi停止[通俗易懂]
必须在uwsgi.ini中配置好 pidfile = 绝对路径 ///uwsgi.pid 这样才有pid文件 uwsgi –stop uwsgi.pid 这样就可以停止了 有一点需要注意:如果没有uwsgi.pid 又需要停止uwsgi服务 可以netstat -lntp查看一下端口占用 然后lsof -i :端口 查看具体的pid 把pid写入 再进行停止操作
全栈程序员站长
2022/10/01
2.7K0
setInterval停止
实现代码如下: var refreshIntervalId = setInterval(fname, 10000); /* later */ clearInterval(refreshIntervalId); var intervalID = setInterval(func, [delay, arg1, arg2, ...]); var intervalID = setInterval(function[, delay]); var intervalID = setInterval(code, [d
IT工作者
2021/12/29
2.8K0

相似问题

如何知道什么时候停止训练深层网络?

30

什么时候清理数据?

30

如何收集测试数据?

10

产生的数据是否属于“数据收集”类别?

10

根据我收集图像的方式,目标检测停止了很好的预测

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文