我开发了一个迭代过程,通过这个过程,我可以批量收集数据。数据是预定义的3D空间中的点。我正在尝试根据我的数据在那个3D空间中探索和定位集群。在收集了一些批之后,我可以定位并创建集群。然而,当我收集更多的数据时,正在进行一些小的改进,而新的结果并不值得付出努力。如何确定新批次是否“值得”收集?我是否可以用某种度量来衡量我有多少批次是“相似的”,或者一个新的随机批是否会影响整个过程?
发布于 2018-12-07 09:32:32
量化集群在每一批中的变化程度。
如果更改小于阈值,则停止。
https://datascience.stackexchange.com/questions/42165
复制相似问题