对于香草K-均值聚类算法,我知道时间复杂度是:
时间复杂度: O(tknm),
其中n是数据点数,k是簇数,t是迭代次数,m是向量的维数。
所以,当我研究小型批处理K-方法使算法更快地收敛时,我想知道它的时空复杂性是什么?
从本质上说,我很清楚,我们在香草K上优化了多少。
发布于 2017-05-17 21:25:35
无限的。
小批k-意味着永远不会收敛,你需要使用迭代限制或类似的启发式,你永远不能保证找到一个局部最优。
实质上,小型批处理k-的意思是:
假设你的样本大小是N,2需要O(k,N,m,t)时间。
https://datascience.stackexchange.com/questions/19042
复制相似问题