如何使用mahout计算k均值聚类中的成本函数值?
我正在参加Coursera的机器学习课。建议在k均值聚类过程中,若要对簇进行随机初始化,则在初始簇质心值不同的情况下,对聚类进行多次计算。然后,我们应该检查成本函数的价值,以确定哪一个迭代成本是最小的。
请您建议如何计算Apache实现k-means集群的成本值?
发布于 2014-03-26 20:16:00
它是独立于执行的。只需计算从点到其各自质心的平方距离之和。这是你的成本函数。
https://stackoverflow.com/questions/22672059
复制相似问题