我有一组数据,表示用户的购买交易(大约100万条记录)。用户可以有一个以上的购买跨时间。数据分散在6-7个月内。我拥有的属性是
目标-
根据用户的购买行为对用户进行集群,这样我就可以根据他们的集群行为来针对一组用户(升级)。我想向执行XX行为的用户发送促销信息。
我试过的-
我在中尝试了10000个样本记录的KMeans集群。通过使用“弯头法”,确定了6-7簇是最优的。尽管如此,集群在识别类似的用户组方面并没有多大帮助。集群是没有意义的。
问题-
1)我做得对吗?
2)这种用例的理想算法是什么?我应该考虑聚类还是类似于推荐算法(群相似用户)
3)问题/目标/目标用户组可能会随着时间的推移而改变。我们该怎么处理呢?
发布于 2016-07-22 14:48:51
我认为这不是一个问题,你应该做的工作,了解和描述集群后,你得到了。帮助我的是计算用于聚类的变量的方法,然后将它们的差异放在其他逻辑基础上(比如动物、颜色或卡通英雄),然后尝试在最能描述它们的集群上添加标签。
此外,在您的情况下,我应该从变量中提取一些度量标准,比如将购买时间转换为每个客户在白天或晚上的采购份额,或者将一天转换为周末/工作日等等。
https://datascience.stackexchange.com/questions/12930
复制相似问题