我使用的数据集有足够的观测值和10个变量,
利用这些信息,我想了解我的客户中哪些部分需要市场。我使用R作为代码,但这与此无关。:)
我对使用哪种统计技术感到困惑。因为我想找出我想要获得的客户类型,并建立我的活动,我最初的想法是使用k-均值聚类,即与无监督的学习。
然而,考虑到我知道谁购买了,他们从销售价值数字中购买了多少,我认为包括这些信息是值得的,并决定选择预测建模。在这里,回归只会告诉变量的重要性,但我对节点感兴趣(例如,我想要支持我的营销活动的规则,比如LA region...etc的age 45+ )。所以决策树会更适合。
你的想法是什么?聚类还是决策树?或者实际上是别的什么?
发布于 2020-10-22 12:04:16
由于您有标签数据(即销售量),您可以应用监督机器学习。
在模型拟合之后,可以找到有助于预测目标的特征。
决策树是一个相对简单的选项,因为它很容易处理不同类型的特性,并且可以生成决策路径。
发布于 2020-11-21 14:23:05
我有一个稍微不同的看法,并认为这个问题是一个相关的推荐系统。
就像人们根据不同的方法(包括监督方法和非监督方法)向用户推荐电影一样,您也会向用户推荐产品。
因此,虽然您可以开始使用这两种非监督(集群)来分割您的用户,特别是。如果数据集很大),并对DTs这样的模型进行监督,以便更好地窥探模型,那么最终您应该转向推荐系统所使用的标识和方法集合。
发布于 2022-04-29 17:40:28
这两种算法都是有用的。聚类分析有利于对群体进行营销,决策树可以为您提供特定的规则,说明哪些是最适合市场的细分部分,哪些是最坏的。但是,机器学习算法不会给你一个确切的答案。可以同时使用聚类和决策树。您可以比较它们的输出,看看两者之间是否存在共识。如果他们得出相反的结论,在总体意义上,你需要回到图纸,并试图调和差异。
https://datascience.stackexchange.com/questions/72598
复制相似问题