首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何决定谁该上市?聚类还是决策树?

如何决定谁该上市?聚类还是决策树?
EN

Data Science用户
提问于 2020-04-19 19:17:01
回答 3查看 90关注 0票数 3

我使用的数据集有足够的观测值和10个变量,

  • 这些变量中有一半是数值变量。
  • 另一半变量是2-3级的分类变量(人口学)
  • 一个ID变量
  • 最后一个具有销售价值的变量,0表示无销售和金额待售。

利用这些信息,我想了解我的客户中哪些部分需要市场。我使用R作为代码,但这与此无关。:)

我对使用哪种统计技术感到困惑。因为我想找出我想要获得的客户类型,并建立我的活动,我最初的想法是使用k-均值聚类,即与无监督的学习。

然而,考虑到我知道谁购买了,他们从销售价值数字中购买了多少,我认为包括这些信息是值得的,并决定选择预测建模。在这里,回归只会告诉变量的重要性,但我对节点感兴趣(例如,我想要支持我的营销活动的规则,比如LA region...etc的age 45+ )。所以决策树会更适合。

你的想法是什么?聚类还是决策树?或者实际上是别的什么?

EN

回答 3

Data Science用户

发布于 2020-10-22 12:04:16

由于您有标签数据(即销售量),您可以应用监督机器学习。

在模型拟合之后,可以找到有助于预测目标的特征。

决策树是一个相对简单的选项,因为它很容易处理不同类型的特性,并且可以生成决策路径。

票数 0
EN

Data Science用户

发布于 2020-11-21 14:23:05

我有一个稍微不同的看法,并认为这个问题是一个相关的推荐系统。

就像人们根据不同的方法(包括监督方法和非监督方法)向用户推荐电影一样,您也会向用户推荐产品。

因此,虽然您可以开始使用这两种非监督(集群)来分割您的用户,特别是。如果数据集很大),并对DTs这样的模型进行监督,以便更好地窥探模型,那么最终您应该转向推荐系统所使用的标识和方法集合。

票数 0
EN

Data Science用户

发布于 2022-04-29 17:40:28

这两种算法都是有用的。聚类分析有利于对群体进行营销,决策树可以为您提供特定的规则,说明哪些是最适合市场的细分部分,哪些是最坏的。但是,机器学习算法不会给你一个确切的答案。可以同时使用聚类和决策树。您可以比较它们的输出,看看两者之间是否存在共识。如果他们得出相反的结论,在总体意义上,你需要回到图纸,并试图调和差异。

票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/72598

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档