首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >以神经网络的假阳性作为推荐系统的结果?

以神经网络的假阳性作为推荐系统的结果?
EN

Data Science用户
提问于 2018-08-20 13:27:53
回答 1查看 187关注 0票数 2

我正在创建一个推荐系统,并考虑将问题形式化的两种并行方法。一种是使用邻近性的经典产品(如果大多数2k+1客户最接近该产品,则向客户推荐该产品);另一种是我难以理解但在某种程度上似乎有效的产品。

我想的方法是:

1)将高度正则化的神经网络(以确保它不超过训练集)用于分类任务,该分类任务可以预测人是否有给定的产品

2)确保测试精度尽可能接近训练精度。

3)在整个数据集(也是培训集)上,以错误阳性(客户最初没有产品,但NN预测有)作为结果--我应该推荐产品的人。

现在,我知道为什么一般人不想采用这种方法,但我也不能确切地解释为什么它不会让人们“亲近”于“应该”给出类似于KNN的产品的产品。我不知道如何准确地分析这个问题来验证、修改或完全拒绝这个想法。

EN

回答 1

Data Science用户

发布于 2018-08-30 13:47:06

1)是回归,而不是分类。

您应该尝试从决策树的角度来考虑它,而不是NN。客户的属性都是该客户的产品,以及有关该客户的所有附加信息。

由于任务是回归的,决策树的所有叶将具有标签0(如果决策路径导致声明客户没有产品)或标签1(如果决策路径导致客户拥有产品的声明)。

在构建决策树时,我们必须从根开始,根据所选属性的值,决定我们将使用哪个属性作为第一个节点,从那里所有客户将获得相应的分支。该属性是通过使用熵计算信息增益值最高的属性来选择的。这仅仅意味着我们选择属性,它将客户划分为每个集合的集合,理想情况下,每个集合的客户数量与0和1相同。

对于从父节点分支的每个新节点,只要存在一个信息增益高于阈值的属性,或者树变得很深(因为它是NP-完全的),就会重复这种情况。现在我们在每片叶子上数0和1的数量,并将叶子标记为最大值(0,1)。由此得出的结论是:如果一个客户虽然是0的话,但他的价值却是1,那么对于这个客户来说,最高的信息增益属性的值与对于1岁的客户的值是一样的。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/37193

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档