首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >关联规则挖掘

关联规则挖掘
EN

Stack Overflow用户
提问于 2015-02-27 07:01:54
回答 3查看 522关注 0票数 3

我有一个具有大多数整数值的数据集。我想在上面应用关联规则挖掘。我看过流行的算法,如Apriori等,但它们都处理具有布尔值的数据,即,项存在于事务中还是不存在。

是否有一种算法,让我们除了计算属性的数量之外,还可以计算属性的值?(我计划将数据正常化,使其值介于0到1之间)

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2015-02-27 07:40:37

如果你的号码是整数,你可以“黑”这个限制(为什么要正常化到0 1?)和小的:

代码语言:javascript
运行
复制
apple banana apple

变成了

代码语言:javascript
运行
复制
apple banana apple_2

,这样就可以找到如下的关联规则

代码语言:javascript
运行
复制
banana => apple, apple_2

但是你需要混合一些聪明的过滤器,这样才不会得到一些无用的规则

代码语言:javascript
运行
复制
apple_2 => apple
票数 1
EN

Stack Overflow用户

发布于 2015-07-27 15:08:09

项-项协作过滤与基于相似度的数据挖掘技术(如关联规则挖掘)非常相似。此外,协作过滤用于处理连续的序数值,例如星级或Likert分级:这通常是来自用户的偏好信息。

基于内容的过滤可能是您所描述的情况的最佳选择。它允许项属性和权重(不更改该项的每个用户),然后接受用户对每个项的首选项(该项的每个用户都会更改)。

如果您希望更改每个用户项对的首选项(计数)和属性,我不知道有一个处理该问题的算法。通常的算法是为每个用户项目对建立一个输入。

票数 1
EN

Stack Overflow用户

发布于 2015-03-04 16:15:10

是。项目集挖掘问题有一些变体,可以让您指定其他信息。例如,高实用程序项集挖掘算法允许您为事务中出现的每个项指定一个数量,以及为每个项指定一个权重。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/28759325

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档