首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >spmf中关联规则中的r子集

spmf中关联规则中的r子集
EN

Stack Overflow用户
提问于 2014-08-01 00:36:28
回答 1查看 477关注 0票数 1

代码:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
data=read.csv("./spmf1234.csv",header=F);

df<- data.frame(do.call('rbind', strsplit(as.character(data$V1),'#',fixed=F)));

df2<- data.frame(do.call('rbind', strsplit(as.character(df$X1),'==>',fixed=F)));

df3=cbind(df2,df);

colnames(df3)=c("lhs","rhs","rule","support","confidence","lift");

df4 <- subset(df3, select = c(lhs,rhs,support,confidence,lift));

final=subset(df4,lhs!=1);

我在csv文件上尝试上面的代码,我已经从spmf中获得了使用from来获得关联规则。我希望所有的规则'1‘在lhs被删除,但这是无效的。

csv文件:

2 ==> 1 #SUP: 1 #CONF: 0.33333 #升降: 0.66667

1 ==> 2 #SUP: 1 #CONF: 0.33333 #升降: 0.66667

3 ==> 1 #SUP: 2 #CONF: 0.5 #升降:1

1 ==> 3 #SUP: 2 #CONF: 0.66667 #升降:1

3 ==> 2 #SUP: 2 #CONF: 0.5 #升降:1

2 ==> 3 #SUP: 2 #CONF: 0.66667 #升降机:1

2 3 ==> 1 #SUP: 1 #CONF: 0.5 #升降:1

1 3 ==> 2 #SUP: 1 #CONF: 0.5 #升降:1

1 2 ==> 3 #SUP: 1 #CONF: 1 #LIFT: 1.5

3 ==> 1 2 #SUP: 1 #CONF: 0.25 #升力: 1.5

2 ==> 1 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1

1 ==> 2 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-08-01 00:44:13

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
final=subset(df4,lhs!=1) 

将字符与不起作用的数字进行比较:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# > as.character(df4$lhs)
# [1] "2 "   "1 "   "3 "   "1 "   "3 "   "2 "   "2 3 " "1 3 " "1 2 " "3 "   "2 "   "1 "  

您可能需要使用一个正则表达式,如insead:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
final = subset(df4, !grepl("1\\b", lhs))
# > final
#    lhs   rhs support     confidence          lift
# 1    2     1  SUP: 1  CONF: 0.33333  LIFT: 0.66667
# 3    3     1  SUP: 2      CONF: 0.5        LIFT: 1
# 5    3     2  SUP: 2      CONF: 0.5        LIFT: 1
# 6    2     3  SUP: 2  CONF: 0.66667        LIFT: 1
# 7  2 3     1  SUP: 1      CONF: 0.5        LIFT: 1
# 10   3   1 2  SUP: 1     CONF: 0.25      LIFT: 1.5
# 11   2   1 3  SUP: 1  CONF: 0.33333        LIFT: 1

Add:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## data preperation
data <- readLines(con = textConnection("  
2 ==> 1 #SUP: 1 #CONF: 0.33333 #LIFT: 0.66667
1 ==> 2 #SUP: 1 #CONF: 0.33333 #LIFT: 0.66667
3 ==> 1 #SUP: 2 #CONF: 0.5 #LIFT: 1
1 ==> 3 #SUP: 2 #CONF: 0.66667 #LIFT: 1
3 ==> 2 #SUP: 2 #CONF: 0.5 #LIFT: 1
2 ==> 3 #SUP: 2 #CONF: 0.66667 #LIFT: 1
2 3 ==> 1 #SUP: 1 #CONF: 0.5 #LIFT: 1
1 3 ==> 2 #SUP: 1 #CONF: 0.5 #LIFT: 1
1 2 ==> 3 #SUP: 1 #CONF: 1 #LIFT: 1.5
3 ==> 1 2 #SUP: 1 #CONF: 0.25 #LIFT: 1.5
2 ==> 1 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1
1 ==> 2 3 #SUP: 1 #CONF: 0.33333 #LIFT: 1"))
r <- regexec(pattern = "([0-9 ]+)\\s==>\\s([0-9 ]+)\\s\\#SUP:\\s([0-9.]+)\\s\\#CONF:\\s([0-9.]+)\\s\\#LIFT:\\s([0-9.]+)", 
             text = data)
m <- regmatches(data, r)
df <- setNames(as.data.frame(do.call(rbind, lapply(m, "[", -1)), stringsAsFactors = FALSE), 
               c("lhs", "rhs", "support", "confidence", "lift"))

## rows to include/exclude
include <- sapply(strsplit(df$lhs, " "), function(x) !any(as.integer(x) %in% 1:1000))
df[include, ]
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/25076087

复制
相关文章
R语言︱关联规则+时间因素=序贯关联规则
支持度其实是这样计算的:看上面的data中有4个序列,比如我们要计算{A}的支持度,则直接看{A}在4个序列中出现过几次,用次数再除以4就得到了支持度。至于一次订单中出现多少次A,则对序列挖掘是没啥影响的。
悟乙己
2019/05/26
8260
R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律
方剂药效与剂量的关系中药不传之秘在于剂量中药配伍规律。拓端数据使用数据挖掘技术对海量的在线医院药物复方历史数据进行智能分析,并从中找出药物配伍的规律。
拓端
2022/04/13
7350
R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律
R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律
方剂药效与剂量的关系中药不传之秘在于剂量中药配伍规律。拓端数据使用数据挖掘技术对海量的在线医院药物复方历史数据进行智能分析,并从中找出药物配伍的规律。
拓端
2020/08/06
1.2K0
机器学习(三) 关联规则R语言实战 Apriori
关联规则背景 关联规则来源 上个世纪,美国连锁超市活尔玛通过大量的数据分析发现了一个非常有趣的现象:尿布与啤酒这两种看起来风马牛不相及的商品销售数据曲线非常相似,并且尿布与啤酒经常被同时购买,也即购买尿布的顾客一般也同时购买了啤酒。于是超市将尿布与啤酒摆在一起,这一举措使得尿布和啤酒的销量大幅增加。 原来,美国的妇女通常全职在家照顾孩子,并且她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。 注: 此案例很精典,切勿盲目模仿案例本身,而应了解其背后原理。它发生
Jason Guo
2018/06/20
2.6K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
文章目录 一、 频繁项集 二、 非频繁项集 三、 强关联规则 四、 弱关联规则 五、 发现关联规则 参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 ) 一、 频繁项
韩曙亮
2023/03/28
2K0
R关联规则算法(支持度、自信度、提升度)
本文介绍了关联规则算法,包括Apriori算法和FP-growth算法,并给出了在R语言中的实现方法。以啤酒-尿布为例,进行了关联规则挖掘,并分析了挖掘结果的价值。
Erin
2018/01/09
1.1K0
你不懂的关联规则
支持度: 支持度是一个百分比,指某个商品组合出现的次数与总次数之间的比例,支持度越高表示该组合出现的几率越大。
润森
2019/08/29
1.3K0
你不懂的关联规则
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
支持度 表示 数据项 ( Item ) 在 事务 ( Transaction ) 中的 出现频度 ;
韩曙亮
2023/03/28
1.3K0
关联规则挖掘算法
关联规则挖掘是一种基于规则的机器学习算法,该算法可以在大数据库中发现感兴趣的关系。它的目的是利用一些度量指标来分辨数据库中存在的强规则。也即是说关联规则挖掘是用于知识发现,而非预测,所以是属于无监督的机器学习方法。 “尿布与啤酒”是一个典型的关联规则挖掘的例子,沃尔玛为了能够准确了解顾客在其门店的购买习惯,对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛利用所有用户的历史购物信息来进行挖掘分析,一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒! 关联规则挖掘算法不仅被应用于购
用户1332428
2018/03/08
1.6K0
关联规则挖掘算法
R语言实现关联规则与推荐算法(学习笔记)
版权声明:博主原创文章,微信公众号:素质云笔记,转载请注明来源“素质云博客”,谢谢合作!! https://blog.csdn.net/sinat_26917383/article/details/50662709
悟乙己
2019/05/26
1.2K0
R语言实现关联规则与推荐算法(学习笔记)
关联规则挖掘综述
本文介绍了关联规则挖掘的研究情况,提出了关联规则的分类方法,对一些典型算法进行了分析和评价,指出传统关联规则衡量标准的不足,归纳出关联规则的价值衡量方法,展望了关联规则挖掘的未来研究方向。 1 引言 数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database),在最近几年里已被数据库界所广泛研究,其中关联规则(Association Rules)的挖掘是一个重要的问题。 关联规则是发现交易数据库中不同商品(项)之间的联系,这些规则找出顾客购买
机器学习AI算法工程
2018/03/12
2.1K0
关联规则挖掘算法
设 为所有项目的集合, 为事务数据库,事物 是一个项目子集( )。每一个事务具有唯一的事务标识 。设 是一个由项目构成的集合,称为 。事务 包含项集 ,当且仅当 。如果项集 中包含 个项目,则称其为
用户1733462
2018/09/20
6930
关联规则挖掘算法
R语言关联规则可视化:扩展包arulesViz的介绍
关联规则挖掘是一种流行的数据挖掘方法,在R语言中为扩展包arules。然而,挖掘关联规则往往导致非常多的规则,使分析师需要通过查询所有的规则才能发现有趣的规则。通过手动筛选大量的规则集是费时费力。在本文中,我们基于探索关联规则的R扩展包arulesViz,提出几个已知的和新颖的可视化技术。 1、简介 算法步骤这里不做详细介绍,下面是几个重要的变量的定义: Supp(X=>Y) = P(X) Conf(X=>Y) = P(Y|X) Lift(X=>Y) = CONF(X=>Y)/SUPP(Y) = P(X a
机器学习AI算法工程
2018/03/13
4.8K0
R语言关联规则可视化:扩展包arulesViz的介绍
Golang 中的“潜规则”
./example_struct2binary.go:21: head.ver undefined (cannot refer to unexported field or method ver)
王亚昌
2018/08/03
7820
Java中的命名规则
在查找java命名规则时,未在国内相关网站查找到较为完整的文章,这是一篇国外程序开发人员写的java命名规则的文章,原文是英文写的,为了便于阅读,遂翻译为汉语,以便帮助国内开发者有所了解。
愷龍
2022/09/26
1K0
R语言关联规则挖掘apriori算法挖掘评估汽车性能数据
我们一般把一件事情发生,对另一件事情也会产生影响的关系叫做关联。而关联分析就是在大量数据中发现项集之间有趣的关联和相关联系(形如“由于某些事件的发生而引起另外一些事件的发生”)。 我们的生活中有许多关联,一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,这种关联的发现可以帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。
拓端
2023/04/10
3830
R语言用关联规则和聚类模型挖掘处方数据探索药物配伍中的规律|附代码数据
方剂药效与剂量的关系中药不传之秘在于剂量中药配伍规律。拓端数据使用数据挖掘技术对海量的在线医院药物复方历史数据进行智能分析,并从中找出药物配伍的规律
拓端
2023/01/04
9450
【算法】关联规则挖掘算法
小编邀请您,先思考: 1 关联算法有什么应用? 2 关联算法如何实现? 温馨提示:加入圈子或者商务合作,请加微信:luqin360 关联规则挖掘是一种基于规则的机器学习算法,该算法可以在大数据库中发现
陆勤_数据人网
2018/04/18
1.5K0
【算法】关联规则挖掘算法
数据挖掘——关联规则挖掘
关联规则挖掘(Association Rule Mining)最早是由Agrawal等人提出。最初的动机是解决购物篮分析(Basket Analysis)问题,目的是发现交易数据库(Transaction Database)中不同商品之间的联系规则。
全栈程序员站长
2022/09/09
2.4K0
关联规则挖掘--Apriori算法
  关联规则(Association Rules)反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么,其中 一个事物就能够通过其他事物预测到。
别团等shy哥发育
2023/02/25
3260
关联规则挖掘--Apriori算法

相似问题

关联R中的数据子集

19

关联规则数据挖掘中基于子集的规则过滤

19

R中的排序关联规则

15

R中lhs的子集设置规则

31

R中的不规则数组子集

20
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文