前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关联分析(4):购物篮数据转换R语言

关联分析(4):购物篮数据转换R语言

作者头像
三猫
发布2018-11-30 11:50:22
1.2K0
发布2018-11-30 11:50:22
举报
文章被收录于专栏:机器学习养成记
在进行关联分析时,有时需要根据需求将数据转换为购物篮数据,本篇文章我们将介绍数据进行数据转换的情况及如何在R语言中完成相应操作。

适用情形

我们现在有这样一份数据,记录了近173万用户的爱好情况(数据为随机生成)。数据中每行为一个用户,每列为一个爱好属性,“y”代表有此爱好,“n”代表无此爱好,我们希望通过关联分析找出用户会倾向于同时具有哪些爱好。数据保存为csv格式,并导入R中。

此份数据中,绝大部分取值为“n”,“y”数量偏少,如果直接进行关联分析,会得到如下结果:

可见,结果得到的是同时不具有的爱好规则,与想要结果不符。因此我们需要将数据转换为购物篮数据,即如下形式的数据:

R语言实现

要将数据从原来的格式转换为购物篮数据,首先将“n”全部转换为NA,然后使用arules包中的as(…,"transactions")函数。

d<-read.csv("guanliandata.csv")

d[d=="n"]<-NA

trans3 <- as(d, "transactions")

data_rules1<-apriori(data=d,parameter =list(support=0.03,confidence=0.3,minlen=2))

inspect(sort(data_rules1,by="support"))

最终可得到结果:

同样的方法也可把matrix,list型数据转换为购物篮数据格式,具体可以通过help("transactions-class")进行查看。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习养成记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档