专栏首页机器学习养成记关联分析(4):购物篮数据转换R语言

关联分析(4):购物篮数据转换R语言

在进行关联分析时,有时需要根据需求将数据转换为购物篮数据,本篇文章我们将介绍数据进行数据转换的情况及如何在R语言中完成相应操作。

适用情形

我们现在有这样一份数据,记录了近173万用户的爱好情况(数据为随机生成)。数据中每行为一个用户,每列为一个爱好属性,“y”代表有此爱好,“n”代表无此爱好,我们希望通过关联分析找出用户会倾向于同时具有哪些爱好。数据保存为csv格式,并导入R中。

此份数据中,绝大部分取值为“n”,“y”数量偏少,如果直接进行关联分析,会得到如下结果:

可见,结果得到的是同时不具有的爱好规则,与想要结果不符。因此我们需要将数据转换为购物篮数据,即如下形式的数据:

R语言实现

要将数据从原来的格式转换为购物篮数据,首先将“n”全部转换为NA,然后使用arules包中的as(…,"transactions")函数。

d<-read.csv("guanliandata.csv")

d[d=="n"]<-NA

trans3 <- as(d, "transactions")

data_rules1<-apriori(data=d,parameter =list(support=0.03,confidence=0.3,minlen=2))

inspect(sort(data_rules1,by="support"))

最终可得到结果:

同样的方法也可把matrix,list型数据转换为购物篮数据格式,具体可以通过help("transactions-class")进行查看。

本文分享自微信公众号 - 机器学习养成记(chenchenwings)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AdaBoost算法(R语言)

    Boost算法是根据Valiant提出的PAC学习模型衍生得到,是一种可以自适应的改变训练样本的分布,从而使得基分类器聚焦在特殊样本的迭代方法。从基本的Boos...

    三猫
  • 基于用户的协同过滤python代码实现

    在推荐算法概述中介绍了几种推荐算法的概念,但是没有具体代码实现,本篇文章首先来看一下基于用户的协同过滤python代码。

    三猫
  • 聚类(一):DBSCAN算法实现(r语言)

    Some points 算法流程 R语言实现 选择最优的Eps值 自定义距离公式 DBSCAN优缺点 DBSCAN(Density-BasedSpatial ...

    三猫
  • 微信小程序开发技巧总结 (一)

    结合自己在平时的开发中遇到的各种问题,和浏览各种问题的解决方案总结出一些自己在日常开发中常用的技巧和知点,希望各位不吝斧正。

    Kindear
  • 大数据24小时 | 李彦宏“画饼”互惠金融,数据新闻第一人黄志敏离职转型抢滩大数据

    <数据猿导读> SAP推出最新数据仓库应用,帮助企业实现实时数字化运营;“麦谷科技”获同创伟业领投5000万元融资;财新传媒首席技术官黄志敏宣布离职……以下为您...

    数据猿
  • 8种交叉验证类型的深入解释和可视化介绍

    交叉验证(也称为“过采样”技术)是数据科学项目的基本要素。它是一种重采样过程,用于评估机器学习模型并访问该模型对独立测试数据集的性能。

    deephub
  • 谈谈当前商业数据分析师现状

    众所周知,数据分析师有两个发展方向,一个是商业数据分析师,一个就是数据挖掘工程师。

    用户2769421
  • ENCODE project项目简介

    ENCODE是Encyclopedia of DNA Elements的缩写,是由美国人类基因组研究中心NHGRI赞助的一项国际化的合作项目,通过整合DNA, ...

    生信修炼手册
  • 谷歌TPU威胁英伟达?黄仁勋再发长文表示“不以为然”

    李杉 编译整理 量子位 报道 | 公众号 QbitAI 在谷歌发布TPU2当天,英伟达股价颤抖了一下。 虽然股价后来又涨了回来,但谷歌可能使用自有芯片处理人工智...

    量子位
  • 初识HIVE

    什么是HIVE?HIVE是建立在Hadoop HDFS上的数据仓库基础架构,它可以用来进行数据的提取转换加载。HIVE定义了简单的类似SQL的查询语言HQL,H...

    爬蜥

扫码关注云+社区

领取腾讯云代金券