关联算法—时序关联实操

我就在这里,等你关注,不离不弃

——A·May

R-51T-65

「时序 关联

简单关联算法从是否购买商品的行为上对,商品进行关联计算,想了解更多,请点这里R语言 关联算法—Apriori实操。

时序关联就是从行为发生的时间上对行为进行关联计算,比如,你先买的鸡蛋,后面的香蕉,再买的橙子,鸡蛋、香蕉和橙子之间就存在一种时间顺序上的关系,时序关联就是研究多种行为的时间关系,最后找出具有有效性和实用性的关联。

时序关联的数据

时序事务型性数据

时序事务型数据不是比较常见,对于它的形式其实更像是用来做词频共现的那个,如果我们要做这个时序关联,可能要对数据进行整理,才能实现。

如下图,这是时序事务型数据,其中第一列表示的是编号Sid,如会员卡号,第二列表示的是时间点Eid,第三列可以看做是事务项。比如:1,2,Football表示第1个人在第2个时间点正在浏览Football的网页;11,6,Weather表示第11个人在第6个时间点正在浏览Weather的网页。

时序关联的四个步骤

step1

利用read_baskets读取关联性数据

step2

利用cspade建立时序关联的频繁项

step3

利用ruleInduction建立时序关联的推理规则

step4

利用数据框提取lift大于1的推理规则

实验过程

> library(arulesSequences)

> sxdata c("sequenceID","eventID"))

#读取时序事务型数据,第一列sequence是编号,第二列是时间点,第三列是事务项,info后的参数是必写项

> summary(sxdata)

> sxmx

#利用cspade建立时序关联的频繁项,支持率设为0.1

> inspect(sxmx)

> sxtlgz

#利用ruleInduction建立序列推理规则,设置置信度为0.5

> sxtlgz

#将sxtlgz时序推理规则转为数据框

> sxtlgz[sxtigz$lift>1,]

#利用数据框的形式,选取提升度大于1的推理规则

「结语

时序关联的操作过程不是难点,因为和简单关联的做法相类似,可能有问题会在时序事务型数据上,那就好好琢磨一下吧!

我是May,明天见!

学习数据挖掘交流平台

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180108G0HVR300?refer=cp_1026

扫码关注云+社区