我就在这里,等你关注,不离不弃
——A·May
R-51T-65
「时序 关联
」
简单关联算法从是否购买商品的行为上对,商品进行关联计算,想了解更多,请点这里R语言 关联算法—Apriori实操。
时序关联就是从行为发生的时间上对行为进行关联计算,比如,你先买的鸡蛋,后面的香蕉,再买的橙子,鸡蛋、香蕉和橙子之间就存在一种时间顺序上的关系,时序关联就是研究多种行为的时间关系,最后找出具有有效性和实用性的关联。
「
时序关联的数据
」
时序事务型性数据
时序事务型数据不是比较常见,对于它的形式其实更像是用来做词频共现的那个,如果我们要做这个时序关联,可能要对数据进行整理,才能实现。
如下图,这是时序事务型数据,其中第一列表示的是编号Sid,如会员卡号,第二列表示的是时间点Eid,第三列可以看做是事务项。比如:1,2,Football表示第1个人在第2个时间点正在浏览Football的网页;11,6,Weather表示第11个人在第6个时间点正在浏览Weather的网页。
时序关联的四个步骤
step1
利用read_baskets读取关联性数据
step2
利用cspade建立时序关联的频繁项
step3
利用ruleInduction建立时序关联的推理规则
step4
利用数据框提取lift大于1的推理规则
「
实验过程
」
> library(arulesSequences)
> sxdata c("sequenceID","eventID"))
#读取时序事务型数据,第一列sequence是编号,第二列是时间点,第三列是事务项,info后的参数是必写项
> summary(sxdata)
> sxmx
#利用cspade建立时序关联的频繁项,支持率设为0.1
> inspect(sxmx)
> sxtlgz
#利用ruleInduction建立序列推理规则,设置置信度为0.5
> sxtlgz
#将sxtlgz时序推理规则转为数据框
> sxtlgz[sxtigz$lift>1,]
#利用数据框的形式,选取提升度大于1的推理规则
「结语
」
时序关联的操作过程不是难点,因为和简单关联的做法相类似,可能有问题会在时序事务型数据上,那就好好琢磨一下吧!
我是May,明天见!
学习数据挖掘交流平台
领取专属 10元无门槛券
私享最新 技术干货