而今天要介绍的PrefixSpan(PrefixSpan算法的全称是Prefix-Projected Pattern Growth,即前缀投影的模式挖掘)算法也是关联算法,但是它是挖掘频繁序列模式的,因此要解决的问题目标稍有不同...PrefixSpan的一些基本概念
PrefixSpan算法的全称是Prefix-Projected Pattern Growth,即前缀投影的模式挖掘,里面有前缀和投影两个词。...如果用严格的数学描述,前缀是这样的:对于序列A={a1,a2,...an}和序列B={b1,b2,...bm},n≤m,满足a1=b1,a2=b2...an−1=bn−1,而an⊆bn,则称A是B的前缀...PrefixSpan算法思想
PrefixSpan算法的目标是挖掘出满足最小支持度的频繁序列。那么怎么去挖掘出所有满足要求的频繁序列呢?...注意f和_f是不一样的,因为前者是在和前缀d不同的项集,而后者是和前缀d同项集。由于此时a,d,e,f,_f都达不到支持度阈值,因此我们递归得到的前缀为d的2项频繁序列为和。