参考博客 :
关联规则 性质 1 : 非频繁项集 的 超集 一定是 非频繁的 ;
超集 就是 包含 该集合的集合 ;
项集
是 非频繁项集 ,
项集
是 项集
的超集 ,
( 使用集合表示 :
, 项集
包含 项集
, 并且 项集
不为空集 )
则 项集
一定是 非频繁的 ;
举例 :
数据集
为 :
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
项集
项集
上述
就是
的 超集 ,
项集
其支持度是
, 小于最小支持度
, 是 非频繁项集
那么
也是 非频繁项集 ;
在具体算法中会使用该性质 , 用于进行 “剪枝” 操作 ;
计算支持度时 , 按照
项集 支持度 ,
项集 支持度 ,
顺序进行计算 ,
如果发现
项集 中有 非频繁项集 , 则包含该
项集的
项集 肯定是 非频繁项集 ;
然后使用 频繁
项集 组合成
项集 , 然后再计算这些
项集是否是频繁项集 ;
“剪枝” 操作 减少了不必要的计算量 ;
频繁项集 的 所有非空子集 , 一定是 频繁项集 ;
项集
是 频繁项集 ,
项集
是 项集
的超集 ,
( 使用集合表示 :
, 项集
包含 项集
, 并且 项集
不为空集 )
则 项集
一定是 频繁的 ;
举例 :
数据集
为 :
事物编号 | 事物 ( 商品 ) |
---|---|
001 001 001 | 奶粉 , 莴苣 |
002 002 002 | 莴苣 , 尿布 , 啤酒 , 甜菜 |
003 003 003 | 奶粉 , 尿布 , 啤酒 , 橙汁 |
004 004 004 | 奶粉 , 莴苣 , 尿布 , 啤酒 |
005 005 005 | 奶粉 , 莴苣 , 尿布 , 橙汁 |
奶粉 , 莴苣
莴苣 , 尿布 , 啤酒 , 甜菜
奶粉 , 尿布 , 啤酒 , 橙汁
奶粉 , 莴苣 , 尿布 , 啤酒
奶粉 , 莴苣 , 尿布 , 橙汁
项集
,
项集
项集
其支持度是
, 等于最小支持度
, 是 频繁项集
那么
项集
的子集是
项集
,
,
根据上述性质 ,
项集
,
都是 频繁项集 ;
任意一个 项集 的 支持度 , 都 大于等于 其 超集 支持度 ;
超集 就是 包含 该集合的集合 ;
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有