Loading [MathJax]/jax/output/CommonHTML/fonts/TeX/AMS-Regular.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则性质 | 非频繁项集超集性质 | 频繁项集子集性质 | 项集与超集支持度性质 )

作者头像
韩曙亮
发布于 2023-03-28 10:58:58
发布于 2023-03-28 10:58:58
7840
举报

文章目录

参考博客 :

一、 非频繁项集超集性质


关联规则 性质 1 : 非频繁项集 的 超集 一定是 非频繁的 ;

超集 就是 包含 该集合的集合 ;

项集

X

是 非频繁项集 ,

项集

Y

是 项集

X

的超集 ,

( 使用集合表示 :

, 项集

包含 项集

, 并且 项集

不为空集 )

则 项集

一定是 非频繁的 ;

举例 :

数据集

为 :

事物编号

事物 ( 商品 )

001 001 001

奶粉 , 莴苣

002 002 002

莴苣 , 尿布 , 啤酒 , 甜菜

003 003 003

奶粉 , 尿布 , 啤酒 , 橙汁

004 004 004

奶粉 , 莴苣 , 尿布 , 啤酒

005 005 005

奶粉 , 莴苣 , 尿布 , 橙汁

奶粉 , 莴苣

莴苣 , 尿布 , 啤酒 , 甜菜

奶粉 , 尿布 , 啤酒 , 橙汁

奶粉 , 莴苣 , 尿布 , 啤酒

奶粉 , 莴苣 , 尿布 , 橙汁

项集

项集

上述

就是

的 超集 ,

项集

其支持度是

, 小于最小支持度

, 是 非频繁项集

那么

也是 非频繁项集 ;

在具体算法中会使用该性质 , 用于进行 “剪枝” 操作 ;

计算支持度时 , 按照

项集 支持度 ,

项集 支持度 ,

顺序进行计算 ,

如果发现

项集 中有 非频繁项集 , 则包含该

项集的

项集 肯定是 非频繁项集 ;

然后使用 频繁

项集 组合成

项集 , 然后再计算这些

项集是否是频繁项集 ;

“剪枝” 操作 减少了不必要的计算量 ;

二、 频繁项集子集性质


频繁项集 的 所有非空子集 , 一定是 频繁项集 ;

项集

是 频繁项集 ,

项集

是 项集

的超集 ,

( 使用集合表示 :

, 项集

包含 项集

, 并且 项集

不为空集 )

则 项集

一定是 频繁的 ;

举例 :

数据集

为 :

事物编号

事物 ( 商品 )

001 001 001

奶粉 , 莴苣

002 002 002

莴苣 , 尿布 , 啤酒 , 甜菜

003 003 003

奶粉 , 尿布 , 啤酒 , 橙汁

004 004 004

奶粉 , 莴苣 , 尿布 , 啤酒

005 005 005

奶粉 , 莴苣 , 尿布 , 橙汁

奶粉 , 莴苣

莴苣 , 尿布 , 啤酒 , 甜菜

奶粉 , 尿布 , 啤酒 , 橙汁

奶粉 , 莴苣 , 尿布 , 啤酒

奶粉 , 莴苣 , 尿布 , 橙汁

项集

,

项集

项集

其支持度是

, 等于最小支持度

, 是 频繁项集

那么

项集

的子集是

项集

,

,

根据上述性质 ,

项集

,

都是 频繁项集 ;

三、 项集与超集支持度性质


任意一个 项集 的 支持度 , 都 大于等于 其 超集 支持度 ;

超集 就是 包含 该集合的集合 ;

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-11-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
文章目录 一、 Apriori 算法过程 二、 Apriori 算法示例 参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 ) 【数据挖掘】关联规则挖掘 Aprior
韩曙亮
2023/03/28
1.3K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
支持度 表示 数据项 ( Item ) 在 事务 ( Transaction ) 中的 出现频度 ;
韩曙亮
2023/03/28
1.3K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
文章目录 一、 置信度 二、 置信度 示例 参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 ) 一、 置信度 ---- 关联规则 \rm X \Rightarrow Y 的置信度 , 表示 数据集 \rm D 中包含 \rm X 项
韩曙亮
2023/03/28
8090
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
如 : 购买商品时 , 啤酒 与 尿布 就有关联关系 , 这两个之间肯定没有因果关系 , 有一种未知的关联关系 ;
韩曙亮
2023/03/28
1.1K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
文章目录 一、 频繁项集 二、 非频繁项集 三、 强关联规则 四、 弱关联规则 五、 发现关联规则 参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 ) 【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 ) 一、 频繁项
韩曙亮
2023/03/28
2K0
数据挖掘实战:关联规则挖掘及Apriori实现购物推荐
糖豆贴心提醒,本文阅读时间4分钟 这篇文章主要介绍三个知识: 1.关联规则挖掘概念及实现过程; 2.Apriori算法挖掘频繁项集; 3.Python实现关联规则挖掘及置信度、支持度计算。 希望这篇文章对你有所帮助,尤其是刚刚接触数据挖掘以及大数据的同学,这些基础知识真的非常重要。如果文章中存在不足或错误的地方,还请海涵~ 一. 关联规则挖掘概念及实现过程 1.关联规则 关联规则(Association Rules)是反映一个事物与其他事物之间的相互依存性和关联性,如果两个或多个事物之
小小科
2018/05/02
3.2K0
数据挖掘实战:关联规则挖掘及Apriori实现购物推荐
数据挖掘|关联规则Apriori算法
01 — 关联规则挖掘背景和基本概念 如下所示的数据集,表中的每一行代表一次购买清单,注意我们只关心记录出现与否,不关心某条记录购买了几次,如购买十盒牛奶也只计一次。 数据记录的所有项的集合称为总
double
2018/04/02
1.6K0
数据挖掘|关联规则Apriori算法
数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法
 我计划整理数据挖掘的基本概念和算法,包括关联规则挖掘、分类、聚类的常用算法,敬请期待。今天讲的是关联规则挖掘的最基本的知识。  关联规则挖掘在电商、零售、大气物理、生物医学已经有了广泛的应用,本篇文章将介绍一些基本知识和Aprori算法。  啤酒与尿布的故事已经成为了关联规则挖掘的经典案例,还有人专门出了一本书《啤酒与尿布》,虽然说这个故事是哈弗商学院杜撰出来的,但确实能很好的解释关联规则挖掘的原理。我们这里以一个超市购物篮迷你数据集来解释关联规则挖掘的基本概念: TIDItemsT1{牛奶,面包}T2{
小莹莹
2018/04/23
1.5K0
数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法
【数据挖掘】数据挖掘总结 ( 模式挖掘 | Apriori 算法 | 支持度 | 置信度 | 关联规则 ) ★★
参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
韩曙亮
2023/03/28
8150
【数据挖掘】数据挖掘总结 ( 模式挖掘 | Apriori 算法 | 支持度 | 置信度 | 关联规则 ) ★★
机器学习算法:关联规则分析
今天给大家分享一个经典的机器学习算法:关联规则分析,从理论到代码到实战,全部拉满。
皮大大
2022/04/18
2K0
机器学习算法:关联规则分析
机器学习算法-关联规则分析
关联分析是一种从大规模的数据集中寻找有趣关系的方法。一个经常被用到关联分析的例子:购物篮分析。通过查看哪些商品经常在一起被顾客购买,可以帮助商店去了解用户的购买行为。
皮大大
2023/08/23
4380
数据挖掘十大算法之Apriori算法「建议收藏」
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, CART
全栈程序员站长
2022/08/14
9040
数据挖掘十大算法之Apriori算法「建议收藏」
关联分析(一):频繁项集及规则产生【转载】
关联分析用于发现隐藏在大型数据集中有意义的联系,属于模式挖掘分析方法,其为人熟知的经典应用当属沃尔玛超市里“啤酒与尿布”的关系挖掘了。关联分析的应用领域非常多,当数据集类型比较复杂时,进行关联分析采用的手段也相对复杂,本篇从最简单的事务数据集着手,对关联分析进行解读。对大型事务数据集进行关联分析时,有两个问题要考虑:
用户6021899
2019/10/23
2.7K0
关联分析(一):频繁项集及规则产生【转载】
MADlib——基于SQL的数据挖掘解决方案(27)——关联规则之Apriori算法
数据仓库或数据挖掘从业者一定对“啤酒与尿布”的故事不会陌生。这就是一个使用关联规则的经典案例。根据对超市顾客购买行为的数据挖掘发现,男顾客经常一起购买啤酒和尿布,于是经理决定将啤酒与尿布放置在一起,让顾客很容易在货架上看到,从而使销售额大幅度增长。关联规则挖掘在多个领域得到了广泛应用,包括互联网数据分析、生物工程、电信和保险业的错误校验等。本篇将介绍关联规则方法、Apriori算法和MADlib的Apriori相关函数。之后我们用一个示例说明如何使用MADlib的Apriori函数发现关联规则。
用户1148526
2019/05/25
1.3K0
Apriori 算法-如何进行关联规则挖掘
据说,在美国西部的一家连锁超市发现,很多男人会在周四购买尿布和啤酒。这样超市就可以将尿布与啤酒放在一起卖,便可以增加销售量。
huofo
2022/03/18
7590
Apriori 算法-如何进行关联规则挖掘
HAWQ + MADlib 玩转数据挖掘之(七)——关联规则方法之Apriori算法
用户1148526
2018/01/03
1.6K0
HAWQ + MADlib 玩转数据挖掘之(七)——关联规则方法之Apriori算法
数据挖掘系列(2)--关联规则FpGrowth算法
上一篇数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法介绍了关联规则挖掘的一些基本概念和经典的Apriori算法,Aprori算法利用频繁集的两个特性,过滤了很多无关的集合,效率提高不少,但是我们发现Apriori算法是一个候选消除算法,每一次消除都需要扫描一次所有数据记录,造成整个算法在面临大数据集时显得无能为力。今天我们介绍一个新的算法挖掘频繁项集,效率比Aprori算法高很多。   FpGrowth算法通过构造一个树结构来压缩数据记录,使得挖掘频繁项集只需要扫描两次数据记录,而且该算法不需要生
小莹莹
2018/04/23
1.2K0
数据挖掘系列(2)--关联规则FpGrowth算法
关联规则挖掘算法
关联规则挖掘是一种基于规则的机器学习算法,该算法可以在大数据库中发现感兴趣的关系。它的目的是利用一些度量指标来分辨数据库中存在的强规则。也即是说关联规则挖掘是用于知识发现,而非预测,所以是属于无监督的机器学习方法。 “尿布与啤酒”是一个典型的关联规则挖掘的例子,沃尔玛为了能够准确了解顾客在其门店的购买习惯,对其顾客的购物行为进行购物篮分析,想知道顾客经常一起购买的商品有哪些。沃尔玛利用所有用户的历史购物信息来进行挖掘分析,一个意外的发现是:"跟尿布一起购买最多的商品竟是啤酒! 关联规则挖掘算法不仅被应用于购
用户1332428
2018/03/08
1.6K0
关联规则挖掘算法
从啤酒与尿布到关联规则
传说二十世纪90年代,美国沃尔玛超市的销售管理人员在分析销售订单时发现,啤酒与尿布这两件看起来毫不关联的商品竟然经常会出现在同一个订单中。后来跟踪调查发现,原来美国的年轻夫妇一般在周五晚上妻子会安排丈夫去超市购买尿布,而丈夫在购买尿布时总会忍不住顺便给自己买上几罐啤酒,这就是为什么啤酒和尿布这两件看起来毫不关联的商品经常会出现在同一个购物篮中。这个故事至今仍是大数据挖掘中津津乐道的经典案例。因为它揭示了数据中两个事物之间的关联性问题,也就是我们今天也重点介绍的——关联规则(分析)。
用户7569543
2020/07/17
1.2K0
关联规则挖掘:Apriori算法的深度探讨
Apriori算法是一种用于挖掘数据集中频繁项集的算法,进而用于生成关联规则。这种算法在数据挖掘、机器学习、市场篮子分析等多个领域都有广泛的应用。
TechLead
2023/10/21
1.1K0
关联规则挖掘:Apriori算法的深度探讨
推荐阅读
【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
1.3K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则 | 数据项支持度 | 关联规则支持度 )
1.3K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )
8090
【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Item 概念 | 项集 Item Set | 频繁项集 | 示例解析 )
1.1K0
【数据挖掘】关联规则挖掘 Apriori 算法 ( 频繁项集 | 非频繁项集 | 强关联规则 | 弱关联规则 | 发现关联规则 )
2K0
数据挖掘实战:关联规则挖掘及Apriori实现购物推荐
3.2K0
数据挖掘|关联规则Apriori算法
1.6K0
数据挖掘系列(1)关联规则挖掘基本概念与Aprior算法
1.5K0
【数据挖掘】数据挖掘总结 ( 模式挖掘 | Apriori 算法 | 支持度 | 置信度 | 关联规则 ) ★★
8150
机器学习算法:关联规则分析
2K0
机器学习算法-关联规则分析
4380
数据挖掘十大算法之Apriori算法「建议收藏」
9040
关联分析(一):频繁项集及规则产生【转载】
2.7K0
MADlib——基于SQL的数据挖掘解决方案(27)——关联规则之Apriori算法
1.3K0
Apriori 算法-如何进行关联规则挖掘
7590
HAWQ + MADlib 玩转数据挖掘之(七)——关联规则方法之Apriori算法
1.6K0
数据挖掘系列(2)--关联规则FpGrowth算法
1.2K0
关联规则挖掘算法
1.6K0
从啤酒与尿布到关联规则
1.2K0
关联规则挖掘:Apriori算法的深度探讨
1.1K0
相关推荐
【数据挖掘】关联规则挖掘 Apriori 算法 ( Apriori 算法过程 | Apriori 算法示例 )
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文