前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关联规则 Apriori算法原理

关联规则 Apriori算法原理

作者头像
小小程序员
发布2023-12-18 12:24:14
2090
发布2023-12-18 12:24:14
举报
文章被收录于专栏:小小程序员——DATA

Apriori算法

算法概述

Apriori算法利用频繁项集生成关联规则。它基于频繁项集的子集也必须是频繁项集的概念频繁项集是支持值大于阈值 (support) 的项集

  • Apriori算法就是基于一个先验如果某个项集是频繁的,那么它的所有子集也是频繁的

算法流程

输入: 数据集合D,支持度闯值a 输出: 最大的频繁k项集 1)扫描整个数据集,得到所有出现过的数据,作为候选频繁1项集。k=1,频繁0项集为空集。 2) 挖掘频繁k项集

  • a)扫描数据计算候选频繁k项集的支持度
  • b)去除候选频繁k项集中支持度低于闻值的数据集,得到频繁k项集。如果得到的频繁k项集为空,则直接返回频繁k-1项集的集合作为算法结果,算法结束。如果得到的频繁k项集只有一项,则直接返回频繁k项集的集合作为算法结果,算法结束。
  • c 基于频繁k项集,连接生成候选频繁k+1项集。 3) 令k=k+1,转入步骤2。

算法案例

在这里插入图片描述
在这里插入图片描述

输入:

在这里插入图片描述
在这里插入图片描述

输出:

在这里插入图片描述
在这里插入图片描述

算法缺点

  • Apriori 在计算的过程中有以下几个缺点可能产生大量的候选集。因为采用排列组合的方式,把可能的项集都组合出来了;每次计算都需要重新扫描数据集,来计算每个项集的支持度
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2023-12-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Apriori算法
    • 算法概述
      • 算法流程
        • 算法缺点
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档