MMD_2c_FrequentItemsets

The market-basket model

主要术语

items: things sold in supermarket buskets:each of which is s small set of items support:s, it means at least s baskets which contain sets of items(frequent items) in all baskets. confidence: (i,j) –> (i,j,k).后者比上前者的概率,可以认为是前者发生后后者发生的条件概率。

应用

规模

  • WalMart有100,000种商品,有1000,000,000个篮子。
  • Web有billion级的单词,有billion级的页面。

baskets 不能包含太多的items,因为每个basket的时间与其包含的item是quadratic的

Association Rules

概述

思路

  1. 先找满足概率大于cs的频繁项集C1
  2. 在从C1中删减元素E,使得删减后的集合C2满足概率大于s的要求
  3. 那么,C2->E就是一项满足支持度s与可信度c的规则

核心问题

如果找到满足概率大于p的所有频繁项集呢?

A:对每一个bucket遍历所有可能的pair。

思路: 1. 需要的频繁项集不会太多,所以一般专注于最容易出现的二项集合。 2. 注意单个basket不能有太多的item,否则算法对于单个basket的迭代时间是quartic的,但是可以有很多个basket。

计算模型

数据形式

IO分析

内存分析

算法

专注于二项集

Naive Algorithm

内存计数的两种形式

(i,j,n)的计数方式 还有(n)的计数方式

A-Prior Algorithm

monotonicity of frequent

sets only can be frequent only if the subsets are frequent.

So, at first, we find frequent items in 1, then find pairs in 2 using the information before.

Algo Intro

概述

图形

延伸到k

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏落影的专栏

Metal视频处理——绿幕视频合成

绿幕视频合成可以分为两步,首先是把视频读取成视频帧并做好对齐,其次是做两个图像的合成。 首先是从正常视频里面读取一帧图像,如下:

603
来自专栏大学生计算机视觉学习DeepLearning

手指静脉细化算法过程原理解析 以及python实现细化算法

4185
来自专栏天天P图攻城狮

iOS多边形马赛克的实现(上)

马赛克(英语:Mosaic)是镶嵌艺术的音译,原本是指一种装饰艺术,通常使用许多小石块或有色玻璃碎片拼成图案,在教堂中的玻璃艺品,又称为花窗玻璃(stained...

39310
来自专栏申龙斌的程序人生

零基础学编程041:欧拉公式的几何意义

欧拉公式号称是最美的出自上帝之手的数学公式,即 ? ,这个公式里 e 和 π 都是无理数,i 是 -1 的平方根,是一个虚数,0和1是最简单的整数,欧拉公式把...

3819
来自专栏hightopo

电信网络拓扑图自动布局之总线

1104
来自专栏ml

简单的验证码识别(opecv)

       opencv版本: 3.0.0            处理验证码: 纯数字验证码 (颜色不同,有噪音,和带有较多的划痕)             ...

3896
来自专栏逍遥剑客的游戏开发

RenderMonkey在数字图像处理中的应用(续)

1654
来自专栏MelonTeam专栏

图像处理之漫水填充算法(flood fill algorithm)

导语 介绍了漫水填充算法(flood fill algorithm)的基本思想,实现方式和应用场景,OpenCV中floodFill函数的使用方法。 ...

4159
来自专栏Python小屋

一维序列卷积之Python实现

在数字信号处理中经常会用到卷积计算,例如各种滤波器的设计。两个序列的卷积计算大体需要3步: 1)翻转其中一个序列; 2)移动翻转后的序列,并计算每次移动后两个序...

3169
来自专栏wym

《OpenCV 3计算机视觉 Python语言实现》 第七章 利用python_opencv检测人学习笔记

import cv2 import numpy as np def is_inside(o,i): ox,oy,ow,oh=o ix,iy,iw,ih=...

1223

扫码关注云+社区