MMD_2c_FrequentItemsets

The market-basket model

主要术语

items: things sold in supermarket buskets:each of which is s small set of items support:s, it means at least s baskets which contain sets of items(frequent items) in all baskets. confidence: (i,j) –> (i,j,k).后者比上前者的概率,可以认为是前者发生后后者发生的条件概率。

应用

规模

  • WalMart有100,000种商品,有1000,000,000个篮子。
  • Web有billion级的单词,有billion级的页面。

baskets 不能包含太多的items,因为每个basket的时间与其包含的item是quadratic的

Association Rules

概述

思路

  1. 先找满足概率大于cs的频繁项集C1
  2. 在从C1中删减元素E,使得删减后的集合C2满足概率大于s的要求
  3. 那么,C2->E就是一项满足支持度s与可信度c的规则

核心问题

如果找到满足概率大于p的所有频繁项集呢?

A:对每一个bucket遍历所有可能的pair。

思路: 1. 需要的频繁项集不会太多,所以一般专注于最容易出现的二项集合。 2. 注意单个basket不能有太多的item,否则算法对于单个basket的迭代时间是quartic的,但是可以有很多个basket。

计算模型

数据形式

IO分析

内存分析

算法

专注于二项集

Naive Algorithm

内存计数的两种形式

(i,j,n)的计数方式 还有(n)的计数方式

A-Prior Algorithm

monotonicity of frequent

sets only can be frequent only if the subsets are frequent.

So, at first, we find frequent items in 1, then find pairs in 2 using the information before.

Algo Intro

概述

图形

延伸到k

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏转载gongluck的CSDN博客

cocos2dx 打灰机

#include "GamePlane.h" #include "PlaneSprite.h" #include "BulletNode.h" #include...

7206
来自专栏我和未来有约会

Silverlight第三方控件专题

这里我收集整理了目前网上silverlight第三方控件的专题,若果有所遗漏请告知我一下。 名称 简介 截图 telerik 商 RadC...

4395
来自专栏张善友的专栏

Miguel de Icaza 细说 Mix 07大会上的Silverlight和DLR

Mono之父Miguel de Icaza 详细报道微软Mix 07大会上的Silverlight和DLR ,上面还谈到了Mono and Silverligh...

2997
来自专栏大内老A

The .NET of Tomorrow

Ed Charbeneau(http://developer.telerik.com/featured/the-net-of-tomorrow/) Exciti...

38610
来自专栏一个会写诗的程序员的博客

Spring Reactor 项目核心库Reactor Core

Non-Blocking Reactive Streams Foundation for the JVM both implementing a Reactiv...

2792
来自专栏Ceph对象存储方案

Luminous版本PG 分布调优

Luminous版本开始新增的balancer模块在PG分布优化方面效果非常明显,操作也非常简便,强烈推荐各位在集群上线之前进行这一操作,能够极大的提升整个集群...

3675
来自专栏菩提树下的杨过

Flash/Flex学习笔记(23):运动学原理

先写一个公用的小球类Ball: package{ import flash.display.Sprite; //小球 类 public class B...

27310
来自专栏一个爱瞎折腾的程序猿

sqlserver使用存储过程跟踪SQL

USE [master] GO /****** Object: StoredProcedure [dbo].[sp_perfworkload_trace_s...

2870
来自专栏跟着阿笨一起玩NET

c#实现打印功能

3712
来自专栏飞扬的花生

jsencrypt参数前端加密c#解密

      写程序时一般是通过form表单或者ajax方式将参数提交到服务器进行验证,如何防止提交的请求不被抓包后串改,虽然无法说绝对安全却给非法提交提高了难度...

4229

扫码关注云+社区