啤酒与尿布的故事

这是一个很老但很有意思的故事

我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒与尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢?

原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。商家通过对一年多的原始交易记录进行详细的分析,发现了这对神奇的组合。于是就毫不犹豫地将尿布与啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。“啤酒与尿布”的故事一度是营销界的神话。

那么问题来了,商家是如何发现啤酒与尿布两者之间的关联性呢?

这里就用到了数据挖掘的技术,准确的说是数据挖掘中的关联规则挖掘。大致意思就是从大量数据中找出某两个对象(暂且称为X, Y)的关联性。

确定X, Y的关联性,需要用两个指标来衡量:

  • 支持度
  • 置信度

支持度

在数据库中,同时包含X 和Y的百比,比如s%。

支持度定义了对象在整个数据库中所占的比例。

置信度

在包含X的情况下,包含Y的百分比,比如c%。

置信度定义了发现规则的强度。

关联规则也就可以表示为X=>Y(s%, c%)。

如果不考虑关联规则的支持度和置信度,那么在数据库中存在着无穷多的关联规则。事实上,人们一般只对满足一定的支持度和置信度的关联规则感兴趣。

因为对于支持度和置信度太低的关联规则基本没有什么使用价值。

这里就需要给定两个阈值:

  • 最小支持度: 它表示了一组物品集在统计意义上需要满足的最低程度。
  • 最小可信度 它反映了关联规则的最低可靠程度。

同时满足最小可信度阈值和最小支持度阈值的关联规则被称为强关联规则。比如啤酒与尿布。

回到啤酒与尿布的故事,在这里我们假设支持度阈值为50%,可信度阈值为70%。那么它就表示:同时购买尿布和啤酒的顾客占全部顾客的50%;在购买尿布的顾客中,有70%的顾客同时会买啤酒。

因此,在商品摆放时。应该将啤酒和尿布放在一起。

晚安,各位。

本文分享自微信公众号 - 小白客(youcoding)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏吴生的专栏

30多条mysql数据库优化方法,千万级数据库记录查询轻松解决

1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。

474100
来自专栏漏斗社区

确认过眼神,ZZCMS 8.2 任意文件删除是你想要的

0x00 背景 本周,将zzcms8.2的源码的GetShell方法与大家一同分享,在上周有说过这个CMS比较适合新手或想要入坑PHP代码审计的同学练手,所以分...

39780
来自专栏Linyb极客之路

linux常用基本命令之文件搜索命令

命令:find 语法:find [搜索范围路径] -name 【文件名称】(根据文件名查找) find [搜索范围路径] -size [...

42260
来自专栏云计算D1net

云应用程序很慢?原因在应用,而不是云

上午7点,你早早地赶到办公室,希望在没有他人访问公司公有云的时候,库存应用程序能做好更改的准备。然而,即使早上这段时间只有少量的用户在线,应用的性能仍然乏善可陈...

33050
来自专栏Linyb极客之路

并发编程之Semaphore

一、简介 Semaphore(信号量)是用来控制同时访问特定资源的线程数量,它通过协调各个线程,以保证合理的使用公共资源。很多年以来,我都觉得从字面上很难理解...

43680
来自专栏Linyb极客之路

redis主从复制简介

一. Redis主从复制简介 Redis支持将数据同步到多台从库上,这种特性对提高读取性能非常有益。 1) master可以有多个 slave。 2) 除了多...

441100
来自专栏量子位

不会SQL?没关系,以后动动嘴就能查询数据库了 | 附论文

陈桦 编译整理 量子位 出品 | 公众号 QbitAI ? 在编程世界里,SQL非常简单。然而,这种语言仍有一定的学习难度,导致许多人无法与关系数据库进行交互。...

36690
来自专栏Golang语言社区

如何跨服务器复制表中数据

不同服务器数据库之间的数据操作 不同数据库之间复制表的数据的方法: 当表目标表存在时: insert into 目的数据库..表 select * from ...

55690
来自专栏Golang语言社区

MySQL 读写分离

一 什么是读写分离 MySQL Proxy最强大的一项功能是实现“读写分离(Read/Write Splitting)”。基本的原理是让主数据库处理事务性查询...

1.2K60
来自专栏Golang语言社区

Redis之并发写入

首先需要澄清一个事实:redis服务端是单线程处理客户端请求,也就是说客户端请求在服务端是串行化执行的,因此对服务端来说,并不存在并发问题。但业务方却存在并发操...

82370

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励