前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何分析交易记录?

如何分析交易记录?

原创
作者头像
猴子数据分析
修改2020-09-22 10:25:50
7040
修改2020-09-22 10:25:50
举报
文章被收录于专栏:猴子数据分析猴子数据分析

【题目】

某商场为了分析用户购买渠道。表1是用户交易记录表,记录了用户id、交易日期、交易类型和交易金额。

表2是用户类型表,记录了用户支付类型(微信、支付宝、信用卡等),分别有type1、type2。

要求:

1.请在 type1的用户类型中,找出总交易金额最大的用户。

2.筛选每个用户的第2笔交易记录。

3.如下表:如何实现表3的数据格式?

4.两表做关联时,其中一张表的关联键有大量的null值会造成什么影响?如何规避?

【解题思路】

1.type1的用户类型中,找出单用户的总交易金额最大的一位用户?

我们先来把这个业务需求翻译成大白话:

代码语言:javascript
复制
1)表中的字段要有用户类型、交易金额、用户id

2)“单用户的总交易金额”是指每种类型用户的总交易金额

3)找出用户类型=type1,总交易金额最大的用户

1)表中的字段要有用户类型、交易金额、用户id

交易金额、用户id在用户交易记录表中,用户类型在用户类型表中,涉及到两个表的字段,所以需要进行多表联结。

观察两个表,得知两表的相同字段为用户id ,所以通过用户id联结两张表。

使用哪种联结呢?拿出《猴子 从零学会SQL》里面的多表联结图。

因为后面要分析“每种类型用户的总交易金额”,所以保留左表(用户交易记录表)中的全部用户数据。

代码语言:javascript
复制

1 select 用户交易记录表.* ,用户类型表.用户类型
2 from 用户交易记录表
3 left join 用户类型表
4 on 用户交易记录表.用户id=用户类型表.用户id;

查询结果:

2)每种类型用户的总交易金额

当有“每个”出现的时候,要想到《猴子 从零学会SQL》中讲过的用分组汇总来实现该业务问题。

根据各用户类型、用户id分组 (group by),统计每个用户数总费用(求和函数sum)

代码语言:javascript
复制

1 select 用户交易记录表.*,用户类型表.用户类型,
2       sum(用户交易记录表.交易金额) as 总金额
3 from 用户交易记录表
4 left join 用户类型表
5 on 用户交易记录表.用户id=用户类型表.用户id
6 group by 用户类型表.用户类型,用户交易记录表.用户id;

查询结果:

3)找出用户类型=type1,总交易金额最大的用户

用where 筛选用户类型=type1的用户,按照总金额降序排序(order by decs),找出的第一行(limit 1)记录即为交易金额最大的用户。

代码语言:javascript
复制

1 select 用户类型表.用户类型,  用户交易记录表.用户id,
2       sum(用户交易记录表.交易金额) as 总金额
3 from 用户交易记录表
4 left join 用户类型表
5 on  用户交易记录表.用户id  = 用户类型表.用户id
6 where 用户类型表.用户类型  =  'type1'
7 group by 用户类型表.用户类型,  用户交易记录表.用户id
8 order by 总金额 desc  limit 1;

查询结果:

2.筛选每个用户的第2笔交易记录?

1)题目要求查询“每个用户”,当每个出现的时候,就要想到分组汇总(group by或者窗口函数的partiotion  by)。

2)第2笔交易记录,是指按照交易时间对每个用户的交易记录进行排名,然后取出排名第2的数据。

又涉及到分组,又涉及到排名的问题,要想到用《猴子 从零学会SQL》里讲过的窗口函数来实现。

所以使用分组(窗口函数partiotion by 用户id),并按最后交易时间升序排列(order by交易时间 asc),套入窗口函数的语法,得出下面的sql语句:

代码语言:javascript
复制

1 select 用户交易记录表.*,
2        row_number() over(partition by 用户交易记录表.用户id 
3                          order by 用户交易记录表.交易日期 asc) as 交易笔数
4 from 用户交易记录表;

查询结果:

2)用where 筛选出每个用户的第2条记录,就是每个用户的第2笔交易记录

代码语言:javascript
复制

1 select * from
2 (select 用户交易记录表.*,
3 row_number() over(
4                 partition by 用户交易记录表.用户id 
5                 order  by 用户交易记录表.交易日期 asc ) as 交易笔数
6 from 用户交易记录表) as a
7 where 交易笔数=2;

查询结果:

3.如下表:如何实现表3的数据格式?

题目要求将同一用户、不用的交易时间和交易类型多行合并为一行,用group_concat函数可解决。

sql入下:

代码语言:javascript
复制
1 select 用户id,
2 group_concat(交易日期), group_concat(交易类型) 
3 from 用户交易记录表
4 group by 用户id;

4.两表做关联时,其中一张表的关联键有大量的null值会造成什么影响?如何规避?

因为在关联表中的全部数据不一定在另一张表都匹配,这样没有匹配到的话就会出现null,避免出现表连接出现null值,只要在表关联时加一个where条件进行判断(not null ),具体见下图

【本题考点】

1.如何将复杂的业务问题,使用多维度拆解分析方法,翻译成大白话的能力。

2.遇到排名问题,要想到使用窗口函数来实现。

3.多表联结各个情况如何去实现?把上图看懂就可以解决99%的多表联结问题了。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档