00:00
还有几个新的函数来看一下啊,他说查询顾客上一次的购买时间。满时间,那这是什么意思呢?是这样。你这个来看这个表吧。看这个表,这个不是每一个顾客嘛,他按照顾客进行分区了是吧,然后按照时间进行排序了,这个窗口肯定要这样做的好,接下来他干个什么事。他的意思是说这个订单啊。这个订单要在后面这个就不打印上了,打印的是什么。打印的是这条数据。2017杠零一。一是这个意思。上一次的查询时间,上一次购买时间嘛,就是说每一个数据后面都需要跟一个上一次的购买时间。那我们知道那第三条数据其实就跟着0105吧,哎,他是要这个需求。要这个需求啊,那这个怎么做呢,是这样。
01:03
这地方那里边怎么写,知道了吧。分区排序是吧,啊分区排序那肯定要有的。然后是这个。往前递多少行数据?Like是往前它不要上一条吗?那你这个地方填一个什么or一个一。塔这个一,哎,它就能表示上一条。时间在哪?好,那我们做一下啊,这个地方select星可以吧,好select新之后啊,它要一个那。然后这里边填的是高date,然后要一个什么一是吧,上一条嘛,那个是上一条,还有一个lead是往后,哎,你可以查看下一次订单是什么时间。什么时间好,然后是什么。
02:03
指明是哪个窗口下的吧,指明哪个窗口下的,那这个窗口里边其实就是distribu的。By name,因为你想想看,查询顾客上一次购买时间,你肯定是针对于同一个顾客来说的呀,你不同的顾客,你说他。我在这边买东西呢,我我查看一下什么。杨瑞,上一次购买时间没有什么意义是吧,你肯定是他自己的是不是啊,那你叫name,然后加一个。说到半。说的干什么?All the date吧,哎,它的一个时间,哎时间一排序,那你这个就能准确的找到上一条是什么,哎,准确的你肯定按时间排序的,之后你才能准确的定位到上一条,上一条好,这是冲完数,然后是from,然后B你的这张表吧。那我们看一下。
03:03
走一下。限定了一个窗口,这个窗口就已经很比较熟了。其实就是这个distribute by name决定的。啊,这是一个分区,它分成了。按名字来分区,按名字来分区。好,来看一下,这是一类数据。第一条。为闹。因为1月1号他前面没有订单了吧,啊,没有订单了,所以他找不到啊,给他一个闹,那后面的每条你看啊,1月5号他是不是上一条1月1号啊啊,然后1月8号这条是往上1月5号吧,然后2月3号他是1月8号,然后4月6号是2月3号,是这样的,他可找到下一条,其实这个函数在电商。
04:00
公司应用的还是特别多的,你想想看,这个更多的时候介绍公司一般面试题会出一个这种题目。他让你给你一个日志表格,这个日志表格是什么呢?就是某一个用户点进来之后,他的一个页面跳转情况。就是这样的啊,它也是按照时间就说它里边假如说有五个页面可以吧,12345。五个页面啊,123458,然后假如说四是最终的他的一个什么支付页面,然后假如说五它的一个订单页面可以吧,你不是订单,然后跳转到你去支付吗。正常的他传给你的原始日志啊,肯定是这种形式啊,肯定是这样的,首先有你的一个ID,唯一ID吧,咱们京东有个京东账号是吧?好,第二个有你点击的时间,这肯定有吧,它日志里面肯定要带时间的。然后后面还有什么订单金额这些信息,如果有的话肯定要带是吧,肯定要带。
05:01
基本上就是这些内容了,它只有这种数据。他要干什么事,他一定在电商网站当中啊,他一定要分析的一个指标就是页面跳转率。页面跳转率。什么叫页面跳转率?那这五个订单就是电商网站,他期待的数据一定是这样的。首先是登录页面对吧,登录页面,然后你去。查看一下商品的一个大致的一个情况是吧,所有的商品列表是不是这个页面,然后到哪商品的详情页面吧。你把你点到详情页面,然后你去看一看这个商品,然后之后订单嘛,你不是加入购物车吗?加入购物车形成订单,最后是干什么。支付是吧,他肯定想的是这个转化率啊。越高越好啊。
06:01
就是你只要如果说这个转化率为100%的话,那就说明什么情况,只要登录我这个电商网站以后,最后都是付了钱走的,那电商网站是不是很高兴乐意做这种事啊。对吧,但是这个是不可能的是吧,它不可能到100%的,但是它必须要分析的是这个每一个中间的一个跳转率转化情况。他要这个情况干什么用啊。好,举个例子啊,之前有个电商网站是这种情况,他是手机端的APP啊。他是他发现。就电商网站,他不一般的电商都是有自己的一个网页,然后有自己APP是吧,而且APP后厨他APP啊,他就发现了一个什么事情呢,就是这个之间那个转化率特别低,就很多人下了订单以后支付的特别少。支付的特别少,他是完全也是根据这种页面跳转分析出来的,他他找到他开始呈现的情况是什么。
07:09
就是说在APP上最终支付的人特别少,就是销售额特别低,他根据这个情况,然后具体的分析这中间每一个跳转率。每一个跳转率,他最后发现问题是出在这儿。啊,就定位到这了,分析它一个跳转率,因为它可以跟他什么网页那个转化率相比啊,哎,对比的来看,他发现这个初级的低,最后找的原因是它的一个支付按钮不显眼的位置。啊,就是那个页面设计的不合理。他是从最开始的什么,就是支付的情况特别少,然后呢,分析跳转率,然后找到了具体的原因所在吧,所以说电商网站它这种跳转率一定要分析的,一定要分析的。啊,它这里边就用到咱们刚才所用的那个函数。因为你要分析跳转率,你是不是把每个页面,你这个人是不是一个唯一标识的一个ID啊,然后他点了页面是不是有时间顺序啊,按时间一排序。
08:10
然后。你是不是有什么页面啊,第一个页面一般进来的是什么index.html啊是吧,然后你要看它下一个时间跳转到哪了,再下一个跳转到哪了。然后你把这个数据做一块规范分析啊,来分析它的一个跳转率。他正常的从后台传过来日志,他不可能是给你传过来的,是这样这样一条日志。它只会传递的是什么?这么多信息,然后你需要自己把它上一跳页面是什么给他找出来,然后再分析它的一个跳转率,而且在你要是去电商公司面试的话,这个题目问的还是比较多的,就是让你,哎给你一张表啊,这个表呢,就是刚才我们所说的,哎,他有时间。他用每个页面HTML.index.html然后什么O的点HTML等等页面,然后他要你做什么,结果呢就是。
09:09
每一跳,哎,他下一跳是在哪,上一跳是在哪。上一条是在哪啊,那我们做一下这个需求啊,就是上下跳都要是吧,上下跳都要那就简单了,怎么做啊,那后面再加一个列吧。把这个不同的面给它分开,然后加一个逗号,那这个地方是L。Ead吧,来。在这led表示的是往后第几行,往后第条那下一跳的话就是。还是一样的,这个东西全部拿过来,是不是这个东西都一样,只不过说这个函数不一样,来我们看一下这个数据。这个那跟这个力的这个函数就能帮助你完成电商网站分析当中的什么。哎,他们的一个跳转率,就是他们不同页面之间的跳转问题,转换问题,能找到下一上一跳,你当前这个页面是从哪个页面跳出来的,然后它下一跳跳到哪去了,是从哪个页面离开的最多啊,你要分析这个问题。
10:15
这个看起来就不舒服了是吧,因为他中间有一个换行,换行那首先看啊,这个是一条数据吧,上一条是没有的,因为它是第一条,然后下一跳是零五吧,这样你就可以来帮助你分析它的前后的关系是什么啊,前后的关系是什么。好,这是我们所讲的这个需求是吧,上一次购买的时间,购买时间。
我来说两句