温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
咱现在呢,看一下这个商品个数信息,这个需求,呃,商品个数信息呢,已经其实现在已经进入到商品主题了,对吧?啊一到商品主题了,都是跟商品相关的统计啊好,那现在呢,我们看第一个这个商品个数信息啊。那商品个人信息里边呢,我们只有俩字段啊,是俩字段,那一个字段呢,是DTDT就是统计的日期嘛,啊,然后后边大家要知道我们能够表示商品的这个字段呢,我们其实有两,呃,我们一个叫做SKU,一个叫做s po,对不对,那那所以说在这儿呢,我们统计的商品个数信息呢,我们统计了两个啊,一个是SKU,一个是s puu的个数啊,然后统计这俩字段呢,大家一会可以琢磨琢磨,我们去哪求是比较好的。啊,然后再一个呢,我们去统计这个的时候呢,可能会涉及到一些关于驱虫的操作啊,可能会涉及到一些关于驱虫的操作啊,那如果有类似的操作,大家应该得注意一下啊,就是尽量不去使用谁呀。
01:01
Distinct的对不对啊,因为之前给大家解释过啊,就是我们还有当中这个是不是distinct去重的时候,它肯定它是怎么做的,底层执行逻辑,它会把所有的数据是不是最终写到一个reduce对不对,那这样一来这个reduce它的这个压力会比较大啊,那一一般情况咱们去中怎么做呀啊用BY或者是用谁。开窗加那个,呃,Rank的方式是不是去驱虫啊,也有这种方式啊,那在这呢,我们可能会涉及到一些驱虫相关的操作,到时候大家需要把这个小点注意到啊,啊这个需求很简单啊,行,那咱们现在呢,先布置这仨,这三个需求比较简单,咱们不会给太长时间啊,也就一节课吧,啊,一节课大家应该差不多能完成啊好,然后我们把这个讲了,讲了之后再把下边的部骤部署部署了啊,咱们后续再说啊好,我把视频录一下。
我来说两句