温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
我们来看第二种使用场景,保留明细数据啊,可能这里就有大家有疑问呢,聚合模型聚合聚合怎么会保留明细呢?啊,其实这个是一个特殊用法,特殊用法呃,这边的建表语句跟刚才啊都一样啊,前面几个字段,然后后面几个value列啊。然后呢,指定的T列为前面这几个啊,一模一样,但是如果你插入的数据。不太一样,哎,我再把这边稍微改一下啊,我改成呃,一批次插入吧。稍等。那我们我这边改完了啊,我们直接来啊,建立一张表。好。这张VISIT2建好了,那接下来我们插入数据啊,插入数据。
01:01
好,插入成功,然后呢,我们来查一下这张表就行了,表明拷贝。来我们看一下啊,插入几行呢?七行啊还是七行1234。O6啊,这里还有一行对吧?啊七行,那我们看最终结果呢,是不是也有七行,那说明什么没有发生聚合呀,为啥呢?为啥没聚合这里你看是不是?原先插入多少条数据,那我查出了还是多少条数据,这不就跟保存的明细一样吗?那为什么没聚合呢?其实上一个案例已经讲过了,他什么情况下才能聚合,是不是所有的T?它是不是所有的T列啊的值都一样,才会认为是同一分组,同一分组才会进行聚合嘛,是不是好,那我们来仔细看一看,唯一可能的是不是这两条啊,你初一看是不是这两条,但你仔细看看啊。
02:06
仔细看看,这里我加了一个什么。Time temper。这一列你虽然ID这一列一样,Date一样,City一样一样,Sex一样,但是我通过添加了一个时间戳这一列啊,精确到秒。那你看这个时间不一样吧。那这几个都是什么?这几个列全部都是K列。但是有其中一列的K,其中一个K列值不一样,那么我认为这两条不属于同一分组,那无法进行聚合,那你看这样我们是不是就实现了类似保存明细的效果是吧?啊就这么一回事,那你同样看这两条,你看ID一样。Date不一样对吧,它是单板不一样,这个一样,这个一样,这个一样啊,前面六列就是我们的K列,你看并不是所有K列是相等,所以它们不是同一分组,不是同一分组就不会进行聚合。
03:05
好。这个就是所谓的保留明细数据啊,也就是说实际应用场景,如果你要让你要注意,如果你把time temper这种字段定义成了K列的话,很可能会达不到你想要的越聚合的结果,这个其实是反向给大家说明,反向说明。所以你要注意了啊,Time STEM这种东西对预计和模型的影响。当然了,也可以是你刻意的要保存明细,但其实你要保存明细还有依据和干啥呢,对不对?
我来说两句