温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
啊,其实我们刚才所说的这种啊,主要是打通一下H跟哈,它的一个数据的一个关联性嘛,那这种应用场景相对来说少一点,少一点就是说你要做分析了,你已经知道你要做分析了,你还建一个什么管理表,这没有意义,对吧,能感觉到吗?而且还非要通过什么音色这种方式来导入,那在公司当中应用的最广的是哪个,说我们第二个要讲的那是什么情况呢?就是说H当中它已经存在表了,就是说这个数据已经放大了,你想想看,公司当中做任何公司啊。要做大数据分析的时候,他一定是先有数据,然后再想对这个数据进行分析,对不对。就类似于还有当时讲的你的一个建外部表,是不是你可以不动当时数据的位置啊,你通过location来指定这个数据的位置,哎,这种需求能多一点,那have跟H的关联呢,也是我们第二种需求多一点,就是我H这张表。已经存在了,而且里边已经有现成的数据了,现在我要对这个数据进行分析,你是不是可以通过MR把它读出来,然后做,对吧,还是第二个用这个have,因为它可以关联,用have写have来分析吧,也就是说第二种方式呢,就是已经存在的表,我们要建一个have当中的表。
01:17
给它关联起来,而不是说两张表同时建,而不是说两张表同时建,啊不是这个需求,那我们看一下。那此时就是说HB当中已经存储了一张表,这张表就是我们刚才。创建一张表啊,而且也有已经有数据了啊,已经有数据了,接下来我们要干一个什么呢?在have当中创建一个外部表。啊,为什么创外部表,因为你已经存在数据,是不是可能有其他的人也来用了,你创内部表,假如说你不想你分析完了,你把这个表删了,他是把数据上来啊,这样不太好对吧?啊所以说建的是外部表,外部表,然后呢,主动的去关联这张表。关联这张表,然后呢,是通过have来分析啊,这种需求在工作当中一定是比刚才那个要多的啊,不是说两张表同时建立起来的啊,这种需求要多很多吧,OK,同样的,它也有一定的介表语法,CTRLC来看一下。
02:10
像这种都是固定写法,固定写法他现在创建的这个。Ex,外部表啊啊,创建一张外部表,然后表明这个表刚才我们没有了,它当中是没有的,字段都在这,然后你看这。跟刚才是不是一样的呀,对吧,跟刚才一样的,也就是说咱们可以创建表的时候,那两张表没有,他都会创建,如果说SP当中这张表有了,他就会主动去关联这张表,关联这张表来我们做一下C。在这了,走。然后我们说。刚才关联表啊,我们直接对查询看数据吧,谁新。
03:03
照样能查觉到数据嘛,啊,这个需求肯定是用了更多一点的,因为你做任何分析的时候,你肯定有先有数据,然后才想着数据量到达一定程度之后,你才想着对它进行分析了,来提取一些你想要的东西,对不对啊,也就是说还是被此当中呢已经存在数据,然后呢,我们再去建立一个have当中的一个关联表,来帮他做分析,来帮他做分析,那这一块其实两种方式,你看它这个建表语句有差别吗?没有任何差别吧,只不过说H倍则当中这个表存在了,那我们建立的就是一个关联表,然后直接可以物流到数据,如果说不存在,那两个表同时进啊,两个表同时键,所有的语句都是一样的啊,所有的语句都是一样的啊,用的具体的类啊,然后还有一个映射,还有个映射你要注意这里面要注意这个点就是这地方是固定写法。啊,就是冒号K,就指明的是他的一个r key,你不要想着好像随便取个名字啊,这不是名字,因为后面都是名字吧,都是列的一个名字,这个地方可不是rookie的一个名字,这个地方是固定写法,叫冒号k Mo OK。
我来说两句