00:00
对吧,这种呢用哪比较少一点,我们刚才说了最多的两种,就是刚才一个漏的一个银色的。啊,这两种方式用的最多的还有一个这个地方。也可以加载数据叫通过,也是建表的时候就直接加载数据的,通过location指定加载数据路径。我们建表语句当中最后一个是不是可以指定location?对吧,OK,那假如说我们指定的location本身就有数据了。那大家想一下能不能查到。就是这个意思,我现在在HDFS,假如根目录下有一个什么have,有一个什么A,这个目录啊,这是一个路径,这个路径底下呢,我放了一个a.TSD。我自己铺的进去的,现在我创建一个表。然后我指定到。
01:04
能不能找到?那能不能查到,还是想我们之前所讲的两件事情吧。对吧,原数据我们创建表的时候,原数据有没有了。有吧,因为创建表就是添加一个原数据信息,是不是第二个我这个东西IDF有什么数据啊。有,所以他就能干什么查到,而且我们之前说过,只要你两个东西有分先后顺序,谁先有的分吗?是不是不分啊,那我们看一下这个内容啊,首先呢,我们来操作一下。在这个地方我们随便哈多吧FS,杠make,一个杠T,呃,我来一个爱的硅谷可以吧?啊,这个问题肯定没有爱的硅骨底下呢,有个have have呢,我来一个A。可以吧,这个落地肯定没有的,来看一下。没有什么爱的硅谷吧,啊,没有这个东西,我们新创建的东西走。
02:04
然后呢,我哈多干的。把这个aa.txt扔到哪了?这个没录下对吧,我先扔个数据,先扔到数据OK,然后再来干什么,见表可。Table。然后是我们啊,这个表明AA是不是有了呀,呃,再来一个,嘻嘻哈哈,呵呵,都有了。嘿嘿,是吗?嘿嘿,好ID。In,因为A点只有一列了,所以也不用多个列了啊,然后什么是不是可以不写了呀?指向哪?把他拿下吧。走,然后我直接那个心from这个什么。是不是也能查出来呀,对吧?啊,符合我们之前所讲的,还当中能查到数据呢,只要你原数据和实际数据有那就OK了啊,那就能查到啊,就能查到是这个意思,所以呢,无论你是不是这个数据是你自己创建的文件夹呀,还是铺进去的,这个我不关心,我只要有就行。
03:18
啊,先后顺序是无所谓的啊,是这个意思啊,你就可以通过location这种方式来做这个事。好了,到这好,这个就也回到我们之前在分区表里面所讲的那个问题。分区表,先有的数据后有分区,如果说先有数据直接是不是查不到啊。你是不是要做修复做。添加分区这种操作,还有最后一个第三种是不是直接通过漏的方式那种我就不聊了,因为他两个就算你没有数据漏的时候,它同步的了啊,直接就有了,好那这个地方呢,假如说我们之前所讲的哪一种用修复,哪种用添加,假如说这个数据已经存在了很多呢,假如说这个东西啊,首先这地方就出现X5HAVE这个A呢,假设它是一个分区表。
04:10
当年呢,假如说存的数据对吧,我们当时举的例子是不是一天一天存到文件夹啊,以前呢没有建表,现在呢,你是不是可以通过location来指定到这个位置来创建一个什么分区表,那这个时候你说你用修复还是用添加呀,肯定要修复吧,因为修复一次性就搞定了呀,添加还有一个一个的添加吧,啊就算你有同学说那一次性一条命令可以添加多个,一条命令添加多个的前提是你一把每一个分区都用空格给它干什么。写出来了吧,啊,写出来了,你用修复直接就修复完成了,这个是这个意思,也就是说这个本身这个数据。如果说它存在很长时间了。存在很长时间了,对吧,而且呢,这个分区啊,这些东西都有了啊,因为你正常的在SD上存的数据也是按天存的嘛,啊,一天倒上来一个,一天倒上来一个,新成家一天倒一个啊这样来存的,那最后呢,你在。
05:07
创建分区表,你可以指定到这个位置,然后做一个修复命令啊,你所有的分区都有啊,所有的分区都有了,因为修复命令它是根据HD路径帮我们创建什么东西啊。数据原数据,对,在买色当中帮我们创建原数据啊,所以呢,就是你要知道这两个东西其实更多的更多的这个像刚才我们所说的那个场景还是比较少。比较少,一般的每个数据导的还是DS,肯定当时在刚开始导的时候就会去对它做分析了。他不会说这个数据已经保了一年了,在这存了一年了,然后才想起来对他分析,不会这样的啊,不会这样的,这意思。然后最后还有一个这个东西啊。还有import这个东西呢,也可以把数据导到have当中,但是你看注意。
06:02
不是说你随便指定一个目录的数据我就能导进去,不行啊,你要随便指定路径,你只能用什么。命令。啊,用漏的命令去导,但是你不能用什么import import干什么事呢?这我们会讲一个,就是明天的时候讲数据导出的时候,这有一个。通过export这个关键字,可以将我们数据导到HDFS。啊,然后你通过import可以将这个数据给他导到汉表里边,这个是可以的。啊,它必须因为它在导出的时候啊,它还有很多这个信息要保留,你普通的一个文件用port导进来啊,所以呢,这个iport跟iport这两个东西啊,做一个了解,做一个了解生长环境当中问了一圈,包括自己没有没有在用的这两个东西啊做一个了解,因为我们现在讲的是导入导出,它有这种方式,所以就放在这了。
07:00
放在这了,而且这个也是呢,现在还演示不了啊,只有等明天我们导出一个数据,导DS才能干什么导进来啊,才能导进来,所以说这个东西呢,是。就是最常用的那种啊,最常用的,但是你做一个了解啊,做一个了解。这个是主要是通过location来加载这个指定数据的路径。
我来说两句