00:00
具体的再下来把这两个看一下啊,搁一块看一下就OK了,它第二个方式是什么?通过哈杜的命令导入到,你看它用的什么命令啊,就get吧,因为你的数据是存在HDFS的,你其实用get就下载到本地是可以的吧,或者说你要导到HDFS,其他路径的话,CP也行了,它本身数据是存在HDFS的,那你之前关于HDFS所有的一个命令都是可以用的,然后接着看什么have shell命令导出,说的好像很高大上是吧,其实看一下它其实就用了杠一和杠F去执行一个S,或者一个具体的一个脚本文件嘛,其实就是这样的,然后只不过这个东西,哎,追加到一个文件里面,是不是我们之前也操作过对吧?我们在讲具体的have的一个交互命令的时候,就已经演示过了,它其实可以通过这种方式来导入导出的。
01:00
导入导出的也可以,好,然后接下来看这个X po的好,它那个导出,它那个导出,那讲完X po的,我们还要演示一下input呢,因为之前我们上一次演示input是失败的啊,没有导入成功了啊。它这个X错的X错一张表,然后to in,色是from吧,对吧,色from X错就是。到哪去到哪去,导到一个目录,找到一个目录来,我们操作一下啊X po,然后一个table student那张表吗?然后是什么吐后面跟着一个路径嘛,我们user,然后放到他的硅谷,再放一个X错里边可以吧,给他创建一个文件夹走。
02:00
他直接说你看啊,他的一个日志信息啊,说拷贝一个date,从这个目录什么time底下拷了一个me store,他把这个什么me store也拷过去了,然后最后才是。把这个这个是什么表吧,表的文件夹对吧?哎,这个表底下的两个数据,也就是说你看xport它导出的一个数据是不是很多啊,来看一下啊,我们在哪,因为在X硅谷下面是吧,然后有个X的这个文件夹,看他还有一个原数据信息,然后date里边放的是两个数据,两个数据。哎,它是这种这种方式才可以的啊,这是X po的一个导出,其实很麻烦,一般你也不会这么去用的,不会这么用,但是它确实可以用这个X po的关键字导出。好,接下来在我们返回来干什么,这个port吧,Port它是一个from,找到哪张表,然后来自于哪,好,接下来我们是portport,然后是table student,然后是吧,来自于哪。
03:19
路径是这个吧,走一下刚才是不是我们选爱德硅谷的时候,他一直不让导啊,说是一个不可用的一个路径,是不是啊。哦,它里面的数据重复了,那我们就不删了,我们看一下,如果说是完全一个新的表呢,我们试一下完全一个纯新的表可不可以是吧,来走一下。哎,他是看起来可以的吧,他是把这两个东西全部拷过去了之后,还把这个数据导进去了啊来,那纯新的表应该在哪啊。
04:07
有have底下吧,Have号一个五吧,然后你一看,哎,它那个数据又恢复了,跟之前一样嘛,所以说这个port的这个关键字啊,一定要在xport导出之后,因为xport导出的时候,它是不是把原数据信息也会导出去啊,相应的都会导出去啊,当然这个它两个关键字,一个能导入,一个能导出,但是应用的面呢,相对来说比较少一点,你看特别这个input的英文面很窄啊,他只能导xport导出的数据就很麻烦,那谁没事先把xport导出,让我导入干这麻烦事干什么呢?对吧?啊,你还有其他很多的一个方式,你看就是什么location这种方式,或者就是你直接通过命令。Put的,或者说CP啊,或者MV啊等等这种方式都是常用的吧,啊,你没必要说把这个数据整的这么麻烦啊,但是它确实可以,但是它确实可以导入数据,导入数据好好。
我来说两句