00:00
下来我们看一下这个将数据导到这个h base,导到h base啊这块我们看一下,它同样的也有h base相应的一个参数啊,在这个文档当中,你也能看到这个地方。这块啊,是的一个参数H一个参数,来我们看一下我们当时给的这个命令命令,那这一块的一个东西就没什么可说的了。这个还是马克那边的吧,啊,同样的你可以加这些参数啊都可以对OK,然后接下来就是这个东西。这块的内容都是什么?这的OK,然后是这样column family是列俗对吧,列足OK,然后你看啊,加了这个create table,看这个参数。如果被指定的话,他说create missing吧,就是说如果不存在它自己去创建了,是这个意思吧,哎,加了这个参数的话,但你看一下就是由于这个阿尔法奇它我们都用的原生的对吧,它不兼容,它这个我们当前用的1.4.6呢,跟这个h base1.3.1,它不兼容,所以它不能创建啊,不能创建我们先这样,我们先补上量。
01:17
然后是这个是是否创建表,然后是rookie,然后用什么ID,然后。Table表明吧,哎,这是表明这是列足啊麦等等,OK,这个看一下,这此时这样我们先看一下吧,再开一个窗口,H base的窗口,对吧,CD的o model h base里边我们先看一下这个h base有没有这个表。哎。好在这是吧,没有我们提到的这个什么。
02:02
H杠。看吧。在这走一下。他自己走了是吧,来看一下他报错了吧,他报什么错,他说这个表。Company company这个是吧,这个地方有问题吗。好,我表示对吧。这个地方怎么弄错了,那我们重新执行一下,当前的是这个他这个表不是刚才那下。加载了一堆数据,你看一下报一个什么错。还是那个什么爱的family吧,跟汉那边一样啊,啊,就是因为他版本不兼容,他去创建表的时候呢,他不让创建,其实他是不是试图去创建表啊,对吧?啊,因为你加了那个杠杠那个create table,所以说他会去帮你创建表,但是呢。
03:02
它由于版本加包的一个不兼容问题,所以创建不了啊,哎,创建不了,那我们只能去干什么,手工的把这个表创建一下,这个表叫什么。哎,这company对吧,列足是音符啊,列足是in。这个地方得加一个单引号或者双引号都可以啊。然后逗号,逗号一下。然后把我们那个语句再重新执行一下,直接填一个上键,你现在看它变成一行吧,变成一行。这个spli by杠杠Li看一下。切分的列,从一个默认的里边,我们应该找这个。
04:09
卡哦,这个破的control这边是的,我看到了又。被切分成按这个。后面的列名做一个切分单元是吧。嗯。看这个数据,这贝当前表建立完了,它是能导进来的吧,然后我们看一下这张,嗯,盖一下这个。At。走一下数据是导进来没有问题吧,我们主要看一下这个什么。Split这个这个的意思指的是什么?就你工作单元切分工作单元,其实你这个地方只自己指定了一个map数法。
05:05
他这种是一样的,就是说按哪个字段来切分来切分啊,指定整个的一个工作单元的一个问题,指定工作单元的问题。然后这块看一下1.4.6只支持h1.0.1之前的版本的自动创建,自动创建啊这块这样我们测试一下,我也没测过,就是说我自己把什么H的一个包,所有的东西给它拷到school下,看能不能创建吧。我不知道,我没试过,我突然有一个想法,Model,然后还是贝斯立项,所有的内容拷贝到。当前目录的立波下下。走下。应该CD-R对吧。CP-R走一下OK,然后我们再走一下之前的这个。然后我们把这个给它改成COM1可以吧。
06:03
其实这些东西就够了啊,它这个切分这个是重。这个还在加载加班。还是不行是吧,他得重新编译它里边的一个加你看一下。哦,那这个价格就多了,你找不到那个了,找不到原始的那个库那个东西了,对吧。正常的还是一样的,公司当中呢,用的还是CD的,CD的这块他给你兼容都做好了,特别像这种类似于SCO,还有后面我们要学习的屋这种框架呀,它跟其他版本的一个兼容是非常重要的,因为你想想看,SCO它是不是要跟其他很多框架做交互啊。还有屋也一样,屋类你学了之后,它也是要跟其他很多框架做交互的,因为它是一个调互工具,你想想看,我们现在学的什么mapdu have,还有其他的像这种东西,School它也属于一个任务嘛,还有from,卡不卡那边都属于任务嘛,你都可以把它一个任务写在一个脚本里边。
07:13
来交给5Z去调度,5Z去调度,所以说屋Z这个框架跟其他的一个框架兼容性要非常的一个强,因为它跟任何一个框架都能够共同合作的啊,共同合作的一个框架啊,这你要注意到,像这种SCO也是,你想想看它从什么MYS导到HDFS导到汉导到base,是不是跟其他的一个框架的一个交互非常密集啊,那公司当中呢,他用的都是那个CDH版本的,他自己把这个版本的一个兼容性全部都搞定了,不需要去操心这些事情了。OK,那这块是导到这个h base h base当中啊,也可以直接将数据导到h base当中。这个就很方便了是吧,但是你会发现他找到h base的时候,他是走了什么两个任务吗。
08:02
两个。看不见了是吧,这个加载的加包太多了,你看到走的是两个人吗?猜的猜的是吧。啊,参数是两个上下。哪部分是HDF的?上半部分是HDFS的参数。啊怎的参数你看啊,它have这边。它有一个这个参数对吧,它有一次have的导入啊,这你要注意的,所以它是分成两个任务的,它就一个,它就有一个,它通过直接写到一个文件里边,而不是说有一个have的一个willhouse,一个仓库,因为have它自己要将数据放在一个willhouse下边。对吧,哎,所以它分成两步啊,它分成两步,它不是它直接通过map能写到哪,写到HP那个表里边,写到HP的表里边,这你要注意这个点就行了。
我来说两句