温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,我们来看看刚才说的have,来点一下写,他跳过来,大家可以看到是写到哪hdfs right对吧?嗯,所以它是基于HDFS来实现,那我们如果是这样的话,我们是怎么来做呢。要导入hi,我们是不是通过一个HD FS wir,对吧,之后呢,是不是就进到HDFS的路径了,那接下来你有几种方式导入have表,最常用的是不是road data。变态表。这样是不是就行了,对吧。你也可以选择直接。直接写入have表对应的路径。下面。但如果这个时候你要注意,如果是分区的话,你要手动创建分区啊,还有一个细节就是这张表你要手动就这张表,基于这种场景,你咱们是不是得先建表再去加载数据啊,啊就这么几个事儿啊,还有一个事儿就是如果我的HDFS配置了高可用,那怎么办呢?要拷配置文件吗?当然可以。
01:17
但有一个更简单的方式啊。我们直接加上这个配置就行了。其实就是对应咱们HDFS配置文件里边的一些配置选项,你看这是不是高可用的命名空间了,比如说我随便举个例子叫NS,那接下来是不是有一个。高可用。命名空间下面的节点呢?对吧,那还有呢。每个节点对应的地址。每个节点对应的地址,那么大家注意,我这边标颜色的啊,红色的标表示同一个值啊,比如说你上面指定的叫A,那下面这些红色地方是不是得替换成A呀,对吧?这个就是命名空间,你叫什么名字,这边就是参数名,就是叫什么,那后面指定每个节点地址的时候,你这边叫什么,这里也得叫什么。
02:13
这边只是。我随便写了一个名字啊,那大家具体叫什么就叫什么,那这个端口注意应该是8020嘛,反正这些东西如果你配的高可用在HDFS-site里面应该都是能找到对应参数的,你可以直接写,那怎么写呢?啊,这个红色吧。写在哪个位置呢?刚好咱们这有个配置文件对吧,你就写在参数里面就可以了啊,写在这里面就行,比如说我就在随便找个地方这啊,当然缩进一下啊。哎。
03:05
啊,太长了是吧。大概就这样子啊。就写在咱们的参数里边就可以了啊,有这么几个东西要配啊,还是提醒一下啊,这个名字这边这边这边都要对应上啊。那这样就行了,这样的话你就不需要拷贝一个配置文件,因为我的集群还没没有配啊,大家如果配的高,可用找这几个参数就行了啊。这是关于HDFS,咱们的几个说明。
我来说两句