00:00
好,这里面有几个东西我们需要说一下,第一个就是数据仓库的一个配置,配置。哎,我们是不是没有配过,它的位置在哪。哈,原料下一个叫。User have willhouse,是不是这个我们之后在default库里面创建的表是不是都在这?对吧,啊,所以创建的表就在这儿,那这个呢,是它的一个默认值。我们可以改啊,这个默认值在哪呢?因为我们没有配过,所以它只能在。Defa这个里边啊,它的默认路径呢,正常,如果你想改的话,你可以把它复制出来放在哪。放在还杠里边啊,放在还有杠里边是这个意思啊,这个呢也很少去改,就放在这个默认的位置就够了啊,默认的位置啊,这个东西呢,去关注一下,接下来至于这个权限给不给也还好啊,也还好他自己都有,因为你都是拿ID股去启动的啊,拿S启动拿S操作的,所以说就没事啊没事好接下来是查询后显示配置,那这个是什么意思啊,我们来看一下,我们来举个例子啊。
01:13
现在我select she from。这个A这张表。他并没有那个。算命ID发现没?对吧,这个只有一个列,我们还清楚它是ID只有一个,假如说字段比较多的时候,我怎么能区分好多都是数值型的,到底这个是ID还是salary,还是说是员工编号等等这些东西呢?对吧?第一个是ID我们要有,就是说它这个字段比第二个。很不友好的,现在在默认的这个库里边。假如说我们现在还有其他的库,我们用死了其他的库,但是你现在通过这个地方,你知道你在哪个库里边。不知道吧,啊讲到这个事好,那现在呢,我们可以改一些配置,因为它默认的把这些东西呢,都给它关掉了,那我们退出。
02:02
啊退出,然后呢,加两个配置啊,加两个配置信息,我还是通过这个地方来配一下啊。点一下好的原料。然后have have。这里边啊,加两个配置信息,在汉刚里边来看一下,把它呢拿过来。好,然后我再缩进一下,因为有强迫症。好。呃,那你看一下第一个这个东西叫什么。客户端里边打印那个头啊,其实就是我们讲的那个ID第二个。打印当前的什么DB数据库吧,好,然后CTRL保存,保存之后呢,我们重新进到这个里边,我们看一下啊。好,然后同样的我们执行的还是c c from这个A。
03:02
哎,首先进来的时候大家应该能发现到这里多了一个什么default,哎,这个就是库里啊,方便知道你在哪个库里边,然后接下来你c select之后,这个地方多了什么。ID的吧,买多了ID了,就这意思啊,就是说两个属性啊,分别对这两个地方是错的,其实这个东西。你说你不配会影响执行效率吗?不会吧,啊,跟执行效率没关系,就是你查看的时候方便吗?啊更方便一点,就这意思啊。好,就是这两个配置,这个也有截图的一个显示,截图显示最后还有一个配置这个内容。日志信息这个呢,我并没有昨天就之前配的时候并没有配,因为它有默认的一个路径,默认路径在哪呢?它是在这个里边配套看。再有一个log附件是关于日志打印的吧,对吧,哎,在这个底下啊。嗯,这个里边CD波d Mo have,然后com里边。
04:01
有一个汉个老他。还是模板,所以我们要想我们自己改个东西生效的话,是不是应该把它干嘛。改个名字啊,把这个给他干掉。看掉,然后呢,我们去修改一下,还是连进来。呃,老婆附近艾你了,来看一下他这个日志。日进。证明叫这个。have.log这是日志名对吧,文件名,然后路径呢?当前整个系统的一个time点啊。对于我们来说就是那个time,然后叫user点。当前的什么用户名,也就是说,那你说一下,就目前我们没改它的时候,这个日志等于在哪。CD的太,然后呢。
05:00
Haveb点。对吧,而且这个焊点log你能发现它还是按天滚动的。因为昨天我们启动了,他就给我们生产了一个什么2019杠零七杠零幺,因为到了12点的时候,他自己滚动一个文件啊,我们后面做项目的时候会有这种操作,因为生产环境当中都是这样的,一天一天的日志,你得分好类吧,你不能把所有的一年的生志全部放在一块啊,这就是在捞缩建那个文件里面加两个配置参数就行了。按照天去滚动啊,那天去滚动就是两个参数,那这块也就have,它是默认的这种情况,假如说你have执行过程中启动或者哪出错了,你要到这来看。不方便嘛,所以我们给它改一下,我们一般习惯于改到哪呢,还是改到这好。放在当前安装目录的log丝里面,是不是大家更喜欢这个目录对吧,因为很多的时候就这个地方啊,大家最熟的就哈宝。它的一个劳斯是不是在这儿啊,就在哈多的安装目录底下有个劳斯,所以呢,把汉也把它改到这啊,你改到这,那这个地方就改一下,诶我把这个复制一下。
06:05
CRC啊,这个地方去修改一下这个D就行了,CTRL啊其他的你不用管,它里边配着那个什么按天滚动的一个级别啊,日志格式,最后如果滚动之后,哎,是这样的一个形式啊,这样一个形式啊,那你不用管啊,卡拉斯保存只需要改这个电压啊,电压好,然后呢,我们重新启动一下。退出对吧,重新启动,启动之后我们注意观察哪啊。摸得快对吧。好,这边已经启动了,启动之后呢,我们来L。这边多了一个什么老克斯,什么时候创建的,七点吧。没问题吧,啊,就是这个时间啊,就是这个时间,OK,那你CD的log里边它肯定有一个什么。have.log吧,啊have.logo假如说到明天的时候,我们再来过来看它就会多一个have.log点7月2号的数据吧,啊7月2号这条,因为它是按天滚动的,天滚动的这个意思,那你把它配在这个下面,方便你对于汉堡,如果说错了,方便查看日日啊,你要不改的话,你也知道它在汉堡。
07:16
艾特硅谷就是当前用户,你不一定是特硅谷,因为好多同学用自己的名字取得那个普通用户名吧,啊,反正就是当前用户名那个底下啊,会有一个汉点log去那个地方查看啊就OK了,这是相关的一个配置,就是log附件啊,关于这个log日志,还有其他的一些内容啊。参数的配置方式。刚才我们是不是都是通过配置文件去改的。对吧,那除了之外,你想想看哈,多跑,你在讲HDFS的时候,是不是有一个参数级别的问题。有印象。首先他是不是所有的属性都有自己的默认值。
08:00
对吧,我们可以在cos还是亚赛等等这些set文件里面,把那个属性给它拿过来,把它只改了,是不是我们说的这个S优先级比deft优先级高。然后他可以在那边。程序里边是不是有个pass,我是不是可以在pass下再把配置文件再配一遍。是不是它就会覆盖你成那个本地环境里边的一个配置文件,对吧,然后还有在哪呢。代码里面还可以代码。对吧,代码里边是不是我可以那个什么compgu.sET然后KV这种形式去改啊,对吧啊等等一样的,那have里边也一样,还它是不是有个默认值。刚才我们改了有have set这个地方是不是可以覆盖掉默认值对吧?那除此之外呢,还有。啊,还有首先第一个我们可以通过命令行。秘密好了。就是在进到这个窗口的时候,我们可以跟一个have,然后平面形式。
09:06
来修改某一条参数。某一条参数,那我们可以看一下吧,首先呢,这个地方我们并没有改它的一个什么ma.reduce.task斯对吧,规定它reduce的一个最大的什么。任务数啊,最大任务数,那这个怎么看呢?来把这个属性给它复制上,在里边敲set。分号如果说你不写等于,那就是查看就是查看走。现在是多少啊,负一对吧,这出。也就是说默认值是负一,那我进到这个里面来的时候,我要跟一个杠,Have干什么?靠,然后后面跟着参数来,这个参数呢,叫他。我等于十。对这个就当前窗口会生效,临时生效,你代码里边不也一样吗?对吧,只对你代码生效吗。
10:02
OK,然后呢?十了吧,对吧,这个进来了之后,也就是说从进来开始,每一条语句都遵循那个吧,啊但凡如果用到这个属性的话,都是十了。但是有时候我现在使我不够用,我现在已经进来了,我还想改怎么办?也就相当于在代码层面我们再对它进行修改,对于每一条搜索语句执行之前,我都可以改变它的属性值。假如说我现在要执行一个搜狗,现在十个不够,我要改成20个,那你就把这个东干什么改成走,然后我们重新看一下就变成什么。20啊,其实跟我们HDF说的属性优先级是一样的,那你最后改的肯定优先级最高吧,因为他是最后读的啊,它是最后读进来的,他它是读的顺序是DEF破的,然后set,然后是启动啊,最后呢是你进来客户端以后啊,读的顺序是这样,因为读的顺序这样,那从前往后是不是优先级越来越高啊,那后读的肯定优先级越高啊,啊是这个意思啊,就是说里面有属性啊,里面有很多的属性,后面呢,有一些属性还会跟调优有关系啊,我们后面再聊,现在呢,你要知道可以在这个地方,在哪些地方来修改它的一个属性。
11:17
啊,我们所讲的有哪有哪几块的set,启动的时候,还有启动之后还可以改了啊,这个就很方便啊,很方便这个意思啊,那这块呢,都是关于它的一个配置。啊配置呃,像这些我们希望它不变的是我们直接在S里面写什么呀,对吧,假如像这种动态的关于这个任务相关的,我们一般就先用过程值,你要想改的话啊,你可以去改一下啊,你临时的去改一下就OK了啊是这个意思,这是我们所有关于这个汉堡一些常见的一个配置啊。
我来说两句