00:01
啊,具体的我们来看这个第二章,前面的第一章呢,主要就是涉及到它的一些具体的一些概念的内容是吧,架构啊,什么与马的比较啊。都是一些概念型的东西,接下来我们就要安装,实际的来用一下,实际用一下,那具体涉及到安装的话,我们肯定还是要干什么。看官网吧,看官网还有点哈巴起点看到个图标也挺有意思是吧?小蜜蜂是吧,是个蜜蜂吗?但是它蜜蜂是大象头发,哎,它是基于哈多本来的吗?哈多不是大象吗?哈多的大象蜜蜂我的理解啊,其实我我不知道,我的理解是蜜蜂很勤劳是吧,而且他是干什么的,蜜蜂采蜜的,采采花的吧,采花采蜜的对吧?采花采蜜呢,不能说采蜜的人采的是蜜码,不是密码,不是你们,你们说采花跟我说的彩花不一样啊,我听出来了,就是说你这个拍网他本身是从。
01:08
哈的取数据,然后做分析的是吧,也就是说他拿的是原始数据,也就相当于花一朵一朵的花,最后他要产生出分析的结果,就是你那些什么。对,就是幂是吧,啊就是幂就最终的结果就是你分析出来的数据,分析出来数据啊,这个一方面呢,这个头啊,它一方面体现的跟哈度的一个结合啊,它们之间的关系,第二个你的作业用另外一个理解,它密度本身采蜜的比较比较小是吧,就是它的一个针孔啊比较小,你看现在用大象的鼻子如果去采采集数据的话,也就说它处理的一个数据啊,是非常大的是不是啊。这这是我个人理解啊,有有什么误区的话,就就当没说过好吧,反正就是看,其实你要分析这个图标啊,其实有时候还挺有意思的啊,挺有意思,然后我们来看一下,首先你要看的话是下载嘛啊,这个就是它的一个后页面是吧,后页面就是最开始那页面要下载的话,你看现在版本到什么程度。
02:12
5月21号又发布了一个版本是吧,三点了,这个3.0是集成的什么。哈多3.00啊,哈多也出到3.0了,但是现在就目前初期的学生当中,我们了解到的只有一个人在用啊,就一个人的公司,因为他们是新开的,就是那种中小型公司嘛,他们就想比较尝试新的框架,新的框架就用的3.0,其他的一般都还在2.7 2.5几的,2.5几的,因为你公司当中用肯定是追求更稳定性嘛,他不能追求新,你要自己玩,你可以下个3.0去玩,玩什么新得性啊,因为他的坑特别多啊,公司肯定不可能在拿着实际的业务线上的业务去做这个冒险的啊,所以公司当中他肯定是追求稳定的啊,追求稳定的,像我们现在你看三月份才出的这个2.3版的,注意就是有很多大数据框架呀。
03:09
它会有一版本二二版本同时更新的这个情况。这一版本跟二版本呢,它差距很大,它有可能同时更新来看一下这个have这块,17年四月份是吧,然后出了一个1.2.2,你看一六年这个时候还出二点几。对吧,也就是说他可能就是一版本的,二版本同时更新的,它的一个功能差距很大,公司外面用呢,还是以一版本的为主。为主,那我们肯定是根据公司的一个需求来的,那我们要用的呢,就我们肯定就是不会在这现场下载了是吧,都给大家提供好了,我们用的呢,下载的版本也比较多。资料照包里,然后我们用的是那个1.2.1 1.2.1,相对来说很稳定的一个版本,而且公司当中了解的情况,它用的确实也特别多特别多,然后给大家下来也有2.32.1,但是这个东西啊。
04:17
你你去跑的时候,你会发现在虚拟机上会有一点问题,虚拟机上还有还有bug没有修复,在虚拟机上所跑的时候还会有时候会起不来,那我们要避免的这种情况,但是给大家下了,你有兴趣的话自己尝试一下,因为他也不用搭集群是吧,你102上装一个1.2.1,你103104随便装一个2.1.1或者2.3.0,这都行,自己玩一玩啊,但是一定要在建立在你把每天那个知识点都完成的情况下,学语力的同学去玩一把啊,啊正常的。你就跟着这个正常的思路去走就OK了,你就用这个1.2.1的,1.2.1的啊就够了啊,这是下载啊,下载那我们已经有了,然后我们要看安装的。
05:04
看安装对吧,这。该心大的干的吧,开始指南这个。安装和配置吧,啊肯定的,安装其实就简单就解压一下,安装就解压一下对吧,然后主要是配置,我们来看一下这款,他说他的一个要求要扎了1.7以上好多二点二点。二版本吧啊,经常还有二点版本啊,然后呢,这地方提供了两种安装方式,看这是两种安装方式啊,这不是第一步第二步。第一个看看是什么。从有了一个是吗。稳定版本直接安装的,也就是说你下载了加包,你看它是怎么做解压,然后配置一下。
06:04
Pass,配置一下还有home就够了吧,哎,就这个比较简单,然后看第二个。看这个。从get上直接下载have的源码。需要自己去编译的,你看。妹妹。啊,需要自己去编译一下,就打个包,然后杠P第个是打打成发布包,什么叫发布包,你发布包里边啊,它它里面放了U。一个配置文件打成发布包以后啊,它有那个病,有那个S病,因为你正常的你自己打的包从来没有打出来什么病,S病这些东西吗?它是可以打开发布包的,那要相应的要有些配置文件啊放在里边,然后加上参数。啊,加上相应的打成发包的一个参数,想想看之前做那个哈,源码编译的时候,最后是不是也用过这么东西,没印象了,可能啊,你回去看一下,肯定也有两,因为它是打成发布吧,它还有一个什么杠P什么碳,那个是打成踏包。
07:14
最后打成包的形式,然后这个参数的是打成发布,发布包里边会有病啊,S病啊等等这些内容,这些内容算了就找一下,相应的会有会找到那个配置文件的,然后根据你自己的项目去改一下你的那个配置信息就够了,配置信息就够了,那我们就不用这种方式去安装了吧,哎,我们肯定采用这种方式去安装,这种方式去安装,那我们操作一下是吧。虚拟机还没开是吗?好,现在我们虚拟机打开了,而且也已经连上了,我们远程工具也连上了,接下来就是把我们的炸包导进来吧,这包导进来二的加PP,然后这个包你要不要导错了,到时候会有问题,注意我们要找到那个底下是吧,那我在这地方的,然后拖进来就就在那个,要不然他在加里面吧,要加这样我们把这个也拖进来,到时候会要的买到时候你也拖一下,我现在就一定拖进来了,一定拖进来了,那烧啊,现在我们那个安装工具有CD到D。
08:33
解压吧,解压的命令是什么?VF吧,然后是阿法奇汉,然后到其他的目录是什么?到C吧。好,然后我们CD到豌里,我一般习惯的还是把这东西改个名字吧,但是那个改个名字你改不改无所谓对吧?啊,改个名字接下来官网上说要配一个什么还home是吧,然后pass配一下,其实这个东西你配不配也都OK啊,因为他这个客户端你到时候进去去取一下就OK了啊,他就是单独的一个客户端而已,你要分析数据的时候单独取一下就行了,他要说配,那我们配下也飞是吧,松动或者你切到入的嘛,切到入的松度V一样。
09:27
来这到最后,然后我们把那个复制一分吧。这然后在这写一个注释,这个是一个汉是这个就是还后码model,那这个改成还吧,正常你要不放心的话,或者说你们改这个名字的话,你是不是自己摘一下对吧,沾一下更保险一点是吗。
10:07
还有错啊,这样你确认一下,因为没有问题了啊,退出退出说我试应大家认内吧啊,直接退出不用像那个什么WQ啊,比较麻烦啊,那配置完了之后还要S一下啊一下BTC啊,你在这个地方测验一下,如果能敲这个菜,我你看table它能出来,能出来个意就说明你这个环境变量也是没有问题的吧,也成功了,这是我们的一个安装,然后官网上刚才写的是安装和配置吧,配置我们还没做,配置还没做,那往下这是它另外一种安装方式了,另外一种安装方式好,他说要就开始running have了,启动了,那配置呢。
11:02
但是你把记下看啊,它说have意味着how。还不要用朋友了,所以呢,你要你必须。在你的pass里边有这个哈的一个,你要配上去,或者说你要配到哪啊。配到你的康复里边啊,如果你不在这个地方配。你在也可以吧,这是哪?Pass pass在哪?刚才说配了pass,他还有一种配置方式,如果你不配的话,可以在这。CD到have里边,你是不是到have里面去备呀,Co,那看一看应该是哪个文件呢?烟吧,哎,这是环境吧,环境,那它是temp,那我们怎么办啊,那肯定改个名字,或者说CP出来一份也行啊。
12:09
然后改成汉,我也没点吧下我就不VI了是吧,还是用远程工具连一下,这样改到看舒服点。他总是让让你买是吧,花钱然后是汉我,然后是靠谱,你下有多刚改的这个名字。这里边你要看他都是猪是要的吧,哎,你看到这个地方什么,他如果红吧,那你要把它注释解开。艾克一下Dollar。好的很难下。这你过来吗?
13:01
然后你看到这个,它还有一个什么。还有一个配置信息的一个文件夹在哪,因为你现在是不是改了里面内容啊,那你要告诉他你这个文件夹在哪了,那这个文件夹在哪啊,是不是PWD就是这个路径啊,就这个,那你要把这个配上,OK,就变成两个东西就够了。诶,这两个问就忘,当然你要是不看官网,这是不是有啊详细的步骤解压吧,改个名字,你改不改无所谓,只是看的舒服一点,舒服一点,然后把这个名字改了吧,我当然没改,我是拷贝一份出来的是吧,拷贝一份出来了之后配置哈的一个路径,然后配置哈的一个路径。给这汉族的一个路径吧,啊是这样的啊,然后我们就启动嘛。那have它是依赖于什么哈度的啊,刚才我们也配了那个哈后,那你在起have之前一定要起哈哈度,而且这个时候一定要起,牙也要起来。
14:14
因为他你等会写的哈特要执行还会任务任务啊,你不及雅安你还work,你不是里边配了任务交给雅安去分配资源吗?所以说你这个时候雅安也要起,就SD你看雅安都要起,都要起。但他起之前我们还要看一个东西,他说了。HDFS的一个要创建这么两个东西。一个temp文件夹,一个user have will house,现在你根本都不知道这两个文件夹干什么用的,你肯定能感觉到这个东西应该是为have准备的,对吧?啊,为have准备的,我们写一下这个时候你可以用什么。我我还那个群吧,给我起无所谓,因为这里边还有一个黑色说是吧,那这个脚本启动的就是我的老的机群了吧,还是之前那个机群了。
15:23
老集群没提起来。然后我们看一眼,所有的一个进程是不是都起了。正常像这种操作的时候呢,你虽然看到它进程中在,但是你不要立马去起什么have啊,显示等等这些框架了,它应该一样,因为它还有一个初始化的过程嘛,对吧,你就稍微等一会,稍微等一会,不要那么急,而且你是虚拟机,虚拟机的话,你之间那个通信它受资源的影响会比较慢啊,会比较慢,比如时候就你会发现起不来,它有可能就是中间通信出了问题啊,通信出了问题,所以你可以稍微等一下,起来之后你等一下,等一下之后呢,你可以再看一眼,看它有没有挂掉啊,你第二次再看的时候,正常的没有挂掉,应该是没有问题的吧,啊是没有问题的。
16:20
好,那官网上说了,他说要创建一个,创建两个文件夹,然后还给他这个组一个什么权限,这个G加W是什么权限,给他所属组写权限吧,写权限RWX嘛,R是Q对吧,执行权限。好,那我们操作一下,其实这个地方你不操作,它是会自动生成的。它会自动生成的啊,那我们既然官网上说了你操作一下,那你就操作一下呗,你就跟着官网走对吧,那他说要一个看的目录是吧,还多FS杠那个点。
17:08
看吧,走一下。我他已经存在了是吧。哈杜11020070。他们已经有了,我看能不能进去啊,他现在不能进去,不能进去是吧,Stand这不是stand,这这我是单点,怎么可能是stand呢,你这个进不去无所谓啊,然后还有一个。他说还有一个是什么user have will house,这个是一个权限的问题吗?刚才那个就昨天跟你们说的那个dog。昨天不提过这个刀的户嘛,你可以把那个配置进去啊是吧,关闭一个权限检查配置进去也可以吗?啊,关闭或者你把那个权限都改一下也可以嘛,啊这两种方式,其实这种事情就临时目录里面的东西呢,看不快也还好啊,所以说他不让进就不让进,不让进就不让进嘛,那我们还有一个目录管。
18:14
还有一个这个user have house,那这个我们要粘一下,你到时候也粘一下,因为敲的话把它敲错了是吧。那哈多FS-make电压,那这个时候要。加参数吧,杠屁是吧,杠屁啊,因为你是递归创建工作,那你是既然拿那个还为我创建的。你是不能进去了,所以说你给不给组权限的话,在我们学习过程当中都无所谓吧。因为你只有你一个人操作啊。你没有什么其他的职务对不对,所以说官方的建议啊,因为你这个have不一定是你一个人用。
19:09
你看是这样的,就是你哈多集群在这的,你害我是把数据放到哈集群里边有一堆数据在这。然后我们所讲的have呢,它是客户端,那既然是客户端的话,你在你的电脑上可以装一个吧。你在其他的机器上是不是也可以装啊。那你两个人可以可能拿到用户是不一个吧。有可能你俩的用户不一样吧,你在公司当中做开发的时候,你俩的用户持有的用户是不是不一样啊?但是你可能在一个开发组是吧。在一个开发组,你的组是一样的吧,因为公司当中他肯定是这样分配的啊,你一般你每个人有自己的一个账号,这是不共享的,然后你什么开发组测试组,他有一个组ID吧,哎,他把你们这一堆人放在一个组里边。
20:05
放在一个组里边,那你是have组的,就涉及到分析数据的,那你肯定在一个组里边,所以官方会建议什么,你把这个组啊,加一个写的权限,就不光你这台电脑,你这个用户进去的时候,假如你还在微博一。来操作,可以操作可以写。你挨着硅谷二也让他可以写啊,是这个意思啊,但是我们学习过程当中呢,你说你不做这个操作是不是也没关系啊。因为你只有一个用户啊,还不涉及到他们其他的群播,所以你要知道他做这些操作,或者说你不做也可以,你要知道原因在哪,到底是什么情况,你要想一想他这样建议到底有什么用,对吧,那我们就不用做了,反正我们就一个用户啊,就一个用户,这是整体的一个配置吧,整体配置,其实配置到这就已经结束了,这结束了,因为接下来你看干什么。
21:04
起客户端了吧,具体的客户端了。
我来说两句