00:00
呃,首先咱们要学习这个SCO呢,咱们第一步跑不了,就是先得给它装上对吧,装完之后咱们再学,那它的这个安装部署其实相对来说也很方便的啊,也很方便的,我们拿来看一下,首先这是它的下载地址啊,这个下一下就行啊,完了之后呢,我们需要这个安装包已经给大家提供好了,大家直接用就行,然后呢,我们需要把这个包啊解压,然后呢,去配置一个配置文件,然后就完事了,就可以使用了,差不多啊好,那接来,我们现在先拿到SCO的安装包,快速部署一下啊啊software,然后make dco。进到scoop,好,那现在我传一下这个工具啊,来走走这个software,找到scoop。然后这边推一下啊,找到咱们的四库的安装包,双击。啊,完了之后我们给它解压已经上来了,应该L。有了car-ZSVF啊,School,然后杠杠C啊OT mole啊,走,你好,那现在我们就给它改个名字啊,OT Mo掉啊,然后LL,呃,这个最长的就是scoop啊,MV这个scoop啊,咱只保留一个scoop就行啊,让他进到scoop。
01:10
好,那进来之后呢,我们需要做的事有两件,一个是修改一个配置文件,还有一个是干什么呢?对,还有一个就是需要拷贝,拷贝一个GDPC的驱动。啊,需要拷贝一个JDBC的驱动啊,给大家说为什么啊,大家想想我SCO要干什么事,是不是要去买SQL里边读数据,或者是把HTFS上的数据写到MYSQ里边啊,对不对,那所以肯定需要连接数据库啊,所以说需要一个接力BC的驱动啊,这边驱动行,那咱接下来呢,继续啊往下填啊。来我们,呃,先干什么呢?先改配置文件吧,啊,配置文件在com目录里边啊,咱们要改的主要就是这个scoop en nv.SH,当然咱们需要把template去掉,对吧?啊,MV scoop啊,Env,然后呢,把这个time去掉。啊,然后留一个点SH啊好,那VM库吧,啊,这个Env.SH好打开,打开之后呢,我们在这里边大家可以看到啊,里边有有什么是不是一大堆的这个环境变量啊,对吧,Set这个set那个啊,那我们要做的就是按照他这个要求,把这一大堆环境变量给它set上就行了啊好,那现在我们打开这个笔记。
02:21
然后呢,我们已经给大家准备好了这几个变量了啊,咱们直接拿过来CTRLC。然后放在这里边来,现在我给大家解释一下,咱们这里边的几个属性都是什么啊,这有一个主K板,我们可以把那个主K那个高亮去掉啊no,呃,HL对吧,这个应该是连着的吧啊no HL,好,这个高上去掉了行,那接下来我们继续啊。来给大家解释一下这里边儿的每个属性都是什么,首先先看前俩。前来好像它俩配的值是一样的,对吧?这里边有一个海do common home,还有一个什么呢?还有一个海do map right home啊,其实这俩变量啊,这个是有点这个历史历史原因的啊,这像这俩变量是我们scoop,呃,不是scoop,是这个海杜OP1里边啊,是这个分开的啊,有一个是map reduce home,一个是这个海的一个common home,它俩是分开的,但其实到了海DO2啊,以及咱们现在这海DO3呢,其实这俩home的已经,这个其实相当于不区分了啊,它现在都是什么呀,都是我们现在的那个所谓的海多和home啊,就是全放到一个根目录下边去了,所以说这个它俩配成一样的就行啊,配成一样就行,这个比较简单啊,好接来看下一个啊,下一个有一个什么have home,那指向咱们的have就行了,下边呢,还有一个组k home对吧?啊组K,那现在就指向咱们组k home呗,然后下边还有一个还有一个什么zo,呃,这个CF这应该什么呀。
03:47
ZCFG点这应该是咱们那个组K的配置文件所在的这个路径,对吧,那这个其实上面是有解释的,你看这。啊,这是set the parts for where to keeper,呃,Conf d is,对吧?啊,就是上面有属性,你照这个做就行啊,然后接下来给大家解释一下,就是为什么SCO吧,它需要咱们如下这几个环境变量啊,先说海度,Op,海度应该很好理解,对吧,为什么?因为我scoop底层是什么呀?MRMR肯定需要海德依赖啊,这个没什么可说的,对吧?啊,这是第一点,那下来下一个have have home,你说他需要have home干什么用的?
04:28
啊啊,是这样,这个大家可能有所不知啊啊,我前面其实已经暗示过了啊,我我前面说的是什么scoop,它能够实现以下功能,什么功能呢?能够把关系型数据库和海豆生态圈哎,里边的数据进行一个双向的传输。啊,那关于数据库有好多有什么,呃,Oracle啊,咱们那个my circlele等等等等,对吧,那我后边说的是HS嘛,不是我说的是海多生态对吧,那海陆生态我里边能存数据的有啥呀。
05:00
Hfs啊,那hi物实际上也也能相当是能管理数据对吧?啊,那还有h base是不是也能管理数据啊,对不对,那那这个所谓的海动生态指的就是他们啊,那也就是说实际上我这个S库能怎么办?能从啊MYS里边录数据啊,数据呢,能够直接写到HDFS的一个路径上边,也能直接写到have的一张表里,也可以直接写到H辈子的一张表里。啊,是这样的啊,那假如说我现在要想往have里边写。那他是不是需要用到咱们的have啊,对,他实际上如果要真往have里写啊,其实它底层逻辑很简单,它里底层逻辑是什么呢?也是先把数据写到一个路径里,然后呢,再给它load到have表里,你要想执行load语句,是不是得执行一个什么have-e load,你就得用到have,所以说哎,这边得给它配一个have这样的一个东西啊,然后下边这个组kper,咱们配它干啥?配组K干什么?
06:02
哎,为什么要配一个组合一块,这个能不能想起来。哎,没错啊,咱们是不是刚才也说了,我数据也能写到hpa里对吧?要想往hpa里写数据,那只要拿到组K的配置是不就行了,只要知道能找到组K,我就能在组K里边找到咱们那个,呃,H base的什么master region server是不是就能往h base里写数据了呀?是这样的啊,所以说咱们给他也配一个,虽然我们现在集群当中没有配H位,但其实无所谓,给它配上也无所谓啊好,那咱咱们把这几个属性呢了解一下就可以了,行,那shift z z保存,那现在我们已经完成了此库部署的第一件事了,那接下来另外一件事就是在scoop的力目录下边放上my circleq的JDBC驱动啊,来,我们看一下啊,这个文档上也有啊,那咱们照这个去做一下就行,我们那个JB的驱动在哪放着,我应该是放到了OPT software啊,然后MYSO里边对吧,这里边应该是有一个呃,Myq connector啊,咱们把它拿过来就行,放到哪,放到力蒙录像啊,然后回车啊,应该已经进来了啊进来了好,那到现在为止呢,我们此库应该相当于就已经完。
07:07
成了这个,哎,部署了啊,已经完成部署了,好,那现在我把这个视频录一下啊。
我来说两句