00:00
好,看一下这个ZLY,呃,这个ZLY呢,首先给大家说一下它是什么啊,它是由麒麟的开发团队哎,贡献的一个BI工具啊,BI工具,那BI工具是不是都具有以下这样的特点,什么特点能够对接各种各样的数据源,然后呢,是不是能够快速的查询数据,查完之后能干啥呀,是不是能够立即以图表的形式给咱们展示一个结果呀,方便我们做分析嘛,啊这是咱们这种BI工具所具备的共用共同的几个特点啊啊,那现在这个zipline它也是一个这样的工具,所以它也具备这样的特点,好,那现在咱们演示演示这个所谓的BI分析的这个步骤到底什么样的啊,那咱们看一下,首先呢,我们需要先将ziply安装一下,那这个ziplin安装呢,跟麒麟的安装啊,这个方式是相同的,我们也是解压直接用就可以了,解压直接用啊来我们先找到Z麟的安装包啊,CD到OPT software k好,那这里边是不是有一个zip里,那我给它解压啊,Per-ZXVF,然后呢,Z里杠杠C到opd model走。
01:01
啊,这个安装包比较大啊,因为它里边是不是它需要对接各种数据源对吧,所以它里边依赖的驱动就比较多啊,稍微等会吧。那检完毕,那检完毕之后呢,我们C到OT model好,那这个进到Z吧啊ZP进到Z好,这个名字咱就不用改了啊,进到这里边来之后呢,我们来看一个东西啊呃,咱们正常来说,现在不需要做额外的配置,我们就可以启动这个ZP林了,但是大家要注意了,启动Z0之后呢,它会有一个web页面啊,那它web页面所占用的端口号是多少呢?8080啊,8080,这个8080其实是啥呀,是咱们那个呃汤K默认的端口号对吧?啊8080啊啊,那这个正常来说,你在那如果说呃没有其他这个服务去使用8080端口,那Z去用其实也没有问题对吧,也没有问题,但是不巧的是什么?不巧的是我们的组K其实是有可能会占用8080端口的。
02:03
组K班是有可能会占用的啊啊组块有可能占用,那是哪组K班哪个节点会占用,咱们组K是搭了一个集群呀,对吧,哪个节点会占用8080灯口呢,Leader节点啊leader节点,那我们现在呢,查看一下这的S。啊,你看啊,我们现在leader在哪条节点是在103,哎,你可以去查看一下103有没有占用8080啊,我们怎么查是不是night state TT,然后呢杠TP,然后呢gra一下8080是不是就行8080回射。你看这个端口是不是现在被监听,说明这个端口现在已经被占用了吧,对不对,那假如说你的,因为咱们那个leader是不是可以会重新选举啊,对吧,假如说你的leader恰好就选在了102学界,那是不是就冲突了呀,所以咱们为了避免冲突,在这呢,我们可以改一下这个zlin的动口号啊,我们进到zlin的康目录,修改一下它这里边的这个文件。Zipbling set,当然这里边有template,咱们需要怎么做把template去掉啊,要不然不生效zipbling set.sm改成zip,然后set把这个template去掉,好改完名字再修改这个文件。
03:10
Zipin,然后呢,Set打开这里边呢,我们搜一下port啊portt动口号呗,来,那接下来是不是就找到了zip so port默认是多少啊8080,咱们给它改成。随便改就行啊,比如改成呃这个9090啊没问题吧,啊,我们shift zz哎,这个点击保存啊,完了之后我们就可以启动这个zipin了啊,咱们启动啊,怎么启动是不是bin下边呢?我们看看bin下边有啥有这个ZIPIN2个啊两个脚本,一个是zipin.z.SH一个是Z0.sh,那如果说你用它启动那日志呢,会。怎么样会存到后台,呃,会存在咱们那个日志文件当中,然后呢,这个进程是不是会推到后台啊,那你要用它启动呢,那日志会打印的控制台啊,然后呢,我们会阻塞在前台啊,那现在咱们为了方便查看会不会报错,我们用CSH启动啊,咱们start走。
04:08
那这时候咱就等着就行了啊,这会等着就行了啊,呃,他这个在外面启动的时候呢,同样也是会部署这个外部项目的啊,第一次启动比较缓慢,那我们要做的事呢,就是等啊,咱们就是等,多等一会儿就行啊,等它一会儿在页面上啊,如果说能够打印出来一大堆的这个呃日志,那就说明啊,呃,我们这块就启动成功了,咱们稍微等会儿吧。啊,已经出来了对吧,那出来之后呢,我们这时候就可以去访问了啊来我们访问它那个顿号,那顿号是多少来着,9090对吧,这是咱自己调的是吧,你调成多少就可以,当然在这个范围之内就行了啊,咱们根号范围是多少啊。多少是多少。多少一到65535啊对吧,但是一到一千一般是咱们系统啊,是不是预留的一些账号啊啊,你就不要用了啊,至少得1000以后啊来,那我们现在选什么9090啊回车。
05:03
啊,那现在我们就来到了zip的这个web页面了啊,这个zip它其实是一个类似于我们Python当中的一个分析工具啊,Python当中有一个叫做呃朱笔特的一个呃分析工具,那个朱笔特呢,其实是一个什么形式呢?是一个笔记式的啊,就是这一个页面嘛,一个页面,然后里边呢,相当于一个笔记本里边的一页一样,那里边呢,你有一行一行的这个本,然后你看在每一行里边的去写这个代码,然后呢,你可以执行这个代码查询结果啊是一个这种形式的这个zip呢,跟它很像很像啊好,那现在咱们演示演示这个怎么用啊,首先我们使用zip呢,需要先对接数据源,没错吧?啊,那怎么对接呢?点右上角,右上角的这有一个概念叫做interpreter,这看清楚啊,这不是intercepter啊,Intercept是连接器,是那个拦接器对吧,那这个是啥呀。这是啥呀?是解释器啊,Interpret不是解释的意思吗?Interpret就是解释器,每个数据源都需要一个解释器啊好,那现在咱们点击解释器,那点完之后呢,这里边会把它所支持的所有数据源都给咱们列出来啊,咱们看看有没有大家自己认识的啊,这个认识吗?不认识,这个也不认识,这个也不认识是吧?那其实这个也是咱们大数据当中的一个查询引擎啊,不认识拉倒,那下面这个可R那这个呢,这个也不认识,但是这个呢,其实呃,这个你要想学的话很容易,为什么呢?因为它和我们大家学的那个h base一样,也是基于谷歌的那篇big table论文而来的啊,所以里边很多概念都是相似的啊,呃,他们俩是很像的,这也是大数据里边的一个组件啊,那往下翻。
06:39
爱人。Electric search ES啊,这个后续咱们会学的啊,那接量往下走,这个认识吧,文件对吧,我可以直接分析文件啊,这也不认识这个呢,Flink这个也也会学的啊,H base这个你要说不认识,那有点对不起我了,H base啊,它也能对接啊,也能对接,那下面呢,还有其他的东西啊,什么JDBC的形这个协议啊,诶K列是不是也能直接对接系麟啊,对吧?那这边我们要用的就是谁,就是这个麒麟,那当然你可以直接在这进行修改,或者说你要不想这样一个一个找,那上边呢,我们这儿是不是有过滤条件呀,我们直接KYLAN麒麟是不是就找到了,那当然这个麒麟我们可以看一看啊,它对接麒麟的时候,它采用的是麒麟的哪个端,哪个那个接口啊。
07:24
是接PC接口吗?不是吧,你要写JDBC是不是得写JBC,什么uri啊U任pass是不是得写那些东西,你那有那些东西吗?没有,你有的是啥K0点api.url这个东西大家熟悉吧。Killing API query,这就是啥?这是不是就是咱们查询的那个rice API?对不对,那所以他这对接麒麟所采用的麒麟接口,那就是它的RCPI接口啊好,那当然这里边咱们需要修改一下里边的参数啊,点击右上角这个ID。点完了之后,这里边哪些东西需要改啊,首先第一个要改的主机名得改吧,海豆102后边用改吗?后边不用改啊,那这个什么api.pass word的和它这个user默认就是大写的文面,大写的K,点这个不用改,还有谁要改一下。
08:14
Product是不是得改一下,那我们得改成自己那个机ma对吧,那OK,其他东西就可以不改了,往下拉,拉到最最下边有一个save,点击保存好,点击OK,好,那解释器咱们就配好了,配好之后呢,接下来我们就可以进入到这个在Z的这个工作界面了,咱们就可以开始这个数据的这个所谓的一个分析,一个探索了,那咱们分析啊来这边有一个notebook,对吧,Notebook notebook是不是就是笔记笔记本,那这时候呢,我们create new note新建一个笔记点。完到时他可以起个名字啊,比如叫机贸啊笔记本的名字,那下面是不是有一个default interpreter默认的解释器,对吧,咱们选谁选麒麟呗,你对接谁不就选谁,咱们选麒麟啊,选完之后呢,点击create,那这个笔记就建好了,那你看啊,这是不是就是相当于是笔记本当中的一行啊,那这一行完了之后呢,还可以有下一行啊,是这样的啊,那咱在这就可以解啥了。
09:06
是不是写circle考,那我们就把之前那条circle还拿过来就行了啊,这就是我们之前查一下circle还在我剪贴简题板里啊,我直接拿过来就行了啊,那完之后呢,我们现在就可以直接执行点单。已经在这个running了啊,稍微等一下,你看结果是不是又出来了,结果出来之后呢,我现在要想这个,哎哎,准确的分析一下这里边的一些规律,那怎么看点上面,你看这样啊。这是不是有班叉的柱状图来,你看谁最高谁最低,是不是一下看出来了,那这还有什么饼状图派叉的,你看这个百分比是不是也能看出来啊,这个19%,这个26%等等等等,那后边呢,还有一些这个什么area chat,这个是LA chart,这个就是折线,折线啊,那后边还有这个呃,散点图啊,散点图等等等等,这个呢,实际上是比较强大的啊,这个做所谓的这个是所谓的边缘分析嘛啊,那当然如果说你这个看出看不出来有什么规律,OK,我再来接着查询,接着探索是不是就可以了呀,那你对接什么样的数据源,你就敲什么数据源的API就行了,我对接麒麟就是写circle,我对接s Spark,我就敲Spark的那个算子,我对接flink的,我写flink算是不是一样,应该是不同的数据源有不同的API啊,对吧,是这样的啊,那这就是所谓的BI分析的一个工具啊。
10:22
好,那这个咱们就讲完了,那当然呢,你在这里边,呃,是不是一个笔记,我们有一个解释器啊,对吧,那这个笔记我对接的就是麒麟是不是,那如果说我想对接其他数据源,是不是还得再建一个笔记啊,对不对,当然那样相对来说要麻烦一些,我可能我想在同一个笔记当中,我同时从多个数据源查数据,对吧,我这个从麒麟查,那接下来我还想去从别的数据源查一下,那怎么办呢?诶,你可以可以这样去做啊,因为你在建那个笔记的时候,你选的那个解释器叫做默认的解释器,既然有默认的是不是你也可以在在指定其他解释器啊,对吧?那怎么指定呢?百分号,百分号再加上其他解释器的名字就可以了啊,那在这我们演示一个比较简单,比如说演示那个Python啊PYN,那这个相当于你下边要敲的代码,那就是啥的呢?是就是使用Python那个解释器了呀,也就是你那可以敲敲Python代码啊,咱们这个pyon那家可能不熟,我们挑一个最简单的来print就打印呗,对吧,打印一个什么呢?打印一个hello word hellolo l hello word,那这时候呢,我们运行走。
11:30
嗯。啊,那是不是hello word就打印出来了呀,对不对,当然这里边呢,你也可以去引入Python当中的库,也可以通过Python去对接各种各样的数据源,做各种各样的分析展示都是可以的,啊是这样的,那这个就是咱们这个zip的一个使用方式啊,那我把视频录一下。
我来说两句