00:00
大家来注意啊,那这个deepline呢,你要知道呃,它是一个什么东西,它是一个BI工具,BI工具是做这个商务智能分析的,对不对啊,那其实给谁用的呢?也是给咱们这个数据分析师去使用的。就是说呃,它这个东西呢,它是一个呃,能够兼容各种各样的数据源,对接各种数据源,然后呢,在这个zip当中呢,你能够做各种各样的交互式查询,什么叫交互式,就是你写代码,然后出结果,写代码出结果,然后这个结果呢,它能够快速的给你以你想要的这种图形化的方式给你展示出来,那你你能够更方便的去观察这个数据的规律。是这样的一个东西啊,这是Z也是给分析师去去使用的,它跟我们那个super set呢,还有点区别,咱们super set更多是干什么,更多其实可以做这种可视化。对不对,因为它有什么,它有自定义的仪表盘对不对,你可以自己去定义布局等等这些东西,我们能够非常好的出一个图,对吧,但是咱们zipline呢,它不是干这个事的,Zipline它是没有这些什么仪表盘这些东西的,没有我们zipin就是为了分析数据的,分析数据是这样啊好,那现在咱们看看这个zipin怎么用zipin呢?它安装也是由它这个开发,也是由这个麒麟的开发团队开发的,所以他这个安装方式基本也类似啊,傻瓜式安装就直接解压,解压即可用。
01:15
好,那现在咱们去给他做一下啊,安装包呢,我也是提前上传到了这个,呃,我的集群上面,那大家应该在自己的资料里边是有他的,然后这。C到obt model也解压一下,那这个其实它比较大哈,因为它需要去兼容各种各样的数据源,它有各种依赖,有你看这块有什么,有Spark对吧,有Spark有什么下边其的其他一其他的一些东西。有Python有pig对不对啊。还有什么Li这些东西,其实它这个都能对接search等等这些东西都行,OK,那咱们接下来呢,那咱们接下来呢,呃去呃,看一下咱们这个东西怎么去使用啊,这不好意思,我家小狗又发又发疯了,又叫起来了啊好,那现在呢,我们去炖了,今天中午看看那个怎么炖比较好吃啊好,已经解压完了,煎完之后呢,咱们去进到这个,呃,咱们的zip啊OBT,然后model这个zip。
02:22
春天到了,我天呐,可以啊,这个你都懂来,那现在我们看这个ziplin怎么启动,那启动的时候呢,在这个并目录下边有它的启动脚本,有这样的俩啊,一个是zipin DEMO,一个是ziplin,那这俩都能起,只不过这个是退到后台,这个是组织在前台,那我们就退到后台的方式去启动它b ziplin,然后杠点SH行这个start启动。好,那现在大家看一下啊,启动完之后呢,这边会出现这样的两个东西,一个是什么?一个是这个,呃,Z的这个日志路径,一个是它的PID路径APID路径,那我们知道去哪看日志就行了啊在这看好,那这个启动完之后呢,接下来我们去访问一下它的外部页面,它启动可能比较慢啊,可能比较慢,我们可能需要去等一会才能访问到这个页面,那个默认顿号是8080,那这个呢,呃,你可以把它那个可以修改,顿号是可以修改的啊。
03:14
那我们现在呢,去这个访问一下这个页面回车。呃,OK,那这个页这个刚刚启动啊,刚才可能没有启动成功,现在刚启动,那启动完之后呢,我们来看看这个Z怎么用,其实这个位置呢,有这个Z的一个total,呃,这是他的那个教程,你打开是有这个相关的教程的啊呃,这个官网上也有,官上也有,那这边我们简单给大家入一个门,看看到底这个什么叫做数据分析,这个BI工具到底怎么去使用来,那其实就是在这在这啊点这个位置,这个位置呢,我们这有一个这个概念。这什么东西呢?是一个这个,呃,Interpreter有一个这样的这个东西是在Z当中,什么意思呢?是解释器的意思啊,这不是拦截器,是解释器,那解释器解释什么呢?就是因为咱zip,因为能够对接各种各样的数据源,对吧,我不同的数据源需要配置不同的解释器。
04:05
是这样的啊,那所以说咱们现在要对接麒麟对不对,那我就需要去对接一个logo是火箭,呃,这个看似是一个火箭啊,这个这什么意思,你可以查一查来,那我们去对接麒麟,需要去配置一个麒麟的解释器,点它。连完之后呢,那大家来看这个位置啊,这里边有他支持的所有的数据源,这边我们找找大家大家认识的吧,找找认识的,呃,K这个虽然大家不认识,但其实这个东西呃,大家应该也应该知道,应该了解一下啊,这个东西是谁呢?这个东西是跟我们这个h base是同样的道理。他俩都是这个,他俩都是什么,都是这个,呃,咱们那个谷歌的big table这篇论文的开源实现,它跟那个h base很像的,跟H很像的,好,那现在呢,我们往下看。还有没有其他的,比如说ES这些东西,其实在大数据分析当中,诶也是有使用到的,也有使用到啊ES然后下边呢,呃,有本地文件哎,能够对接flink哎等等什么h base都能对接,但只不过现在这个咱们Z部的版本跟咱们学的h base版本不兼容,这个对接不上,我这个试过啊,然后下边呢,呃,JDBC的方式等等等,诶然后那个麒麟我是能直接对接的,好,那现在呢,我们要干什么,我们要用的是麒麟对不对?那所以说咱们需要编辑一下麒麟的解释器。
05:21
好,那拉到最底下,其实这可以搜啊,咱们搜一下KLA,好,那麒麟出来了,出来之后呢,我们需要去点一下这个右上角的ID编辑。那这里边需要去编哪些东西呢?其实主要是咱们的URL,还有咱们的用户名和密码以及project,这样才能对接上咱们自己的Q吧,那这边咱们首先这个用户名密码默认就是大写的mid,大写的麒麟不用改,那咱们把local改local host改一下就行了,来海DOOP102。好,其他不用动,你看啊,这你看啊,这个zlin,其实他去对接咱们的麒麟,使用的是麒麟的什么东西,其实使用的是麒麟的是不是那个rest KPI啊,你看是不是KAPI后边一个query,其实就是rest tpi CPI啊好,那其实咱们自己去开发这样的一个可视化的框架,这个BI工具你也能开发,你也去访问麒麟的re CPI就行了。
06:14
是这样的啊好,那完了之后呢,下边这个域名用户名不用改,那这个地方得改一下,这是那个project,咱们学给它改成g ma集贸,好,那这样一来咱们就完事了,最后点击左下角的save,点击保存,点击OK,那现在呢,我们这个Z就已经,诶对接好了,咱们这个麒麟了,对接好了,那现在呢,我们应该是呃,要打开C的工作界面给大家看一看,到到底说咱们这个所谓的数据分析,我应该是怎么去分析,来点一下这个notebook。诶,这个notebook什么意思,笔记的意思,笔记的意思啊,其实这个zip它是一个,呃,就是类似于一个笔记的这样的一个B工具,什么叫笔记,笔记是不是一行一行的呀,那一会进到页面之后呢,你会发现诶诶敲敲一行代码出一行结果,敲一行代码出一行结果,这个结果能能能出图,能出图大致就是这样的一个东西,那这个东西是跟跟谁很像呢?其实跟我们那个就是不知道大家有没有这个了解Python的啊,那Python当中其实就有一个这种笔记式的这样的一个呃分析工具,那个工具叫做朱皮特。
07:17
朱啊,这其实在Python当中还是用的比较多的,也是做数据分析的,那zip其实跟它是很像的很像的啊。好,那现在咱们点这个notebook,然后接下来呢,咱们需要去创建一个新的notebook,点击那起个名字,比如咱们就叫做g ma报,然后后边呢,需要我们去指明一个default interpreter,诶,默认的解释器,那咱们选谁呢?选下边的K,选它选完之后点击create。好,那接下来我们就来到了他的这个工作界面了,那这就是一行笔记,那我们也就是说我要做数据分析,我要去观察数据的时候,做交互查询的时候,就在这写就行了,写色后出结果,写色后出结果,那能够非常方便的去分析数据啊,那这边比如说呃,咱们对接的是麒麟对不对,那你对接麒麟你写的代码就应该是什么,你你写代码就应该是咱们麒麟的这个circle口对不对?那你对接别的数据源,你比你比如说你对接你对接Python,那你就需要去敲Python代码。
08:11
对不对,你对接Spark,那你就需需要去写Spark代码,对吧?那所以说你对接不同的数据源,需要敲不同的代码,那这边它都是能支持的,好,那现在我对接的是麒麟,所以说我应该敲circle,那circlel咱们还用,刚才那circle还用这个,那来来到这个位置,然后CTRLV,然后呢,咱们点右下角这边有一个run来开始。那这个数据是不是就出来了呀,那出来之后,那我们光看数字其实不太好看出来这个所谓的数据的规律对不对,那怎么办呢。看到这个位置没有。这一串这能干直接展成图,能够直接出图,能够直接出图,这不是一个数据库客户端嘛,你不能这么去理解啊,不能这么去理解,不能这么理解啊,你看咱们点图点这这样呢,能够直接把你的数据呢,给你以这种图形化的方式展示出来,那这样我其实就能够非常方便的去查看这个数据的规律了,当然对于这个来说呢,可能我们用用谁更好一些,用饼状图是不是更好一些呀,对不对,那比如说我西北地区36%,那这个9%,这个29%,诶这个华中呢,26%。
09:16
是这样的啊,就是他能够,诶就是帮助咱们的这种BI分析师呢,能够快速的去去查找咱们这个数据的一些规律,这是比较比较不错的,那比如说后边呢,可能有一些趋势,诶咱们这呢,还有还有折线图,当然这个用折线图展示不合适,咱们这个合适就要用饼状图合适。是这样的啊,好,这个就是咱们这种所谓的这个这个BI分析工具,呃,这不是什么数据客后端啊,这跟那个差远了太远了啊好,那这个就是咱们Z林的一个基础的一个使用方式吧,呃,然后呃,大家要注意啊,咱们这个笔记,这个笔记刚才咱们建笔记的时候,不是让咱们选了一个默认的那个什么解释器嘛,对不对,那既然是默认,我是不是也可以不让它用默认的呀,对不对,其实我们在这里边可以切换解释器,那比如说我现在就想切换一下Python,怎么办呢?这么办啊,来敲一个百分号,然后PYTHN加上你那个解释器的这个呃名字。
10:08
那这样一来就相当于我用的是Python解示器,那后边你就可以直接去敲Python代码了,比如说print,那这是呃,Python当中的一个打印语句啊,比如说hello word he l,然后空格W,呃,Or LD hello word,那现在呢,你其实就可以去执行这个Python代码。然后呢,这个派th hello word就打印出来了,是这样的啊,这其实这个功能还是比较强大的,这其实非常不错,非常不错啊好,那咱们这个所谓的BI工具呢,就给大家简单的介绍一下,就这个东西呢,其实可能我们,呃,咱们作作为这个大数据开发来说,其实可能用不太到,这更多是数据分析师去使用的,他们去用的啊。那把视频录一下。
我来说两句