00:00
好,那接下来呢,我们就正式开始学习supers的使用啊,那我们首先要做的呢,其实就是对接数据源啊,那对接数据源的第一步呢,就是安装驱动啊,对吧?而且我们对接不同的数据源呢,诶是需要安装不同的驱动的,那我们具体应该安装什么驱动啊,这个驱动又应该如何安装呢?啊这个呢,我们可以去super的官网看一下啊来,现在我们打开super官网啊,那之后呢,我们点击。那再然后呢,点击connecting to database点点完之后呢,点击下边的installing database drivers啊,点一下啊,那点完之后我们往下拉啊,下边呢,有一个列表啊,这个列表当中呢,就包含了supers set所支持的所有的数据源,以及每个数据源所需要的这个驱动的信息啊,比如说大家看这儿啊,那这儿是不是有一个阿法奇haveve啊对吧?这个指代的就是have这个数据源啊,那我们要想对接haveve,我应该安装什么驱动呢?诶,咱应该安装一个py haveve,那这个东西怎么安装呢?很简单,只需要我们执行一个派因斯道py haveve就可以了,那除了这个haveve是不是还有什么德鲁伊啊,In拉麒麟等等等等,对吧?那这些是不是都是常见的大数据的分析引擎啊,对吧?啊,那除此之外呢,我们再往下看啊,那下边呢,还有几个关形数据库啊,也是大家比较熟悉的对吧,比如说my circlele Oracle post gra circle等等等等,然后后边呢,就是这些数据库所需要的驱动的信息啊,那比如说我们现在要对接的。
01:30
是不是就是买circle啊对吧?那所以说我们应该安装的是什么驱动,是不是就是买circle client这个驱动对吧?怎么安装啊,是不是就执行typepe in install买circle client就行了,对吧?其实很简单啊,然后呢,我们打开文档啊,来看一下文档当中的这个驱动的安装命令,注意啊,咱这是啥,是不是conduct in install my circleland的呀,对吧?那官网市啥官网刚才咱看了是PA in store对吧?诶那为什么我们这采用的是康in store呢?诶这个我给大家简单解释一下啊,由于咱现在这个super呢,是不是安装在了一个由创建并且维护的Python环境当中,没错吧?那所以说我们使用去安装这个驱动,诶它是不会有兼容性问题的,那如果说我们不使用康啊,然后呢,去使用PA安装对吧,那这个就可能会出现一些兼容性问题,当然呢,这个只是可能也不一定对吧,那所以咱这儿为了保证没有问题啊,所以采用康达因此道去安装我们所需要的这个驱动啊,然后呢,还有一点需要大家去注意啊,就是我们在执行这个。
02:30
安装命令的时候呢,必须得位于super set这个Python环境下,还有我们安装完这个驱动之后呢,诶必须得重启super set才可以生效啊,那当重启呢,使用咱之前创建的这个脚本是不是就可以了,对吧?好,那接下来呢,我们去操作一下啊,那首先我们需要执行这个康达inl的命令,对吧?来咱CTRLC给它粘出来,那之后呢,我们来到HIDE102,大家注意啊,现在我是不是就位于super赛的环境下对吧?好,那我们执行来回车。啊,这个可能会比较慢,大家稍微等一会儿啊。
03:01
然后我们输入Y,然后回车。好,那这个驱动现在就算是装上了啊,然后大家千万别忘了啊super set咱是不是得重启一下啊,对吧?来咱们把这个重启命令执行一下,CTRLC来我们拿过来来执行。好,那现在super set就已经重新启动了啊,然后我们再去访问一下super set的外部页面啊,来我们刷新一下。啊,好,那现在能够正常访问对吧?诶,那就说明super已经重启成功了,OK,那接下来我们就可以去对接数据源了啊那具体怎么操作呢?来大家看这儿啊,这儿是不是有一个date呀,对吧?啊,实际上这个date就是我们对接数据源的入口啊来,我们把鼠标指向它,指向它之后呢,大家能看到这一共有三个选项对吧?来,分别是database啊,Database size以及upload a csv对吧?来来,我们先看前两个啊,那前两个分别指的是什么呢?啊,我们先看database啊,实际上这个呢,指的就是我们要对接的数据库啊,那下边这个database size呢,其实对应的就是我们要对接的表啊,那想一想,我们有了数据库,有了表,是不是就已经能够明确我们要对接的数据了呀,对吧?啊,OK,那接下来呢,我们再来看这个upload csv在这儿呢,我们可以通过这个选项呢,直接给super set上传一个CSV文件啊,然后呢,我们就能够使用super来去分析和展示这个文件里边的数据了。
04:23
啊,因为我们现在要对接的是my circle数据源对吧?那所以说我们首先要配置的是不是就是这个database啊,对吧?好,那现在我们去配置一下啊,来点database,那正常这里边会列出我们所对接的所有的数据库啊,但现在我们一个都没对接对吧?哎,所以这里边是空的啊好,那现在我们点击右上角的新建database点那点完之后呢,我们需要在这里边填入一些必要的属性啊,其实主要就是两个,一个呢是一个display name啊,一个展示的名称,对吧?那具体是谁的名称呢?诶,实际上就是我们要对接的这个数据库的名称啊好,那接下来我们看下一个啊,下一个呢,实际上就是我们对接这个数据库的一个uri啊,那注意这个uri呢,和我们之前所学习的界力BCU是不一样的,对吧,它是不同的标准,对吧?因为界力BC当中的界是不是特指Java程序啊,对吧,那咱这个super它是不是由Python语言编写的呀,对吧?那所以说这个标准肯定是不一样的啊,那这个具体的格式是什么样的呢?大家来看这儿,那是不是已经给我们提示出来了呀,对吧,那我们要。
05:23
做的呢,就是根据这个格式去填入哎相应的内容啊,好,那现在我们来填一下啊,首先我们先填一下这个名字啊,就叫做jama report就可以啊好,那接下来呢,我们再填下边这个uri啊,这个uri呢,我们不用再自己写了啊,文档当中已经给大家提供好了,来我们去找一下啊,来就是这个。来,CTRLC咱拿过来啊,拿来之后呢,给大家简单解释一下啊,首先前边啊,这个my circleql是不是就表明我们要对接的是my circleql数据库啊,对吧?然后面呢,就是我们的用户名和密码,这个呢,大家需要根据自己的实际情况来进行相应的修改啊,然后再往后呢,诶,这是不是就是数据库的主机名端口号啊对吧?然后边呢,就是我们要对接的数据库jama report,然后再往后呢,诶,我们还给它传入了一个参数site等于UTF8,这个大家要注意一下,好,那填完之后呢,下边是不是有一个test按钮了,对吧?来咱们点一下,那如果右下角出现connection looks good这样的一个提示,那就说明我们现在这个数据呢就已经能够连接上了。然后这儿有一点大家需要注意一下啊,就是不同数据源这个uri的前缀是不一样的啊,那这个应该怎么确定呢?啊来我们还是去看一下super的官网啊,还是刚刚那个页面啊,大家注意观察啊,这个列表里边是不是有一个第三列对吧?那这个第三列啊,是不是就给我们展示出来了不同数据源。
06:40
的URA的前缀啊,对吧?OK,那大家诶,在使用super set去对接不同数据源的时候呢,诶可以来这儿参考一下啊,这个大家注意一下就行啊好,弄完之后我们再回到superset的工作界面啊好,那现在我们把这个页面往下拉,下边有一个爱的按钮点击啊好,那现在这个数据库的连接我们就配置完毕了,那接下来呢,我们就可以去配置具体的表了,对吧?啊,那表怎么配置了?哎,也是指向data,然后选择第二一个选项,也就是data set对吧?诶点一下。
07:10
那点完之后呢,这里边正常会展示出来我们所对接的所有的表,对吧?那由于我们现在一个都没有,所以是空的啊好,那现在我们点击右上角的新建data site啊来点一下,那那点完之后呢,大家能够看到一共有三个选项对吧?分别是data source啊,Chema以及table对吧?那这个data source指的是什么啊,其实指的就是我们刚刚所配置的数据库的连接啊,那这个s scma呢?诶,它其实指代的就是我们数据库当中的data的概念啊好,那完之后呢,下边这个table,那不用多说,诶,就是我们那个表的概念对吧?好,那现在我们逐个的填一下,那第一个呢,选择我们刚刚创建的jma report这个连接就没有问题对吧?好,那完之后第二一个,第二一个我们应该选择谁啊,是不是应该选择JA ma report这个database对吧,那之后呢,就是选择我们这个库下边的具体的表了,对吧?那现在我们先选择第一个a province完之后呢,我们下拉点击添加啊。
08:05
好,那现在我们就已经能够对接上一张表了,好,那接下来呢,我们按照相同的方式把另外三张表也给它对接上啊好,点击加data set之后呢,选择下边的第二一张表,然后往下拉,点击艾啊好,那我们继续往下进行,好,那选择第三张表,然后点击啊好,再点击加data set之后,下边呢,选择最后一张表,点击艾啊好,那至此我们这四张表就全部都对接上了,那我们对接数据源的工作也就完成了。
我来说两句