00:00
好,各位同学,我们继续学习super set啊呃,在前面我们已经完成了supers set的部署和启动了,对吧?啊,那接下来呢,我们要学习的就是supers set的使用啊,是这样的啊,那现在呢,我们先看一下我现在这个super set有没有运行啊,来使用我们之前那个脚本对吧?执行一个super set,呃,这个点s status正在运行对吧?那现在我们访问一下它的界面啊,来海豆吧,来一个102,咱们之前那个逗号是多少啊,是8787对吧,8787OK。哎。海杜102冒号八七,呃九八是吧,应该是8787啊推车啊,那现在呢,我们登录一下啊呃,还是使用我们之前创建的用户登录就可以了啊,那现在呢,我们先简单看一下这个super size的工作界面啊呃,大家看上边这个位置就可以了啊,大家一起看一下啊那这里边呢,一共有四个标签页对吧?我们先看第一个,第一个是什么,是不是就是data呀,对吧?那我们指向他看一下这里边有什么,有两个概念啊,一个概念呢是data base,那还有一个呢是data set data分别是啥?给大家简单说明一下啊,那我们super set它作为一个BI工具,它首先你你说你使用它的时候,你首先要干啥?是不是就是对接数据源呀,对吧?啊是这样的啊在superet当中呢,我们啊,一个数据源,哎,我们称之为一个这个呃,相当于database,比如说举个例子啊,我们现在要对接my circle,对接my circle,你是不是首先得先对接到我们MYL当中的一个数据库里边啊,对吧?对到一个库啊database呢,我们诶相当于是一个库,那下边还有一个data。
01:33
Size对应什么概念呢?啊,你可以这样理解,它就可以对应我们库里边的一张一张的表,一张一张的table啊,就是这样的一个概念啊,那一会儿我们要使用super,首先咱是不是就得对接相应的数据库以及相应的表啊,对吧,这个理解一下,然后下面呢,这块还有一个东西啊,什么东西upload a csv,什么叫CSV。其实很简单,CSV呢,是不是就是comma separatebr的啊,对不对,Comma什么意思,逗号对吧?S呢,不是就是以些风格啊,对吧?那也就是说以逗号风格的这种文件啊,我们是不是也可以直接上传这种文件,然后呢,用superet去做分析啊,对吧,是这样的啊啊那当然我们通常情况下用的就是前两种啊好,那接来往下走,下边有个概念叫做charts。
02:18
Chars啥意思?这好理解吧,是不是就是图图表表格对不对?比如说什么柱状图啊,饼状图,折线图等等等,这都叫chars啊,下一个dashboards dashboards呢,其实就是我们前面提到那个所谓的看板对吧?啊,或者叫做仪表盘啊,我们可以往这个看板里边呢,放各种各样的图表啊,好,再往下走,下边呢,这儿还有一个circle lab,这里边是什么呢?给大家解释一下啊,前面提到过,我们说superide呢,它是一个什么来着?是一个BI分析工具对不对?那BI分析工具我是不是必须得有一个地方去写查询语句,然后做数据的分析与展示啊,对吧?哎,这个circle lab呢,就是负责这个功能的,哎,大家理解一下就行了,那当然了,我们现在使用super作为什么?是不是作为我们数据仓库的可视化的一个工具啊,对吧,所以我们其实重点要使用还是使用谁呀,是不是也就是前三个对吧?啊对接数据源啊,画图,然后呢,这个呃,拼接咱们这个最终的仪表盘基本上就是这些啊好,那这个简单了解一下就行了啊好,那接下来我们就开始正式学习supers set的使用啊,那刚才。
03:18
也提到了,我们使用super第一步是不是就得对接数据源啊,那咱现在的数据源其实就是我们之前往买serve当中导入的那个统计结果对不对,应该是哪个库啊,就是那个jama report对吧?啊,咱们要对接就是它啊,OK,那当然了,在我们对接这个MYQ数据源之前,我们需要先安装一个什么呀?啊,一个依赖其实就是一个数据库的驱动啊,这个大家一定要理解一下啊,其实你你这这个很好理解,你比如我们之前学过这个JDBC对吧?啊,你一个加入程序,那我要想去连接这个ma数据库,是不是也得有一个驱动啊,对吧?那在这儿呢,这个Python程序要连接数据库呢,也是一样的道理啊,那所以在这儿呢,我们就先安装一个驱动,这个驱动的名字是什么呢?
04:02
My client啊my client啊,完了之后在这我们用谁安装啊,在这呢,用的是这个康,前面提到过啊,这个康达它是一个什么?是一个包管理器,也是一个环境管理器,对不对,那现在我们其实是不是也可以用它去下载我们这个所谓的一个包啊,对吧?这个大家理解一下就行了啊啊那这块有一个小细节,大家一定一定得注意一下,注意什么问题呢?大家看这啊。前面是不是有一个super set,也就说明我们一会儿去安装这个驱动的时候,必须得位于super set这个环境下才行,这个千万别忘了啊,要不然你装上之后没用啊啊,那现在呢,我们给它安装安装一下,那要想在super环境下安装,首先我们得干啥?是不是得激活super环境,还记得怎么激活吧,是不是康HT对吧?Act,然后呢,后边来一个super回车,好,那现在前面已经出现了super了啊,接下来呢,我们使用这个康install master client命令去安装一下我们所需的驱动,CTRLC来,我们给它拿过来粘贴,然后回车。
05:01
那当然这时候呢,还是需要去联网的啊,当然这个包很小,很快就能下载完啊,是这样的啊,然后呢,大家呃,让他在这儿下载着就行了啊,我一下麦啊,让他在这安装着,然后咱们接下来去思考下一个问题啊,思考什么问题呢?大家想想啊,就是super呢,我们后续使用的时候,可能对接的不只要买circle对吧,我可能还会用它去对接其他的这个,呃,比如说数据源对不对?诶那你说我对接其他数据源,我应该如何去安装这个驱动呢?啊,你别说我对接的不是麦克了,我对接的是Oracle对吧,那怎么办?啊,下边写有说明对吧,那对接不同的数据源呢,需要安装不同的驱动啊,那下边呢,啊,这是这个官网的说明啊,那接下来咱们去看一下这个官网啊来,我把这个地址呢CTRLC粘出来一起去看一下啊。来,Control。稍微等一下啊。来已经过来了啊啊,那这个呢,就是superstar的这个官网啊,那呃,现在可能还没有加载完啊,这个显示的有点异常啊,当然也不影响我们看,大家来看一下啊,这个是什么?是不是就是它所支持的呃,数据库以及相关的依赖啊对吧?大家可以看一下啊,这个是不是database下边这都是super支持的数据源,呃,有咱们常见的这种关型数据库,非关系型数据库啊,还有一些这个大数据的分析工具,比如咱们简单看一看啊,从从头从头开始看啊,咱们找一个大家大家熟悉的来,这个大家应该熟悉吧,是不是have,是不是也能直接对接have啊,对吧?啊,为啥能直接对have,因为我们have是不是有have so to。
06:34
有黑氏度是不是就有GDBC协议对吧?啊在这儿呢,其实它根据的也是GDBC协议啊,咱们理解一下,然后再往下走,那还有啥,咱比如说这个什么引拍了,引拍了这个大家可能不是那么的熟悉啊,这个大家介介绍一下啊,In拍了呢,是CDH平台当中的一个分析引擎,速度很快啊,这个往下走下边还有一个啥。麒麟,这个麒麟呢,是我们,呃后边要学的啊,OK,那再往下呢,比如说Spark circle是不是也能对接呀,对吧?哎,我们就不再一个一个看了,比如click house啊啊这个后续大家可能也会用到啊等等等等啊,就非常多啊,数据源很多啊,那我们在这儿呢,需要使用啊,需要使用哪个数据源,需要对接哪个数据源,我们就执行什么,是不是执行后边的这个安装命令,去安装它所需要的依赖就可以了,对吧?那当然了,这个官网上它使用的这个包管理工具是谁?
07:24
啊是pip对吧,是PA,诶不是咱们前面用的那个康的啊,对吧?啊,这个为什么给大家解释一下啊,由于我们现在这个superide呢,是安装在由康达创建的这个Python环境当中,对不对?那所以说我们使用达啊,去统一的管理这个包啊等等等,这个是不是兼容性要好一些啊,对吧?啊是这样的啊,那当然在这儿呢,我们使用呃PA理论上应该也是可以的啊,当然了,不排除它可能会有一些这个依冲突啊,依赖冲突是这样的,那最稳妥的方式呢?诶我在康乐的环境下边,我就使用康的去安装我们所需要的各种包,这个大家就理解一下行了啊好了,那现在我们这个驱动应该是已经安装完了啊,大家就知道以后我要安装驱动化怎么装就行了啊,然后往下走,下边还有一部非常重要SUPERCA1定要重启一下,重启之后它才能加载我们新安装的这个依赖啊,那怎么重启,是不是还是用咱之前那个脚本就行,对吧,咱们脚本是有这个重启的功能的,对吧?来粘贴。
08:19
然后回车重新启动,重新启动之后呢,在这儿呢,我们再重新访问一下这个界面,这个界面啊,来重新。好,那现在呢,这个super赛已经重新启动了,重新启动了啊,那也就是到现在呢,我们这个所依赖的驱动就已经安装完毕了,那接下来我们继续往下走啊,那下边有驱动了之后,咱是不是就可以去对接我们所需要的数据源了呀,对吧?那刚才说了咱们对接数据源的时候呢,分两步,一步呢是对接数据库,一个一步呢是选择我们需要的表,对吧?好,那现在咱们开始来从哪对接,是不是点date对吧?Date里边先点先点database啊,那当然这里边理论上应该是一个database的一个列列表,对吧?但是现在呢,是空的对吧?那怎么办?是不是右上角有一个加这个database啊对吧?那我们创建一个点,那点完之后呢,这里边我们需要填入一些这个特定的信息,首先第一个display name什么意思?
09:12
展示的名称啊,这个名称啊,大家要注意啊,可能有同学会觉得,诶,这样这块是不是应该让我填我要对接的那个数据库的库名啊,是这样的吗?啊,其实不是啊,这个呢,其实跟我们那个数据库的库名没啥关系,你这儿起啥名都行,人上说的是啥是展示的名称,也就是一会儿我们创建完之后,这块是不是会有一条记录展示啊,对吧?是这条记录的名称啊,这个理解一下就行,那这边咱们随便写,比如说我就叫做G贸report吧,啊好,那完了之后继续往下走,下边需要写一个什么。是不是需要写一个咱们数据库的地址啊uri对吧?OK,那这个UI大家一定要注意,跟我们接DBC里边那个URL是一样的吗?它肯定不一样啊,什么叫借力BC啊,这个介是什么意思,是加吗?对吧?啊是这样的,但是咱现在是加吗?不是是Python对吧,所以它有自己的这个UI的编写规范,那这个编写规范呢,大家可以参考下面这个文档,你点一下啊,点完之后呢,会有相应的说明,当然在这呢,我们就没必要了啊,其实我们可以怎么做呢。
10:08
这是不是有提示啊,对吧,咱是不是这一个提示就可以了,对不对,在这儿呢,有一个前缀,这儿有一个driver,后边的是什么?用户名,密码,主机名,端口号,还有这个数据库名,后边这些内容我相信大家应该都能看懂,对吧?大家不懂的可能就是啥,就是前边这两个位置对不对,那这块应该怎么写呀。啊,这块不会写也没事儿啊,我们可以参考,谁可以参考super的官网,诶,你点到super的官网,还是我们刚才看驱动的那个页面啊,再往下翻这个列表里边呢,一共两列数据库名,还有驱动名,我们刚才都看了,你看后边。是不是还有一什么connect string啊,对吧,是这样的,这其实就是我们刚才看的那个前缀啊,好,那简单看一下,比如我现在要对接的是my circle,对吧?我们找到my circle往下翻,往下翻这是my circle对不对?那这块应该怎么写前面。是就是MY词和冒号就可以了,对不对,你比如说我对接的是Oracle呢,那时不是就是Oracle,那我要对接的是have呢,往上翻have怎么写来找到have在这呢,对吧,是不是就写have对不对?诶你就照着这个写就行了啊其实很简单啊啊,那当然MYS这边我们就写一个MYSQL就可以了啊啊那当然这个地址呢,我们在这也不用写了,我在文档当中呢,都给大家提供好了,我往下翻,哎这块呢,就是诶咱们需要填写的一个uri啊,那咱们给它复制过来CTRLV,那当然大家需要根据自己的这个数据库啊,去修改相应的用户名以及密码啊,那我这儿的密码是多少啊,我这是六个零对吧?所以说我需要123456改成六个零啊,MY口ROOT6个零,然后面的是不是主机名,端口号,主机名大家也要根据自己的实际情况去改一下啊,那后面这个是不是就是我们要连接的库啊,对吧?然后大家再注意一下,后边我们是不是还加了一个参数冒号char set等于UTF8,这个是为啥啊,因为我们要对接的这个数据库的表里边有什么呀,是不是?
11:54
就中文啊对吧,那所以在这儿呢,大家一定要记得,诶,这让他这个使用U发这个编码啊,啊那如果都填完之后呢,我们在这呢,可以点一下这个test connection,点点完之后,如果右下角出现了这个提示啊,Connection looks good,那就说明我们现在这个数据库是能连接上的对吧?好,那没问题,往下拉啊,下边这个有点显示有点不全,你往下拉,下边是不是有一个艾特呀,对吧?点击这个艾特就可以了啊,那现在我们这个数据库就算是对接上了啊,数据库对接上之后,接下来呢。
12:24
是不是又是表啊对吧?好,那现在呢,我们还是找到date,然后找下边这个data size这个对应的是不是就咱这个表啊对吧?点那点完之后呢,这里边还是什么都没有,我们点右上右上角啊,点这个加data s点那点完之后大家可以看一下啊,首先这里边儿我们能看到有三个选项对吧?第一个选项是哪。是不是data source数据源对不对,那再往下的是啥。Schema,这个schema是什么意思?Schema不是表下面这个table式表对吧?Table式表schema什么意思啊,给大家解释一下,Schema呢,实际上就是我们买circle当中那个database的概念,也是have当中那database的概念啊,是是这样,在有些关型数据库里边呢,它是没有这个database的啊,与之对应的是谁呢?是SC啊,是这样的啊,这个理解一下就行了啊好,那现在我们首先需要选择的就是这个数据源对吧?数据源应该选谁?咱们现在是不是只有一个数据源,就是我们刚刚创建的那个jama report对吧?那点它就行了,然后往下走,下面ma是不是让我们选择咱们所需的库啊,最后咱选谁?
13:24
是不是就是这个jama report库没错吧,那接下来再往下走,我们是不是就可以选择这个库里边的表了呀,对吧?那咱们选表,那现在我选谁呢?那当然这个得根据咱们的实际情况去选了,比如说你想展示什么,那你是不是就选什么呀,对不对?比如说举个例子啊,我现在呢,呃,要展示什么,咱们举先先先来一个简单的啊,比如说我现在要展示的是一个呃,访客的啊,这个活跃趋势,每日访客的活跃趋势,比如说我我想看一看,比如说今天有多少访客,那明天有多少,后天有多少,诶我想看一个这样的一个趋势图,对不对,那你说我要展示这个图的话,我应该选哪张表的数据。
14:01
那是不是肯定是他是不是ADS visit states啊对吧?OK,那咱们现在呢,就拿这张表啊,啊,那这是一个访客综合统计,那完之后我们继续往下走,那下边是不是点击这个艾就相添加上来了,对吧?好,我们点过来,点完之后,那这个数据源我们就算是对接好了,好对接好之后下一步应该干啥呀。下一步是画图对不对啊,OK,那画图这个呢,我们单独录一个啊,我把视频先停一下。
我来说两句