00:00
好,那今天呢,我们主要看一下这个数据的可视化啊,它这个实现也就最终我们最早的时候看到的一张图,对吧,那今天呢,我们就要把这个内容去完成啊,把这个内容去完成啊呃,那这里面呢,主要的我们来看一下啊。这里边,嗯,那就是说这里面有哪些东西呢?第一个数据可视化的一个接口。啊,就是我们肯定要写接口,因为我们要用sugar来做我们整个的数据可视化,但是大家想一个问题,这个sugar它能够访问到我们虚拟机里边,可里边数据吗?大家可以思考一下对吧。就就或者说。啊,大家现在你能你在家里,我也我也在家里对吧,那你能访问到我的虚拟机吗。大家想一下能不能啊?你能访问到我的虚拟机吗?
01:01
肯定是不能的,对不对啊,肯定是不能的啊。好,呃,所以呢,我们要去。用到那个花生壳啊,以及还有这个数据接口啊,因为你不能要求我们sugar直接访问克林house。对,所以我们才要用这个花生格啊,才要写这个数据接口啊,要做这样事情,这是我们做这个事情的必要性,对吧?啊好,那这是第一个数据可视化的一个接口,我们到时候看一下我们要写什么东西,第二个呢,就关于sugar,它的一个用法,我们用一用对吧?啊用一用好,那底下呢,会有这么几个东西啊,第一个MV对吧,它的商品交易额不同维度的统计,那这里面我们要算PU统计。嗯,然后呢,Trademark trademark分组以及按category分组啊求三个,那这就GMV有四个指标了,那这四个指标了,都来自于我们的products对吧?商品主题宽表啊DWS商品主题好那分省市的热力图统计。
02:10
第五章那这个明显的是一个地区统计,对吧,根据地区来的,呃,然后呢,流量数据统计。流量数据,那这边呢是一个,这边三个可以看一下,这边呢一个对吧,131这是五个了,然后流量数据统计当中呢,有两个,这个来自于我们的访客主题。对吧,啊,新增用户啊,访客呀,访客量啊,跳出对吧,跳出率啊等等这些东西啊,在这里边做啊,这里边呢,有两个图要去实现的,然后还有一个热力词云,词云呢就一个对吧,总共呢,其实也就是说我们有八个需求,八个图,八张图啊好,那在八张图当中呢,到时候我们带着大家做两个,大家这东西呢,我们直接拿过来,因为这个关于这个接口的代码已经给大家放在这个第三个文档当中啊,代码当中啊,那没必要每一个都去写,都一样的套路,对吧?啊嗯,我们在课堂上讲两个啊讲两个,然后后面呢,大家自己去啊,也也自己尝试写两个,因为这个数据接口吧,说实话在工作当中,第一在公司当中啊,你们不是每个人都会接触到,就是有有很多同学呢,呃,以后在公司工作的时候,就不不用去写这个东西。
03:24
啊,不用去写这个数据接口,第二,其实我们之前在Spark streaming那个案例当中也已经写过三个数据接口了。对吧,那之前呢,呃,那个东西呢,是有四个,是有四个需求,但是有一个第三个需求,咱们的预警需求呢,用的是ES直接对接这个combine的,做它这个可视化展示的,对吧?所以大家之前也写过三个,那我们这个时候再带着写两个对吧,因为我们没用过,那我们来看一下结合sugar格应该怎么去做啊,其实就是说书格把你这个格式对定下来了,其他没有什么是吧?好,那没有什么其他的东西了啊,行,是我们当前可视化里边要做的一个事情,那我们看一下。
04:08
第一个对吧,我们数据呢,将轻度汇总的数据已经保存到颗house,所以轻度汇总呢,我们是按照十秒钟聚合,十秒钟一聚合,不是放的明细,也不是放在一个结果,对吧?从今天开始到今天结束,放一条数据也不是的啊,轻度聚合呃,主要目的呢,提供这个数据的查询方便,对吧?那一般的展示呢,两种形式,一种为专业的数据源分析的BI工具,往往BI工具呢是要写S的,那你不能要求你老板来写S查询,对吧?另外一种面向非专业人员和这个数据的一个打屏对吧,直接是打屏,那我们呢,用百度的sugar作为这个数据,这个开发最终效果图呢,是这个样子。对吧,最终效果都是这样的,那刚才我们分析了有八个需求,那我们看一下啊,第一个总成交金额这是一个啊,对吧,然后按照品牌品类啊trademark k还有一个。
05:09
热门商品销售这呢是按照SPU啊,Trademark这个是品类category,而这个总成交金额什么都不看对吧,就some啊,一个维度都不选,就这个啊,是第一个我们商品主题表当中四个需求,第二个。区主题表当中,我们做一张这个地图对吧?啊地图热力分布图啊好,那接下来。新老用户对比有用户数总访问数对吧,挑出率,平均在线时长,然后平均访问的人次这些东西,然后之后呢,这边用户访问的分时统计,呃,分时流量统计,看每个小时它的一个访问人数是多少。对吧,好,这是分时流量能力,然后中间还有一个热门的关键词。
06:05
啊做关键词,所以每一个主题呢,我们都挑了这么一个两个,或者说有的多一点,商品主题会多一点,挑金额嘛,那工作当中也是最关心的,对吧?啊,那我们挑了这么八个啊,有八个就是刚才我们说的这八个啊,当然我们带着写写这么两个啊,然后呢,这是单独看到了,诶从专家金额审视啊,这个我们就不用管了啊,那接下来在这个执行过程,呃,我们最后呢,是要把前面服务全部开起来,实时的往课组去写,然后呢,我们要自己写一个这个数据接口。对吧,访问c house,让数据变成我们的结算格式。供诸个去调用。对吧的,它你任何一个图,它有规定的这个数据格式,不是说你想写成什么样子就写成什么样子的。对吧?啊,它规定什么格式,按照它格式呢,写好数据的一个接口好了啊,写好数据的一个接口就好了,对吧?好,这是我们所看到整体我们的一个内容,接下来呢,我们最重要的就是说在这边接在书格当中选择我们所需要的这种图形,然后看一下这个图形所需要的阶森是长什么样子,接下来根据我们克号的一个特来查询我们的。
07:21
House对吧,接口,然后呢,返回我们所需要的这种介词格式,然后呢,把它放在一块一个测试啊,这是我们当前这个文档当中,也就可视化整体要做的一个事情,对吧?好,这是整体的一个课程。
我来说两句