00:00
那么具体我们要完成哪些需求呢?我们主要的需求呢,有这么几个对吧,那其实呢,主要是四个,但可能呢,比这要更细一些啊,比这更细一些,首先第一个需求呢,我们会统计当日用户首次登录它的一个分时趋势图。当日首次用户啊,当当日咱们用户首次登录它的一个分时趋势图,其实这是干什么呢?就是求我们的日活呢,你一个网站对吧,然后呢,今天这一天每一个小时,它的一个用户的访问量是多少,那么这个呢,我希望你会展示出来。啊,往向右展示出来对吧?那么把这个展示结果放在哪呢?保存到我们的elect search里边,然后最后呢,通过K班的来进行展示分析,对吧?那么这里呢,大家如果一看到需求的话,你先在脑子里边应该有一个思路,咱们现在首次登录对吧?大家想想,那么这个数据我应该从哪拿呀?咱们是不是应该从日志里边,而且日志应该有两类,有什么咱们的行为日志,有什么咱们的启动日志,对吧,咱们是不是从启动日里是不是可以拿到它,对吧?这是第一个,你可以分析出来了,你先有个印象啊,先有印象,那么第二个咱们到时候肯定得学这个东西。
01:14
Eleven search对吧?Eleven search,那么另外一个K班呢,咱们是不是也得知道最终效果是什么样的,最终展示的效果是这样的。啊,最终我展示一个这样的效果。这是第一个需求,那么第二个呢,咱们要统计当日咱们的新增付费用户,它的一个分析,那么在分析的时候呢,对吧,就是说我可能有多个维度,比如说今天呢,在我这网站花钱的用户,对吧,哪个省份多,今天我现在这网站我说了这么多,就好多用户在我这网站花钱了,消费了,对吧,那各个省份的比例多少。然后呢,我现在我这今天我搞了一个活动对吧,比如说今天是10月17号男生节,对吧,我看一看对吧,我当天我这个男生节这个活动,这是男生消费多还是女生消费多呀,女生是你看男生还是女生消费多是吧?说明是男生购买能力还不行,对吧?所以说呢,同学们对吧,在这里我现在呢,可以有多个维度来进行分析,那么这个时候大家想一想新增付费用户。
02:13
啊,新增付费用户对吧,然后呢,他的一个首单分析首单,你又怎么确定分首单呢。啊,你们怎么确定他是首单的支付是吧,其实一般的如果支付就太实在了,同学们对吧,只要下单我就觉得他是首单对吧?如果只要下单,我觉得到时候他就收单了,对,那下单数据去哪来呢。数据库里边。去数据库里边是不是去数据库里边拿对吧,这块呢需要对吧,去到时候咱们再去详细讨论对吧?那么另外一个,那么你在统计的时候呀,大家注意,那么咱们现在呢,我想统计哪一个省份的名称啊,什么用户的性别,以及用户的年龄段,那么这个时候呀,你在订单里边好像没有这些东西,你可能有省份的ID对吧?然后呢,你现在可能有咱们这个性别怎么怎么样,但是你没有什么男女对吧?然后呢,年龄,你可能有年龄,但是没有年龄段,所以这个东西呢,可能需要你做一些关联。
03:14
啊,你需要做一些关联,对吧,那么咱们现在观点主要关联什么呢?呃,可能需要订单表和谁呢?什么省份呢,和用户这些关联,这个其实就是和这个事实表和维度的关联吧,这个概念大家应该不陌生吧,对吧?然后接下来关联之后呢,它会形成一个宽表,把这个宽表写到ES里边,然后呢,通过咱们这的K班呢来做展示,那么我们最终展示效果那什么样的呢?形成一个这样的效果。形成一个这样的效果,这是第二个需求,那么第三个需求呢,是我们的订单这个明细实付金额分摊,那么整个呢,在我们这个项目里边,如果说稍微有点难度的话,那其实呢,就这一块了。啊,就这一块了,稍微有些难度的地方,那可能就这些块。
04:02
实不及而分担,什么意思?对吧,比如说啊,你现在一个订单啊,你现在下的一个订单,然后呢,你在订单里面是不是有订单明细啊对吧?订单明细里边呢,比如说这个是明细一对吧,这个明细一,然后这个呢是明细二,然后这个呢是明细三,对吧?然后接下来,那么咱们现在呢,正常情况下,我这个东西呢,应该花我们这个比如说200块钱,然后接下来正常情况下呢,这个东西呢,应该花300块钱,然后接在正常情况下呢,这个应该花500块钱,然一共花1000块钱,到后来呢,这个商场搞活动,到就网站搞活动,对吧?这个满满多少呢?满1000减900,然后实际呢,你花了100块钱对吧?那我问大家对吧,那你说我现在如果说我是最终的还免还还包邮对吧?你想九块九都能包邮,人家100块钱为啥不可以呀,对不对,对吧,那我现在呢,还包邮对吧,那你说我现在是不是你最终你其实就是花了100块钱,是是买的这些东西啊。
05:07
对吧,那你说我现在这三个明细里边,这些商品每一个分担了多少,23按比例算是吧,能算还行,那如果说我现在这,如果说我说什么呢?比如说我现在这里面涉及到一些,比如说90对,99对这个东西你怎么算?你如果说我先100的话啊,题号按比例算对,50,二十三十九十九,你怎么分对吧?这块咱们先有个思路,咱们不现在在这里研究的对吧?这块呢,是关于我们现在它的关于我们这个实付金额分摊的,那其实在咱实收金额分摊这里边呢,还有一些对吧?到咱们这里边呢,还有一些什么呢?还有一些双流重文的问题,对吧?因为到时候我要统计我们的订单,统计咱们这个对吧,咱们这个这个订单明细对吧,那比说订单和订单明细他们之间呢,那这个东西呢,要我们交换在一起,大家想这个订单是不是是我们这个事时数据啊,订单明细呢,其实也实时数据,那么这个时候呢,那他们都是实时在发生变化的。
06:10
啊,就你想我现在订单它的数据肯定是源源不断的过来,订单明细数据呢,也是源源不断的过来,对吧,那么源源不断过来,你是不是在通过SPA stream命这个流由进行处理啊,对吧?那么咱们是不是每订单我封装一个stream,然后呢,咱订单明细我是要封了一个stream,那么这两个东西你到时候怎么连在一块啊,这叫双流join啊,这叫双流join啊吧,就整个这块呢,要相比较要复杂一点啊,相对要复杂一点,然后接着还有一个这个对吧,那么这块呢,就是什么呢?就是最后呢,最后啊做一个我们ADM层它的愈合以及可视化啊,聚合以及可视化,那么这块呢,就是给大家,其实其实到这块咱们基本上已经完事了,那么像这块加这功能呢,就是相当于呃,扩大一下大家的一个视野。啊,什么意思呢?就是我们现在啊,再去做一些啊,我们这个的这个处理的时候,其实方式呢,可能有很多,尤其做项目的时候,对吧?实现方式可能有很多种,比如说我要想实现精准性的消费,咱们前面呢,其实这个需求里边已经实现了,对吧?但是我们是用的其中一种实现方式,对吧?那么有可能呢,咱们在公司里边还用别的实现方式,对吧?那么如果用别的实验方式的话,那么这个东西怎么来做,我们在这儿呢,给大家介绍对吧?诶那么另外一种方式对吧?那么同时呢,这个展示的时候,对吧?我们呢,现在不比较流行的,比较流行的什么呢?大屏展示嘛。
07:31
你们显示器多大屏的?你们班最大显示器就多大平呢?最大显示器是你的显示器多大平呢?23是吧,一般咱们现在如果说大平的话就多少米。你这单位是么英寸是不是对吧啊,一般的咱现在其实有钱的公司,现在你们看啊,好多公司一进去之后,他说大数据做得好,比如说你看这个有些什么做交通运输监控的呀或什么的,对吧,一进在咱们大厅里边对吧,就是我现在有一个特别大的屏幕对吧?特别大屏幕一般电影公司呢,一般别的小公司的话,弄不起对吧,弄弄不起这个对吧,就这一个屏幕对吧,那就很多钱。
08:08
啊,但是其实展示的技术其实很简单对吧,咱们负责什么,咱们负责其实把这个数据给他,他给展示出来,对吧?那么如果做大屏展示的话,对吧,你想一想,咱们如果说图太丑的话是不太合适,你说你上来E给个这个图挺好个屏幕展一个这个图是不太合适,对吧?所以说呢,那么咱们现在啊,用的是谁呢?用的是我们的阿里它的一个date v啊咱们这呢,用的是阿里你的一个date v,主要做大屏啊,目前其实算是应该是很专业的是吧?所以这块呢,就是我们整个啊,我这个项目它大概一个需求啊,项目大概需求好了,我现在呢,把这稍微停一下啊。
我来说两句