00:00
好,接下来看第四个需求,第四个需求是我们整个的过程当中最难的一个需求了,最难那个需求这里边的查询比较多,来看一下,首先他统计视频观看数。前50,他说所关联视频的所属类别的。Rank。所属类别的认可,那这个来看一下啊,首先你第一步要求什么。统计出前50的视频吧,哎,统计观看数前50的视频,视频是谁?那第一步好做吧,我们都已经做烂了是吧?第一步把它拿过来,把它改成50就够了吧,50吧,这回长记性了是吧?把这个加上啊,提前赶紧加上是吧。哎,这个是中文了是吧,啊赶紧加上学乖了是,那说明这个地方没加是吧,把这个加一下。
01:07
加上第二步,他说什么说关联视频。关联视频,那其实就是统计这套TEN50,那这个地方还要加一个关联视频,要放在这个地方吧,又多了一个字段,那加在这个地方就行了,V的ID对吧,那你这样是不是50个视频的关联视频就有了呀,关联视频就有了第一步。把这个也也得粘进来吧,看到看到关联视频对吧。好,第二步要求什么呢?关联类,关联视频所属类别吧,关联视频所属类别,那关联视频你想想看,这个字段里边全都是什么。
02:02
视频ID是不是,哎,它全都视频ID,那你要想到找这个视频ID所对应的什么视频类别,视频类别,那你要去哪找啊。是不是从原表里边找啊,那这个时候就要交应了吗?哎,一定要交应啊好,那是怎么交应呢来。是拿着这个ID跟这个view ID进行交易吗?是不是啊,好,那就是其实是select,我现在不知道什么字段对吧,那我就在这写一个新可以吧,因为你现在还不清楚它具体叫什么字段嘛,写一个新,然后是from,是不是T1表啊,来自T1表,然后效应音的教应或者教应都是一样的吧,效应本身就是那连接教应,教应哪的表啊。原始的这张表是不是啊,因为这张表才有相关的视频的一个类比啊,好交易这张表,这张表我们给它取个名字叫第二表可以吧,好写一点,后面有可能它里面涉及到很多的一个字段,要引用是吧,T2表,然后交应的一个字段是T一点的ID,你要注意这个时候ID是个什么,我说是它的一个类型。
03:19
类型是不是一个瑞啊,如果说你直接把瑞放到这个地方来,等于T2点。VIID这个能等吗?等不了啊,所以说在交易之前还要做一个什么操作,炸开吧,那其实第二步我们做的是。炸开关联视频ID啊,这一步叫炸开关联视频ID,是这个操作,然后这个其实这一步才是第三步吧,对炸开后的进行一个操作好,那这个炸开怎么来select新from t1表是不是来自于T1表,然后是。
04:08
Letter view吧,Letter view,然后是export,然后对哪个链接打开啊,Related ID是不是啊related的ID。好,展开之后,我们取一个related ID-T啊,临时表明,临时表as,我们叫这个叫什么可以吧,他具体的关联的视频的名字叫什么,叫这个东西。啊,这个东西有了,好这张表,我们把它分成T2表啊。是不是啊,你想想看,这个炸裂出来就是你本来是这样的一个。你本来是这这个语句啊,执行完了是不是50条数据啊,对吧,你这个要记清楚啊,这是50条数据,就观看数前50的,但是呢,它中间的最后一个字段啊,它可能是一个数组啊,数组也就是说你要想起来我们之前那个电影,一个电影对应的四个类别,对吧?你把类别炸开以后,也就是说这一个视频啊,假如说它数组里边有五个,就这一个视频的ID后面跟着本来是一个数组是吧,现在变成了什么?
05:27
哎,这个A,假如说这个数据叫A,然后这个关联的视频是BCD啊三个吧,BCD可以吧,它本来是这样一道数据,炸开之后就变成了ABBACAD吧,是这样一个数据,那就是这个咱们B需求做完T2表,就是刚才我们所说的内容需求,对吧,好。那有了这个T2表之后啊,那这个地方其实就是来自于T2表的数据交应上。T3表吧,然后把这个都改一下啊,T2表里面的一个T2表里边就是叫这个什么杠name了吧,这一列了啊,到这一列了,关联上T3表的。
06:09
视频ID视频ID。那这个叫T4表,那T4表是什么内容啊。这次表是这样的,是这不是最开始我们求的50个视频吗?50个视频之后对它最后一列进行炸开的。炸开了之后是不是一堆视频ID啊,对吧,是他的一堆视频ID,那其实这个题词表啊,就是这里边视频ID它的一个详细数据吧,是不是它这个详细数据啊。这能理解吗?啊,它这个详细数据,好,那你拿到了前50所关联视频的详细数据。它所属类别能不能拿到所属类别,他不是要所属类别的RA吗。
07:05
所属类别的认可是不是啊,那你能不能拿到它所属类别啊,就是我们那个第四个需求是吧,那又要干什么,又要炸开是吧,又要炸裂,所以说这个需求确实相对来说复杂一点啊,复杂一点。一定要就一步一步的捋下来,你要实在不行的话,你可以干什么,哎,做完一个需求之后,你在纸上干什么,或者说你自己做一个笔记,大概你这个题表是什么内容,你把它稍微写一下啊,这样你能更清楚一点啊,自己在练的时候好吧。然后第四步,我们要做的是炸开。关联视频的召开,关联视频的类别是不是关联视频的类别,那其实就是select,现在我们都用心表示啊,Select心,然后是from。
08:02
From哪张表啊,T4表是吧,T4表,然后let view。That will,然后explo,这个里面炸开的是什么力啊?Category这这一列啊,Category这一列好。然后还是categor t,然后ASA。EG这个什么好,下一行最好那行哦。这个表我们把它叫T5表可以吧,T5表我们尽量的把这个表啊都写的细一点,其实有很多步骤,最后一总结,发现有的中间表可以不要,可以不要,但是为了能说清楚,我们最好是一步建一个临时表吧,啊这种方式都做中间表都用子长形来表示。那T5表其实就是炸裂丸的。
09:00
数据了吧,哎,炸裂完的数据了,那求它的一个rank。好久啊,好不啊。求他的一个RA。这个就是,那你想想看,你炸开之后是什么样子的。是不是本来是一个数组的类别啊,一个数组的类别现在就变成一个一个的嘛,啊一个一个的,现在又求它的一个认,那你就把每一个什么看一下。Go,这个categ name,然后去干什么,看一下就行了吧,是这样的,那最后最后一步。第五步,呃,求。统计。类别认可类别认可。可。好,等一下,那这个就好做了吧,Select最后其实是类别认可下啊,应该是categoror name加上count。
10:05
心对吧,看到心好来自于from t5表啊,来自于T5表,然后要group一下是吧,这啊group group by一下什么这个category。到这一步之后,咱们再什么求一个RA?还来一个是吧。求转卡,你要做一个排名啊,你这个count只是求出来了什么。它的一个个数吧,个数,那我们叫hot,那这个是T6表是吧,T6表啊最后。这个是统计类别。个数是。啊,最后一步是。EF是吧,最后一步求统计。
11:01
类别的认可啊,类别认可是这样的吧,那最后一部分统计类别认可就是对于这个号的在DC想法DCC select。心from,然后T6表,六表然后是。奥特曼。半什么呀,Hot hot d OK,最后也不限制它输入多少条了,因为其实关联的视频当中啊。也没有多少内容是吧,它这个数据量相对来说比较少,比较少,这个思路能不能理解。你再捋一遍啊,再捋一遍来说,哎。首先。哎,这怎么回事啊,他要的是统计。视频观看数前50所关联视频的所属类别的认是吧?读起来就很拗口,没办法,这需求就故意搞这么就感觉刁难人的感觉是吧?好,那我们一步一步的跟着需求走,首先你统计出什么?
12:15
前50观看数前50的,那这个比较简单,因为前面的数据当中,我们好几个都用了这个吧,好,那前50个视频有了,他是要这50个视频自己吗。不是吧,他是要他关联视频是吧?哎,关联视频,那你可以把它这个关联视频求出来。关联视频,本来我们想的是关联视频,求出来之后直接跟原表进行干什么?效应是吧,那这时候发现两个字段。匹配不了,一个是数组,一个是4G。它匹配不上,那这个时候我们干了一个什么事啊,就在这个中间又加了一步吧,先对它进行炸开,把你的视频ID进行炸开,炸开之后你跟原表进行交易吧。原表进行交易,拿到你。
13:01
最后那一列,哎,关联视频,每一个关联视频它的一个详细数据,诶这个你是要有的,这个是要有的,好,那这块其实我们还有一步没有做,还有过什么没有做呢?那你想想看这50个视频啊,他关联的视频可不可能有重复呢?有可能吧,哎,有可能有重复的,那有重复的这一块我们怎么做。是不是要做一个驱虫啊,驱虫是不是在这块做的呀。炸开之后进行驱虫吗?是吧?想一想啊,是不是在这块啊,也就是说这块我们要做的是,其实这块求的是的。Related ID name在这块,其实这个心就要变成去容后的关联视频的ID,对吧?因为你50个视频前,50多个视频后面每一个都跟着一个数组,这个数组里边有重复的字段,那很正常嘛,所以说这个驱重操作我们是在这个地方做的,在这个地方做的好。
14:10
接下来往下走。这个地方就拿到你最后那所有的数组,假如说我们就假设啊,这50个视频呢,每一个视频都有十个关联视频,可不可以啊。啊,我假设啊假设的,因为有数字来表述,可能大家更清楚一点啊,现在50个视频啊,它都有十个的关联视频,那此时我们通过。这一步之后拿到的数据是多少条?就是你先不考虑驱虫呢,是多少条,是不是500条啊啊500条它肯定是小于等于500条的,对吧,因为它驱虫啊,那其实这个时候拿到甚至500条的一个数据的一个详细信息吧,也就是说此时你要求什么类别,类别个数类别这岗其实就针对于这五百五百条的一个数据来求的吧,这样就很清楚了,那接下来所做的操作呢。
15:02
其实跟全量的数据。是一样的,全量数据是不是我们做过类别的一个热度啊,啊,现在只不过说全量数据变成了500条,那这500条是怎么来的,是不是由我们前面三个需求来得到这500条啊,然后后面的这几个需求其实就是我们的一个需求二吧。这几个是不是我们需求二。你看需求二,求的是什么?观看数前20个,说出论点,他是20个视频的一个,哎,这是三是吧。不好意思啊,他说统计类别热度的一个top ten码,他这个是全量数据的一个top ten吧,但是我们现在是500个视频,他们直接互相比吧,哎,是这个意思,其实你想想看它后三步,我们后三步的一个操作是不是等于需求二。对吧,啊,就等于是求二,你要这样去理解,那现在我们就干什么。把这个色拼接起来是吧,还挺恐怖的,这个思来这个东西我还是同样的,我们单独拿一份,因为这个是我们的一个整个的思路,不要打断,就是把这个放在这,然后在T6表前面干什么,加一个括号,然后把这个东西粘起来吧。
16:15
看到C6表,然后是T5表,前面也加一个括号对吧。TCTRLC,然后T4表是吧,它里边的一个紫查询比较多,你就只能一层一层的给它套进去,但是你就很少没有人说直接把这一整个的思考全部写上了。这太难了是吧?好,接下来还有一个T2表是吧?T3表不用吧,T3表没有不是题是不是啊,T3表就是对于原表做了一个别名而已,然后就T2表,然后把T2表一下C拿过来,RC。然后是体表是吧。
17:02
然后把题表达一下,题表就是我们那个50加数据。放在这,然后我们把这个拿过,拿到哪个去优化一下是吧,不是优化一下美化一下。还是挺恐怖的是吧,挺恐怖的,然后我们所要注意的一个点就是。这里面我们写了很多新是吧,它可能带来问题,那我们先把这个执行一下好吧。希望他这些心没有问题哦。希望有用吗?这个怎么就出现table了?美化别别别美化了是吧。那已经把那个删掉了,我CTRLZ找回来是吧。的。然后这个题把它拿过来。他每次你像那种出现提示的是不是中间有推过呀,对吧,OK,我们就是这样跑一下是吧。
18:05
我们把这个还是ctrl a ctrl c,把它粘到这下面,你看这个好看的是吧,你看的时候对着这个看,然后运行的时候拿这个运行是吧。走一下有有问题是吧,有问题很正常是吧,他猜到了是吧,看一下他说第二行开始就有问题了。哎,我们为什么是从这个地方开始了,刚才应该是那个地方,他提示没有没有完是吧,那我们重新粘一下。这种大骚客是吧,哎。慢一点才睡。居然跑起来了,这么神奇是吧?对吧,那这个S跑的时间肯定稍微能长一点吧,因为子拉菌比较多,拉菌比较多,那其实你们可以对这个S进行优化是吧,就是有很多像之前那种啊,有的地方可以不用子查询,可以再一步操作过来吧,但是为了讲课,讲课没法要思路要更清楚一点,就是有时候哎,我直接多一个子查询,每一步都去想清楚,就是你们可以在每一个下面干什么,把它类似的一个表格,或者说你把这个数据单独的执行一下了,你把粘贴两张数据搁这是不是,然后你把这个T表替换到这个地方,然后执行一下,又粘贴两张数据搁这。
19:35
啊,到时候看的时候就很清楚了,具体每一次执行结果,它是什么内容,它是什么内容。这个就有很多一个任务了,是吧。这美化之后为什么会给我出现推广?这么奇怪的吗?这么神奇。我看一下这个刚才就是我们粘过来的是吧,这全都都是空格,哪有table。
20:02
全全是退货,这不是空格吗?哪个第几行。咱们那个先选中一下,他是他竖线打出来的时候,其实就是table。出现。竖线分割那就属实啊,你说这个是吧,哦,他有可能是这个地方是整个的是一个table是吧。嗯。有可能是啊,反正就是它出现那种提示,说让你要不要Y要不要N的时候,就是提示吧,你按推的时候,数据量多的时候,它是不是提示啊啊就是证明有table,也就是说这我们一直强调的是它前面可以用空格,不能用table了。啊,这个就是前50个视频的什么。前观看数前50视频所关联视频的类别的rank啊,类别的rank排名啊,我们那个排名还是同样的,用它的一个个数来的吧,哎,用它的个个数,而且这个个数是视频个数啊,这个视频个数,而且是去重过后的个数是不是啊,去重过后的这样的,注意啊,我们中间有个去重操作,有个去虫操作是这样的。
21:16
这个需求大家还是自己下去,可以一步一步的按照这种需求去写,然后你看其实你写子查询之后,你只要把这个表前面加一个括号,把前面你要的砂云往里一粘就行了,不用做其他的任何的一个操作。
我来说两句