00:00
好,那我们接下来要往后看啊,聊个东西叫虚拟列,这并不是一个新的概念,什么叫虚拟列呢?原表,原表里面不存在,是由你构造出来的,举个例子,我原表有ABC3个字段,然后呢,你写that from这张表,然后呢,你是不是想查A想查B啊,然后你再来一个A除以B。这是不是第三个字段,对结果集来讲,那它就是一个虚拟链,原表不存在,是你构造出来的,这种叫虚拟链,那其实买车狗有没有虚拟店,看有没有虚拟店有,只不过咱们以前没有专门去叫他这个名字,你感觉陌生而已啊,甚至你后面做了一个B加一。它是不是也算一个虚拟列,对,也是啊,只要不是原表的字段,那就是虚拟列,那么虚拟列它是非常。
01:03
消耗资源。那样避免啊,那比如说咱们这个例子啊,你看咱们从这张表查了这两个字段,然后呢,当然这个业务上没意义,我就拿收入除以年龄对吧,做了一个除法,这是不是一个虚拟列。好,那你想想它构造这一列是不是每一行数据都得有啊?那你想,如果你的数据上一行呢?是不是做了上一次这个操作啊,那我那怎么办,那我业务上就是得除啊,那你如果允许的话,你就只查出相关的字段,你拿到之后再自己除不好吗。对吧,其实我们看一下效果,这个是构造了虚拟链,时间是0.482,其实大家也可以接受,对吧?好再来一个没有虚拟链。
02:03
差不多。差了两倍吧。是不是差两倍?看不到那个结果了。这是有虚拟的。他是不是花了一倍的时间去做其他事,那你你现在是觉得0.4秒吗?我可以接受啊。那是因为他快,如果他不快呢,时间给你拉一倍出来,那是很可怕的事。对吧,当然你如果你可以接受,那当然OK的,很OK啊。咱们这个才1000行啊,大公司一张表多大全表的话那。上T上PB的都有啊。对吧。
03:03
你你现在会发现这种几百万好像几千行,像对他肯定小浩子来讲,是不是都是啥对小儿哭啊,小意思啊,所以为什么现在那么受追捧,就是因为这样,哎,对了,还有一个一张表是1亿行数据的,我没下,为啥呢?它的数据文件官方下载压缩包是七点多个G。然后解压出来是63个G,我是放不下,你们要放得下,可以玩那个1亿条的,我现在只能玩1000万条啊,我是单台虚拟机玩1000万条啊。无所谓啊。这个好了,没有,快一点了,你看他他死了吗?你看你看自己退出来了吗?啊,其实是跑完了,你看这里是统计,因为你跑多了之后,它的这个share前端那个交互界面就变成乱码了,不是数据乱码,是他自己变乱码,这个是就是那个多少行多少时间,每秒钟读多少条那一行嘛,然后后面是我的CTRLC,它现在才识别到嘛,这个没用,我就把它关了,就是这种这种信息。
04:24
你不要还有一个场景,就是什么呢?为什么要避免呢?如果零点几秒,你在业务上可能没有我写的这么简单,是不是你你虚拟业的构造不一定我这么简单,如果你再复杂一点,时间就不仅仅是多一倍,那可能更多,数据量再大一点,那就更多,也就是说你未来如果是达到了一个瓶颈,你可以考虑一下虚拟力不要在这里构造。单独拎出来,因为本身它数据量大啊,如果逻辑复杂一点的话。嗯。那还有一个。
05:00
啊,这个我单独截吧。
我来说两句