00:00
朋友们,接下来我们给大家讲第三章的内容啊,SPA circle的项目实战,其实啊,咱们前面已经给大家介绍了SPA circle的基本用法啊,那我们说过了,在我们当前这个阶段的circle不是重点,为什么呢?你们在后面的数仓的学习当中会专门来学习circle的操作,而在我们这个阶段当中,主要的目的是让你掌握一些基本的原理和开发的技巧啊,所以搜课文的编写和我们的呃,需求的这种实现啊,都是在你们后面的书藏中完成的,那我们接下来呢,要给大家讲项目实战,也是让大家直接体会一下S口文呐,包括一些基本的操作呀,该如何完成好不好?同学们,嗯,那么首先我们要想做项目实战的话,我们先把数据准备好,咱们再看需求,那么先把数据准备好呢?他说了啊,咱们这一回的项目实战当中的数据啊,均来自于have,所以前面的have需要保证能够正常的运行啊,同学们,如果前面的have你连不上,出现了问题那是绝对不行的。那么我们。
01:00
接下来呢,我们要在have中创建表,那么首先呀,咱们这样,我们在这里面大家看一下,咱们这里呢,不是有我们的这个,嗯,数据库嘛,那我们现在创建一个啊,咱们来咱们叫create,咱们叫data,咱们叫data就写上叫at硅谷我觉得就可以了啊,然后回车。回车以后把这个呢,给它创建出来,咱们叫data base OK,回车,回车以后在咱们这创建了一个at硅谷的数据库啊,OK,我们接下来的表叫创建在里面,但是接下来的创建呢,我们这样,因为我们这里涉及到数据的问题,所以在咱们给大家准备的这个资料当中啊,咱们点一下咱们的资料当中有一个叫SPA circle的数据,这三张表的数据咱们都在里面啊,咱们来,我现在呢,把这个我们都删掉了,咱不要了啊,咱们给它delete删除。删除以后,然后接下来把这个1233张表的数据,咱们都给它拿到这个位置放过来,嗯。
02:02
好了,放过来以后,那我们现在就准备在咱们的程序当中,把咱们的数据给它加载到咱们的什么?哎,我们的have当中啊,就是这样,来我们这里呢,拷贝,拷贝以后写上一个零六啊,咱们写上咱们叫做test啊,用来做一些案例的小测试啊好,那么点击它,然后放过来,放过来以后这里呢,我们前面保持不变啊,这个后面呢,咱们都删掉,嗯,这个字文字啊,这种东西咱们也删掉吧,好吧,嗯,那么行,那这里我们就写上了,来咱们写上,咱们叫做准备啊,咱们叫做准备数据,先把数据准备好,那怎么准备啊,那就写上Spark,点咱们的circle呗,然后呢,记住啊,这个时候我们跟前面就不太一样了,我现在是用我们的多行字符串的方式,因为以前写circle文呢,都比较简单,用单行就行了,但是我们接下来建表,包括导入数据啊,咱们用多行可能会好一些啊,所以呢,来咱们写上,嗯,那么这里有三张。
03:02
那表第一张表呢,叫用户行为表,叫user visit action,有这么一张表叫create table,那我现在呢,就把这张表咱们原封不动,咱们拷贝一下,拷贝完成以后,这个分号咱们就不要了啊,咱们直接拿过来,拿过来以后这就是我们建表的语句,接下来咱们再往下来Spark点咱们的舌口,嗯。好了,放过来,放过来以后,那么下面呢,会有什么呢?会有我们的这个啊,来,咱们拷贝叫load date要加载数据了,你加载数据的时候,咱们这个好像不太对吧,这个叫dates啊,这个别写错了,叫dates,然后呢,这个地方我们写上咱们叫at啊硅谷,哦,对了,咱们这里呢,还得有个操作,为什么呢?因为你是往那个艾特硅谷的里面去加呀,所以我们这里还得加一个叫做Spark啊,咱们叫circle,然后呢,写上咱们叫use啊,At硅谷,咱们得把这个加上啊,加上完成以后,创建表就是往里面创建,然后呢,我们往这个表里面创建,也是这样的啊,咱们叫做它好了,那这个有了之后再来spark.circle.circle在我们的第二张表吧,嗯,那么第二张表是什么表呢?我们叫做商品信息表啊,那么原封不动把这个咱们拷贝。
04:17
拷贝之后呢,拿到这个位置啊,别的好像也没有什么对吧,接下来我们的spark.circle然后呢,我们放过来,嗯。放过来之后,那同样道理啊,咱们这里呢,放过来拷贝,拷贝以后放过来,那么这个地方叫做dates,那么这个地方写上一个叫艾特硅谷点,诶这么写就行了啊行,接下来我们叫spark.circle嗯。好,放过来,下面这个是什么表呢?叫城市信息表,叫做city info,所以我们拷贝一下,拷贝之后放过来,那么这里呢,我相信没有什么太大问题,再来我们叫Spark,点我们的这个circle,然后写上它,写上它以后再来吧,咱们的load啊,咱们拷贝一下,拷贝完成以后改一下叫dates啊叫dates,然后这边写上一个叫at硅谷好了,写完之后啊,我们三张表的数据,我们创建好,三张表的数据咱们加载好,那我接下来为了验证一下咱们叫spa.circle然后呢,写上叫select啊来咱们叫select的星from,诶,咱们就把这张表的信息拿过来,叫city info,诶好,然后呢,我们展示一下,好吧,诶,反正只要你成功的话,应该是数据是有的嘛,对不对,那好了,我现在呢就试一试,看看我们的建表语句能不能执行成功。如果执行成功的话,再。
05:43
咱们这边应该也是能够看得到的,对吧,所以呢,我们写上咱们叫at硅谷啊at硅谷好了,然后呢,我们这里呢,给它来咱们的suit tables那里面现在什么都没有对不对,咱们现在就来执行一下运行。运行以后看结果啊,看咱们首先能不能正确成功,如果成功在控制台上会打印咱们的表的数据。
06:08
好,同学们,我们现在已经看到了,在我们当前的这个控制台上,已经把咱们城市的信息给它打印出来了,对吧?诶里面包含了城市的ID,城市的名称和它所在的区域说明啊,咱们的导入是没有问题的,没有问题的话,在咱们这个位置,我们再来咱们的tables OK,回车,诶,三张表的数据就已经全都进来了,对不对,那这样的话,咱们数据的准备工作就算是完成了。
我来说两句