00:00
好,那这个SCO也安装完了,那相当于数据走到哪了呢?相当于哪些准备工作做好了啊相当于这个MYSQ已经安完了,SCO也安装完了,HDFS呢,其实我们也已经安装完了,之前就已经安装过海多款,对吧?那现在的问题就是这个MYSQ里面目前它没有数据。你希望通过这个school往这里面导数据,但是这里面还没有呢,那你需要往这里照啊,那怎么照这个数据呢?哎,那接下来我们就来做一下哈。现在呢,我们要来写一些加油代码啊,生成对应的业务数据啊,只不过这这个加格代码呢,我们就啊提前给大家写好了啊,写好了啊就跟你们之前那个用户买点的这个行为数据是一样的,就是写价代码啊,照变对象,然后呢各种循环,之前不说过吗?照这个数据就是。For循环加上random。就能够实现这个假数据的一个生成哈,呃,那行,那这里面首先操作一下这个买收数据库,那这时候用谁呢。这个样。
01:01
啊,石控石控架这个大家不陌生吧,啊,之前学买时都用过哈,那我们这里面呢,我这里面创了好多哈,你可以自己新创个连接,创建个连接之后呢,这里面要输入你连接的是哪台主机,那我这个是102上,我买次Q装在102上,所以说我连接是102,那你们装在哪上就连接哪一个,那另一个呢,是这个用户名啊用户名,那用户名的话呢,我这里面是用的root啊root账号,你MYSQL是root吗?之后呢,这里面是密码,那密码呢也是六个零啊,然后端口号呢是3306。然后那你衔接啊,你可以先测试一下看能不能通对吧。哎,一测试呢,哎,连接成功,那你这块呢就可以连了哈,连来连。哎,这样呢,这个就已经连接上我们这个数据库了哈,连接上数据库之后呢,我这里面要建表啊,啊要建表建库哈,来。呃,创建一个数据库,我这个数据库名称呢,我一般叫gmail啊,相当于是一个嗯,Global mail,全球电商啊,全球电商啊之后呢,这个下面是udf啊UDTF。
02:07
采用这种编码机,然后在下面这块选哪哪一个呢,选这个UTL杠杠UTL8,然后在一个CI这个编码啊,这样就OK了,OK之后呢,创建。创建之后呢,这里面就呃有了一个gmail数据库,那gmail数据库呢,接下来我们要在里面创表啊创表我们要创表的话,要创建很多张。那正常情况下呢,看一下这个资料包里面生成有个,它有个GL20200316啊这么一个口,你把它打开。哎,打开打开的话,这里面就是具体的去创建表,你看这第一个呢,是创建什么活动表对吧?啊创建活动表,然后ID啊描述。字段类型,字段类型,然后再往下,再往下呢,这是那个活动的订单表,然后呢,像这里面插入一些数据,这里面是提前插入了一些数据啊。
03:01
那当然我们后面也可以进行一个生成,那这些数据,然后再之后呢,是这个活动规则表啊,监表建表之后呢,往里面印色的插入一些数据。呃,活动啊,这个活动表啊,活动表啊,再插入一些数据啊,这个呢,是商品的一级分类,一级分类我们插入了这么多数据啊,啊插了好多啊之后呢,是二级分类,二级分类呢,又插入了这些。啊,这也是这个从京东那个网站上扒下来的哈,嗯,再往下是三级分类。这么多哈啊,这里面好多哈,我这不往下拉了,你看这一共有多少行啊,这太多了哈,一共是14000多行啊,14000多行就是照这个数据啊,照的还是挺辛苦的啊,挺辛苦的,嗯,那具体的这个我就不跟大家说了,那我们直接执行导入脚本命令,生成我们想要的数据就可以了。在真正的企业开发的时候呢,这些数据呢,你肯定是有的,这个你也不用担心,那拿来之后呢,在这里面右键啊,在这个数据仓库上点击右键,然后导入。
04:05
然们呢,点击一个执行申购脚本,好输购脚本之后呢,选择刚才我们那个收口,那我那时口在哪呢?告诉大家一下哈,看这一个电商出仓,然后资料包资料包下的。数据库啊,生成脚本,然后点它,点它之后呢,然后打开。打开点执行,执行了吗?这么快吗?啊,没有啊执行。行。这样呢,就执行完这个操作了,然后右键的这个刷新刷新浏览器打开打开。一下这么多张表就都有了啊,就非常快啊,非常快,当然了,你要想这个自己手动的,我说创建,呃,这个create create也行啊,没问题啊,啊没有任何问题,行,那我们看一下这里面的一些数据,随便打几个,哎,这里面有这个,这是活动表啊,数据比较少啊,就是一个联想品牌的一个优惠活动。往下呢,这个是订单。
05:01
嗯,还有活动规则。啊,SKU的啊,三级品类的,一级品类的,二级品类的,三级品类的这个呢,是这个这个码表对吧,之前给大家说那个码表啊,每个每个这个编号代表着不同的这个含义啊,不同含义啊代表的都是中文哈,好评差评什么支付宝微信啊一大堆,嗯,还有省份信息。那这块呢,我先不给大家看了啊,后面呢,我们用到的时候再给大家细说啊,这里面总之呢,这里面是已经有数据了啊啊已经有数据了。
我来说两句