00:01
大家好,我是小B。这节课我给大家讲如何使用。获取数据。包呢,它支持很多数据源的一个获取啊。比如说我们在这个数据学下里边可以看到来自文件。这个从Excel工作。不,然后呢,从这个文本文件,然后叉叉M2JOHNSON PDF文件夹是part。以及数据库啊。它支持很多很多,然后呢,我们给大家主要讲以下的四种,第一个就是从数Excel的数据区域或者。这个数表格获取啊数据。然后呢,第二种是从Excel的工作簿啊,或者从这个文件夹中获取数据。三种呢是获取CSV的数据,第四个呢,是从这个呃,数据库中获取数据,那我们来看第一种。
01:04
首先呢,我们从这个现有的数据啊,当前的工作。表的这个表格,也就是现有的这个,呃,工作表的数据啊,把它加载到这个power中啊,也就是说我们将数据加载到POWER2中。这种呢,我们先可以点击这里边有一个叫在数据选项卡里边有一个类似表格或者区域啊。你看它会弹出一个是否包含标题,如果你的表这个包含标题,那你勾上,如果不包含,那你就可以不勾他啊。但是我建议大家在导入这个pro之前呢,我们先按CTRLT啊打,将它创建一个表,这个表这个区域的,或者说这个表的名称我叫。嗯,表。比如说我叫成绩表一啊,成绩表一。
02:01
然后呢,我们再选中其中一个单元格。点击数据数据下边的雷子表格或者数据区域。啊,我们就可以将它加载进来了,加载进来以后呢,你会发现啊,这个它直接是一个成绩表,对不对,直接是一个成绩表。他把这一部分给占掉。那它的名称直接是一个成绩表,不用我们再去命名啊,不用我们再去命名,这个是比较方便的。是比较快捷的,我们这个上载的时候呢,上载只创建链接就行了,这是我们的第一个。给大家写一下啊。从Excel的数字区域。或者。表格中加载。导入数据吧。数据可是先将这个数据区域,嗯。
03:08
T。的方法创建一个超级表。并且命名好数据区域的名字。这样比较方便,比较方便。你直接这个加载,然后再去命名的比较方便啊,当然你也可以这个,呃,直接给它加载进去再去命名。第二个呢,我们从这个嗯,啊,从工作簿中去。加载数据啊,比如说我这里边儿现在有一个。明细表啊,里边就只有一张表,把它加载进来,那我们就可以点击数获取数据来自文件,从Excel工作簿啊,我找到。
04:04
比说这个啊,叫Excel工作簿中的数据员也行啊。啊,我们看一下啊。啊,这个是在sa的这个Excel工作簿数据源,我们打开它。诶,你会发现里边有三张表啊,里边有三张表,我们将这个工作簿加载到我们的这个。嗯。啊,我们的这个块中来,那有三种方法啊,有两种,有两种可以选择的路径,一种呢,就是将工作。雾中的。工作表。分别添加。呃,分别导入到。
05:06
花中。那我们点击获取数据来自文件啊,导入工作簿,把这个选上导入。导入的时候呢,我们可以选择多项。比如说你其中有一项你也可以不要啊。或者说我都选上也行啊,前提是要选择这个勾选多项。勾选多项啊。然后呢?放在这这加载的时候,你看我们直接点击。转化数据。也就转化数据以后呢,它会将这三张表分别创建三个查询加载进来啊,分别创建查三个查询加载进来。那还有一种方法就是我们将这三个表需要合并,因为这三个表长得一模一样啊。将Excel。
06:04
工作部总的数据。啊,也就是同一个。啊,同一种类型结构的数据进行合并。也就是说,我们将。这三张表里的。啊,将这个工作步骤的三张表的数据给它合并成一个工作表,因为它的类型结构都一样,对不对,你看班级姓名分数,班级姓名分数。这个时候呢,我们选择获取数据,从这个Excel工作簿啊,选中它导入。然后呢,我们此时选择啊,选择这个文件夹,不在勾选上边的啊,选择文件夹。然后点击转换啊,点击转换。
07:03
转换数据对不对。转化数据以后呢,你会发现诶,他会把这三张表全部给你列出来,你看123对不对,123123。别出来。列出来以后呢,我们。啊,我们直接删除其他列。对不对,然后扩大一下。加载。或者完了以后将第一行提升为标题对不对,然后把这个分数里边。啊为汉字的这个给它筛选掉。对吧,你看现在就是就是这个里边有一班二班三班对不对啊,直接扩展就行了。点击转换后。直接对。推塔里。
08:03
进行。扩展。或者展开,或者叫展开。这比较方便,对不对,这个比较方便啊,这是一种。然后还有一种就是我们平时比较常用的啊。从文件夹中获取数据。中获取并合并。Excel表的数据。啊,这个。不要的我们点击。好,我们先给你看一下这个文件夹里边有什么表啊,这表里边儿有一共有三张表啊,这个文件夹里。
09:00
一共有三张点。分别为,你看这是三班的一张表对不对?然后二班的一张表有三列,班级,姓名、分数对不对?然后呢,这是一般的啊,一模一样的三张表,对不对啊,只是一个一班二班三班不一样,那我们需要将它进行合并啊,合并成一张表,并且从文件夹中导入。选择雷子数据。从文件夹。选择数据表这文件夹,选择打开。然后呢,此时啊,它会这个,呃,生成一个预览,我们点击这个转换数据。连转换数据的时候,你看这个第一列啊。它是个bary b,在上节的时候我们讲它是一个二进制文件,对不对?二进制文件的表示方法,你看我们点一下的时候,点每个B导的时候,它下边都有一个Excel工作簿的这个。这么一个文件夹啊,这么一个文件夹。
10:03
这么一个文件夹,然后呢,我们现在需要将它解析开来啊,解析开来我们可以这么做啊。呃,这里我先给大家教一个简单的方法,比如说我添加一个自定义令。点下一个自定义列里边呢,我输入叫Excel点。我可不,这个函数一定要注意它的大小解啊。然后点击contact啊,然后第二个参数,如果你的表的第一行是标题,那么我们输出啊,如果不是标题的话,你就可以不省略它不输啊,因为我这里的现在是有标题,直接是在第一行,所以我出个处就行了。要确定。你看啊。啊。然后呢,我们把它扩展开,扩展开了以后。是不是数据应该在data里边放着,生化出来一个看看啊,你看。
11:02
在带塔这个里边放着呢,所以。我们对这个展开的时候,只选得塔列就行,对吧,你看只选德塔列。这数据数据对。然后呢,我们。选中这个自定义的德塔列,删除其他列。点击扩大按钮。对的,这个使用原始链膜作为前缀,不勾选它,点击确定。这的话我们就把它这个。嗯。合并起来了啊,合并起来了。三种方法。嗯。方法一,从文件夹。导入。啊,再加一个自定义的。然后是四点,Workbook。
12:01
还说我进行解析。如果标题行在第一行,那么函数的第二个参数直接写成住。可以提升标题。如果不在第一行。那么A函数的第二个参数就可以省略了啊,就可以省略了。呃,需要手动。嗯。操作界面提升标题。要提行对吧,啊,刚才我们讲的方法使用。黑ger。
13:02
函数直接。解析对不对,直接解析。并这个合并合并。这个方法我们在后边的章节中会给大家去这个具体的讲解啊,这里我给大家先展示一下。就说我现在。啊,导入的时候只有这一步了,对不对,你看啊,我把其他的步骤都删掉了。那我们可以点击FX,形成一个新的步骤,叫自定义的自定义的这么一个步骤,然后输入我们的函数推包点。是放。三了五次对吧,然后第二个是它是一个类。第一个参数呢,是这个要对要处理的这个列的名称对不对这个。Excel or each对不对,环境变量。
14:05
然后对它干什么呢。Work book就是参数写成数对吧。哎,我们来看一下,这是成一个table了啊,看它的数据呢,在第一行的data塔里,就是把它生化出来啊,这个在三塔容器中会给大家具体的讲到。嗯,然后呢,讲到的时候呢,大家再回过头来再看一下这个案例,这个这看第一行。看是不是数据都出来了。然后出来以后呢,我们把第一列啊给单独拿出来,比如说叫。拿出来以后呢,是不是对这三个表进行合并就行了。
15:06
诶,这是我们的第二种方法,对不对,第二种方法。啊,等你学会了这个,呃,了解了三大容器以及基本的一些函数以后呢,你就可以使用这种方法啊。然后第三种导入的这个。数据源呢,是CSV或者TXT啊,CSV的比较简单。说我好,现在上来链接。然后呢,再去获取。红粉或者是V。点击选择这个要导入的。SV的。导入。导入的时候呢,这个大家一定要注意一下啊,一是文文件的原格式啊,它比如说这里边是65001,因为看的是UU8的这么一个东西啊。有的他可能是UTF32啊什么什么的,大家一定要注意,如果这个选不对,它会出现乱码,比如说。
16:05
这是uf啊对不对,有的时候它会出出现那乱码,然后分隔符有的是逗号空格还有什么的啊,大家一定选对出这类型的,它是基于前200行,这个没有关系啊啊点击转换数据。然后导进来以后呢,会发现标题不在第一行,我们将它提升到第一行就行。然后呢,关闭并上载治。我习惯性的先创价为链接。啊,这个比较简单,对不对。呃,但是这个里边呢,要注意,嗯,要。这里面需要注意的是。CSV。文件的。编码的类型。是。TF8。
17:02
啊,这这这种形式呢。等吧,啊等啊,比如说这种形式还有其他的UT啊什么,对不对。哎,是有UF,看的是UTF呢,还是有UF呢?我看一下啊。这边没写上,我们再导入导入一次看看,比如说我从这直接倒。啊,UTF8,对对,UTF,记住UTF。这是一种。呃,还啊。还有需要注意的是,CV。文件的。列的分割符是什么啊?分割符是什么什么,比如逗号,然后空格。
18:07
或者这个啊。需要注意一下,不然你的会报错啊。然后呢,我们还有一个就是第四点,从数据库中这个获取数据啊。这个我以白中的数据库为例啊,比如说我这里边儿现在有这么一个。啊,有这么一个这个数据库啊,嗯。它的服务器地址是这个端口,那MYSQL的一般都是3306啊,如果没有特地改的话,比如说数据库的名称我叫S啊,用户名呢,比如说叫刘碧林啊,我们来导入一下看看。我先把这个粘上啊。获取数据,从数据库,从MYSQL数据库。呃,比如说服务器地址是这个啊服这个数据库呢是。
19:00
啊,然后这个里边有个超时命令啊,大家可以选一下。就说多少时间超时对不对?SQL语句如果你导入一张表的话,你觉得太多了,不需要更多的行,你可以在这里编写SL语句呢,把它这个。谁选项,点击确定。啊,因为我这个是已经登录过的,对不对,它没有,哎,它没有提示出来。它没有提示需要登录的那个部分啊。他没有提示出来。好,我们接下来看一下啊,因为刚才呢,我之前链接过,没有清除权限。啊,我刚才清除了一下,大家再来看一下,比如说我点击获取数据来自数据库啊,MYSQL数据库。然后这里边呢,它会输入让你输入一个数据库的一个地址,比如说我这里边是这个啊呃,数据库呢,是比如说我的叫。
20:04
这边有个超时命令,大家可以去选一下。啊,选填一项,然后一个SQL语句,如果你的表比较多的话,你可以使用SQL语句去过滤掉其中不需要的数据。然后呢,我点击确定。确定完了以后呢,它有两种登录方式,第一个呢是Windows,第二个数据库,比如说我现在选择我当前的啊。我的名称呢叫做啊这个啊,我的密码呢是。这个。然后呢,这个下边这个不管啊,我点击链接。然后他出了一个报错,我们不需要管它,你看,然后这我这个表里边呢,S这个数据库里边呢,现在有这么多张表,你看他就给我这个全部的,呃,这个。啊,显示出来了,如果需要某几项的话,我直接啊选上就行了,对不对,就选上就行了,下边还有个选择关联表,也就是说你这个表在数据库里边的模型里边,比如说订单主表与哪个表有关系的时候,它会给你自动的把这些都勾选上。
21:10
选择相关的这个表。因为我没有建立关系,所以它里边无法检测啊,如果有的话,它会把关联的表全部给你导进来。然后呢,点击转化数据。转入数据以后呢,我们就可以导到,你看这三张表是我们从数据库里边导进来的啊,导进来的。然后呢,需要对哪些数据进行处理的话,你可以使用PQ直接或者power query啊,我们叫query这个直接做清洗和整理就行。呃,今天的课呢,我们一共讲了这个四种,主要的这个数据库的导入啊呃,数据的导入第一种呢,是从Excel的这个数据区域导入,第二种呢,是从Excel的工作库或者文件夹中去导入啊其中有两种,比如说工作步骤导入的时候呢啊,如果有多个表的时候,需要单独导入的时候。
22:08
我们要分别去选。如果呢,需要合并的时候呢,我们选择这个文件夹啊,这个这个按钮的时候就可以这个。全部都给它导成,导成一个查询啊,然后再展开的话就是合并。就是合并数据对吧,第三个是从完全假中合并Excel这个工作表数据。对吧?我们需要记住一个函数叫ex workbook,这个函数。第三个是从CSV导入的时候,我们要注意CSV的文件编码是这个,这个文件的一个编码形式是什么,比如说UTF8 UTF7,或者十六三十二的什么。还有需要注意的是分隔符是什么,比如说逗号空格,或者说type,第四个呢,数据库权限,呃,这个数据库中啊,那我们这里是以MYS为例的。
23:02
那以蓝色为例。这个里边呢,要需要注意的是,需要注意的是登录的时候啊,登录的时候呃,一定要选对,如果你是用Windows账户的。话你就选Windows,如果是数据库账户的,就是选数据库账户啊,账户的类型啊,一定要选对。嗯,一定要选对,另外呢,在这个我们。啊,导入导入数据库,比如说买S口的时候,他会说你缺少什么连接器啊,啊,你可以去买SSQ软件的这个界面啊,去下载相应的一下这个编辑器啊,或者说这个如果无法解决的话,建议你将MYSQL的这个所有套件都安装上啊,基本上都能解决问题。那这节课就讲到这里,同学们再见。
我来说两句