1.
Power BI for Excel是MS Excel为了应对大数据时代数据来源和数据量日益宽泛庞大,同时人们对数据处理的商务化智能化需求又日益迫切而推出的一系列组件,它包含了从数据获取、清洗、建模到可视化等一系列数据分析的完整过程。其中,如您所知,Power Query用于数据获取和整理,Power Pivot用于数据建模等……
有人说,Power BI for Excel的出现使Excel函数彻底沦为表格的一项基础功能,耸肩,也许吧。另外还有人说,Power BI完全可以代替VBA了——摊手,关于这点,却不得不说是一条错误的言论。Power BI能做到的,VBA几乎都能做;而VBA能做到的,Power BI却未必可以,比如增改删数据库数据或文件对象等等等,又如何能谈到代替呢?
事实上,Power BI的一系列组件,例如Power Query,均属于三分工具七分语言的性质,而VBA则属于纯语言;因此,除了可解决的问题上有一小部分重叠外,两者并不具备完全系统的可比较性。
是的,你可能经常见到有人拿Power Query的工具部分和VBA作比较,说前者点下鼠标就可以解决问题,后者还需写长长的代码,诸如此类。这样的比较(工具&语言)显然从逻辑上就有失偏颇。如果比工具,也应该和VBA开发的一系列优质插件做比较——相信你很少见到有人拿M语言(PowerQuery)或者DAX语言(Power Pivot)和VBA相较长短吧?毕竟前者只是侧重于数据分析,而后者则是从数据分析到文件操作、数据库操纵……不一而足。
……
……
那么,如此说来,Power BI 还有必要学吗?
有人说,当然要学啦,现在全中国会的人很少,您学会了,就是Power BI全国一流专家啦——然而一流专家的虚有名头有个P用哦?虚弱脸问一声包吃住吗?
我们的观点是,即便你只是一个普通的Excel使用者,Power BI——也还是需要学的。
前面说过,Power BI 是三分工具七分语言。语言部分可以不学或者少学,如果你不是重度PowerBI用户,或者说是依靠Power BI为重要工具的数据分析从业人员,多半没有学习相关语言的必要性——学会了用不上很快也会忘,又不是寂寞难耐非要谈恋爱,何必呢?
但工具部分却是要学的,原因无它,简单!实用!!比如Power Query的合并查询功能,可以轻松处理多表多工作簿数据的汇总、查询等问题;PowerPivot的数据关联,可以使透视表天生就拥有一对VLOOKUP函数的翅膀……当然,最主要的的原因是,工具部分学起来相当简单,顶多一周左右的时间就足够了。如此物超所值的一件事,何乐而不为呢?凝视您双眸……
如果你不是一个普通的Excel使用者,而是把Excel作为数据分析的重要甚至主要手段,那么,深入了解微软的新锐技术Power BI的重要性自不赘言。
众所周知,数据分析的第一步是获取及整理数据,因此,接下来就让我们就从主掌此项功能的Power Query走起吧。
2.
一个严肃的生存性问题,Power Query在哪里?
如果你使用的是Office2016,它其实一直就在你面前。
如果是Excel2010/2013版本,请自行找百度君搜索如何加载……如果是Excel 2003版本,友情拥抱,很抱歉,亲爱的,现在是公元2018年了。
通常而言,使用Power Query处理数据的过程,可以归纳为搜索数据源并创建链接;根据个人需求转换、组合数据;最后进行数据共享或报表创建。
那么,都有哪些类型或者说来源的数据可以导入Power Query呢?
点击【数据】选项卡下的【新建查询】按钮,从弹出的下拉框中可以看到各种选项。这包含了文件(Excel工作簿,CSV,XML,文本,文件夹等)、数据库(各种主流及非主流数据库)、微软云Azure、以及其它来源(网页web、Facebook等)。也就是我们平时常用的,少用的,甚至不用的,各种可能性数据源几乎都包括其中了。
……
……
3
举个小栗子,大体了解下Power Query处理数据的过程吧。
倘若我们需要从Excel获取一份文本文件的数据。在过去,我们会使用数据选项卡下的【自文本】功能。
使用该功能,通常你只有将数据导入到Excel后,才可以灵活的进行数据整理工作,比如删除不需要的行和列、清除稀奇古怪的制表符等等;而当数据源发生了改变,不好意思,之前所有的操作,都需要再重新进行一次,甚至多次……酸爽的感觉不要不要的吧?
试一下PowerQuery?
3.1导入数据
依次单击【数据】选项卡下的【新建查询】【从文件】【从文本】,在弹出的【导入数据】对话框中,选择目标文本文件,例如本例中的“学生信息.txt”
将文本文件选择【导入】后,进入以下界面。
中间是数据预览,右下方有三个按钮,分别是加载、编辑、取消。【加载】的意思是将数据加载到当前Excel工作表或其它指定工作表的位置,【编辑】是进入Power Query查询编辑器,【取消】顾名思义就是取消操作进程并退出的意思。
我们点击【编辑】按钮,进入查询编辑器,得到以下画面。
和Excel的窗口界面长的相似,一看就知道不是远亲必是近邻呐(隔壁老王系列)。上方为功能区,在【开始】选项卡下,集合了最常用的功能按钮,此外还有【转换】、【添加列】和【视图】等选项卡,相关功能以后我们会陆续分享到。中间部分是数据预览。右侧为【查询设置】窗格。
【查询设置】中的【应用的步骤】,记录了我们对数据每次操作;这些操作包括了数据连接(数据源)、删除列、合并以及更改数据类型等等。它会拍摄优化后的数据集的快照,并记录在案。删除步骤,可以起到Ctrl+Z后退的效果。点选步骤,可以回到过去的某个操作段中。
需要说明的是,在【查询编辑器】中的操作,只是更改数据预览中的数据,而并不会更改数据源的数据。这是优点,当然,未尝也不是缺点——你只能改变自己,永远无法改变对方,独上高楼暮然回首幽怨脸。
3.2.转换数据
如上一张图所示,假设数据的前4行,也就是“来源……禁止商业用途”之类,我们并不需要保留,因此需整行删除。单击功能区的【删除行】按钮,选择【删除最前面的几行】,在弹出的对话框中输入行数4,并点击【确定】按钮。
另外第6列为空白列,也无需导入Excel。右键单击标题column6,在右键快捷菜单中选择【删除】即可。
小贴士:对于任何软件而言,有一个通用的标准,也就是鼠标左键为选取键,右键为功能键。因此,当你需要对某事物做操作,而不知道有哪些功能可以使用时,可以左键选取,右键查看功能菜单。
如上图所示,删除行列后的数据标题栏是column1/column2……这显然并不是我们所希望的。我们希望数据标题栏是现在第一行的数据,也就是班级、姓名……这是一种很常见的问题,Power Query对此提供了专门的按钮【将第一行用作标题】,见下图。
操作到这一步,倘若已不需要对数据进一步的整理(比如将现在的二维表转换为一维表等,该技巧下节我们会分享),便可以单击【开始】选项卡下的【关闭并上载】将数据导入Excel。
数据上载到Excel表格后,默认为【表】状态。单击数据范围中的任一单元格,可以得到两个选项卡。一个是【设计】,是【表】功能自带的。另一个是【查询】,属于Power Query。当数据源文件,也就是学生表.txt的记录发生增删情况时,只需单击【刷新】按钮,即可获取更新后的数据源数据,并且,我们设定完毕的数据格式不会随意发生改变。
光说不练假把式,你也动手试试吧。
握爪,致安,下期见。
领取专属 10元无门槛券
私享最新 技术干货