相比Power BI,Power Query和Power Pivot在行列层级运行计算,Excel一直以来主要还是在单元格层面上的。Excel里,每行每列所有单元格进行相同逻辑的计算时,常规的做法是在第一个单元格填写公式,然后向下向右填充每一个单元格。如下图所示,计算各洲折后价的表格,蓝色区域所有单元格都要填入一个公式。
导语:Power Query 是可证明的,在这个星球上性价比最高的数据处理工具,如果你的工作中需要处理数据,注意,是处理,不是分析,那么此工具必须掌握。对此,90%的鼠标点击,5%的猜测以及5%的公式能力足以。本文来自《Master Your Data》的第十章,非常重要,必须掌握。
毫无疑问,对于开始就以表格形式处理数据的人来说,最简单的方法之一是打开 Excel 并开始在工作表中记录数据。虽然 Excel 并不是真正打算充当数据库的角色,但这正是实际发生的事情,因此 Power Query 将 Excel 文件和数据视为有效数据源。
作为一名数据专家,日常工作很可能都是在使用数据之前对其进行导入、操作和转换。可悲的是,许多人都没有机会接触到拥有精心策划过的数据的大数据库。相反,被不断地喂食 “TXT” 或 “CSV” 文件,并且在开始分析之前,必须经历将它们导入到 Excel 或 Power BI 解决方案的过程。对用户来说,重要的商业信息往往是以以下格式存储或发送给用户的。
各位使用Power BI的小伙伴有很多是从事项目管理相关工作的,咱们的Power BI除了可以基于数据对现状展示以外,还可以对不同项目以及各个阶段工作量进行宏观展示。今天我们就来扒一扒如何利用Power BI做出项目Roadmap以及对项目一目了然的甘特图。
在深入到 Power Query 数据转换的广阔世界之前,最好先确保为将来的成功做好准备。从实际来说,往往一开始的项目或案例都很小,但随着时间的推移,最终会变得越来越复杂。本章描述的方法将有助于确保随着问题的规模变大和复杂性增加,也可以应对。
分析师面临的普遍问题是,无论从哪里获得数据,大部分情况都是一种不能立即使用的状态。因此,不仅需要时间把数据加载到文件中,还得花更多的时间来清洗它,改变它的结构,以便后续做分析的时候能更好的使用这个数据。
我们在使用图片识别文字时常常会出现识别出来的文字是这样的,如果识别出来是这样的东西,它们的数据图片中是4列的,识别变成文字后是一列的:
Power Query 的设计目的就是在业务分析师使用数据之前将数据加载到目标区域的表中。收集数据并将其重塑为所需的格式,Power Query 处理数据的基本流程,如图 1-1 所示。
小勤:大海,能在Power Pivot或Power BI将一个表里的数据匹配到另一个表里吗?
数据专业人员经常做的工作之一是将多个数据集追加到一起。无论这些数据集是包含在一个 Excel 工作簿中,还是分布在多个文件中,问题是它们需要被纵向【追加】到一个表中。
使用 Power Query 的一个非常有趣的场景是,可以利用它从 Web 上抓取与业务相关的数据,并用它来丰富自己的公司数据。数据通常以两种不同的方式之一存储在 Web 上。
设计优良的分析模型是 DAX 高效运行的前提。在本章中,我们将讨论许多与建模有关的主题,这些主题对于理解性能强劲的模型设计非常重要。
编写 DAX 公式时要掌握的核心概念是上下文。DAX 作为一门动态数据分析语言,与 Excel 函数、SQL 查询 和 Power Query 脚本有着根本不同的原因就在于上下文的概念。以上所述的所有其他语言的公式只会在数据发生变化时才会返回不同的结果(除了一些例外情况,例如使用参数时),但是单个 DAX 公式就可以同时提供多个不同的结果,具体取决于您使用它的位置和方式,也就是:上下文。
大海:在Power BI里增加列有2种方法,一种是咱们在学Power Query里的“添加列”方法,还有一种是在PowerPivot里的新建“计算列”方法。具体操作方法如下:
也就是说,“得益于”pq强大的引擎,Text.NewGuid()只运行了一次,的确非常节省算力。
忽略指定过滤器后进行计算。 之前这个使用All函数生成忽略学科教师平均分的度量值,如果用AllExpect函数则可以写成
连接器可以出于各种原因对数据源进行多次调用,包括元数据、结果缓存、分页等。 此行为是正常的,旨在以这种方式工作。
本章专门讨论 Power Query 新手会面临的两个常见问题:理解 Power Query 是基于数据类型(而不是数据格式)的工具,以及如何理解和处理 Power Query 查询中的错误。
大海:当然是可以的。因为你可以通过表(Table)相关的函数分别针对每一个表进行,比如筛选行可以用Table.SelectRows,筛选列可以用Table.SelectColumns……可以非常灵活地组合使用。
Power BI 模型的真正强大之处在于通过使用 DAX 语言进行计算。虽然许多 Power BI 用户专注于模型并试着完全避开使用 DAX,但是除了最简单的基础聚合运算以外,其他所有的计算都需要通过 DAX 来实现。而且,你迟早会在 Power BI 中遇到更复杂的计算需求。根据我们的经验,典型的情况会是:你精心制作的一个 Power BI 报告初稿,会引出有关这些数据的越来越多、越来越复杂的问题。
Power Query 可以在 Power BI 或 Excel 中使用,很多人一开始就在想到底用哪个平台来使用 Power Query,其实不必为此纠结,总有一天会意识到需要把查询复制到一个另一个中的。这有可能是将查询从一个 Excel 工作簿中复制到另一个 Excel 工作簿中,从 Excel 复制到 Power BI,或者从 Power BI 复制到 Excel。在本章中,将探讨将查询从一个工具快速移植到另一个工具的方法。请记住,虽然本书的重点是 Excel 和 Power BI,但这些步骤对于任何承载 Power Query 的工具来说几乎是相同的,即使它包含在其他微软产品或服务中。
新的LAMBDA函数有助于创作可重复使用的LAMBDA函数,同时其本身也是独立的函数。
说实话我没相关这个问题。甚至对于超级表这个概念并不是很清晰,唯一的概念是我在短视频上看到过,当时的感觉就是“这不就是Power query中最简单的功能么?这都啥破教程。”
进入PowBI,弹出的如下页面也可以直接关闭,在Power BI中想要导入数据需要通过Power Query 编辑器,Power Query 主要用来清洗和整理数据。
小勤:我这堆表的表头上有个日期,是表示每张表的更新时间,我想将这个日期变成这个表的一列,然后再和其他表的数据汇总到一起,怎么弄?
数据模型是进行报告分析的基础。为此提供了结构和有序的信息。为确保提供更好的性能、可靠性和准确性,将数据加载到正确设计的模型中是数据分析很重要的一项工作。
本文通过Excel的新功能Power Query结合数据有效性功能,实现最简单实用的去掉重复数据并在表格中下拉显示的效果。
合并来自多个文件数据的传统方法是极其繁琐和容易出错的。每个文件都需要经历导入、转换、复制和粘贴的过程。根据转换数据量的大小和复杂程度、文件的数量以及解决方案运行的时长,这些问题可能形成可怕的积累效应。
这样我们得到3个独立的表。因为返回的结果是list格式,所以我们还需要转成Table格式。
在使用Power Query的时候,我们会编写一些自定义函数,以方便在多个地方需要进行同样的处理时,可以直接调用。
大海:这是因为你订单ID这一列里不全是数字。所以只能用文本类型类表示。而且错误信息里提示也很明确,既提示了错误类型,也显示了第一个出错的值是什么。
以下内容节选自《DAX权威指南:运用Power BI、SQL Server Analysis Services和Excel实现商业智能分析》一书!
小勤:大海,在PowerQuery里面能不能对一列数求和、算个数、求最大、最小值之类的啊?
以下内容节选自《DAX权威指南:运用Power BI、SQL Server Analysis Services和Excel实现商业智能分析》一书! ---- --正文-- DAX(Data Analysis eXpressions),即数据分析表达式,是Microsoft Power BI、Microsoft SQL Server Analysis Services(SSAS)和Microsoft Power Pivot for Excel中使用的编程语言。 它创建于2010年,是随PowerPivot的
视觉,视觉,视觉。本月的(几乎)所有有关视觉效果的内容都包含大量新视觉效果和对现有视觉效果的更新。此外,我们正在帮助用户入门引入画布水印。Power BI出现了一个闪亮的新图标,我们向Power BI Desktop初始屏幕添加了关闭选项。可视化的个性化现已普遍可用,并且我们在预览中引入了动态M查询参数。在移动端,我们(除其他外)增加了对缺口显示的支持,在服务上,我们对“新外观”体验进行了一些更新。
—— —— —— —— —— —— —— —— —— —— —— —— —— —— —— —— —
我们可以观察到当我们点击总海运费,也就是F8单元格的时候,在公示栏里显示的不是我们平时所看到的引用单元格的计算,而是是目的港费用+本地费,这个代表的可能就是使用了名称命名来进行计算。
Power Query 作为桌面端数据清理和转换的工具,能极大解放生产力,将繁琐的数据处理工作从重复的劳动中解放出来。那么,Power Query 能否对外提供计算服务呢?或者说 Power Query 有没有对外提供的编程接口? 根据我的探索,似乎没有,但在网络上找到下面的两种 walkaround 方式,都比较小众。所以如果真的需要数据处理、数据分析服务的话,不如选择其他的方案,比如 pandas 等等,拥有更大的自由度。
在Excel的数据透视表里,我们如果要对某一列的内容进行次数统计和对比,可以同时将该列添加到透视表的“列”和“值”里,如下图所示对金额类别列进行统计对比:
Excel中两列数据的差异对比,方法非常多,比如简单的直接用等式处理,到使用Excel2016的新功能Power Query(Excel2010或Excel2013可到微软官方下载相应的插件)实现各种复杂的数据整理后再进行对比,可以根据实际需要选择使用。
最近,碰到好多个在问怎么实现两列杂乱文本按“相似度”进行匹配的问题。也有大神给出一些VBA的解法——其实这个问题的关键不在于用Power Query还是用VBA,一般来说,VBA里面能写的算法,Power Query里面也都能实现,而且通常实现起来相对简单,并不需要特别专业的人员都能掌握。
下午,我正爽歪歪地喝着咖啡,看着Power BI每秒钟刷新一次,静静等待某个分公司完成本月绩效任务,自动调用Python在钉钉群中发送喜报:
小勤:这个数据明明是个数值啊,为什么用函数ISTEXT判断的时候,结果还是TRUE?也就是说这个还是文本?
👆点击“博文视点Broadview”,获取更多书讯 传统的Excel单表虽然可以有100万行数据的承载量,但是在实际分析时,20万行的数据就已经让传统的Excel非常吃力了。 但是,如果使用Excel中的Power Query和Power Pivot商务智能组件,即使是上百万行数据,也可以在短时间内快速完成处理和分析。 Power Query在Excel和Power BI Desktop中都是内置组件,并且管理界面和知识体系保持了高度一致。 其实,Power BI中的Power Query和Power P
在Power Query及Power Pivot系列课程中,对大家日常学习和使用过程中的较多问题和可能遇到的坑有诸多讲解,比如,PQ系列课一开始就有新手经常遇到问题提示,让大家有一定的印象(也可能很多朋友直接跳过去了):
在Excel中,我们可以通过先在单元格中编写公式,然后向下拖动列来创建计算列。在PowerQuery中,还可以添加“自定义列”并输入公式。在Python中,我们创建计算列的方式与PQ中非常相似,创建一列,计算将应用于这整个列,而不是像Excel中的“下拉”方法那样逐行进行。要创建计算列,步骤一般是:先创建列,然后为其指定计算。
Power BI 2022年5月更新的字段参数功能业务使用价值巨大,以至于本号连续更新相关内容,以下是前情提要:
前文说到可以用LEFT和RIGHT函数来将姓名中间字给换成“*”,步骤其实还比较复杂。
导语:数据对比是日常工作中经常要做的事情,有时只是简单的1列,有时则是很多列,但无论要对比的数据有多少列,逆透视下来后,不就是都是一列了吗?当然,因为列多了,要处理的细节和步骤也自然会多一些。
领取专属 10元无门槛券
手把手带您无忧上云