所有要进行操作的文件下载链接: https://pan.baidu.com/s/10VtUZw8G-Ly-r4VypntjiA 密码: y5qu 下载成功后,整个文件夹如下图所示。
在深入到 Power Query 数据转换的广阔世界之前,最好先确保为将来的成功做好准备。从实际来说,往往一开始的项目或案例都很小,但随着时间的推移,最终会变得越来越复杂。本章描述的方法将有助于确保随着问题的规模变大和复杂性增加,也可以应对。
下午,我正爽歪歪地喝着咖啡,看着Power BI每秒钟刷新一次,静静等待某个分公司完成本月绩效任务,自动调用Python在钉钉群中发送喜报:
Power Query 的设计目的就是在业务分析师使用数据之前将数据加载到目标区域的表中。收集数据并将其重塑为所需的格式,Power Query 处理数据的基本流程,如图 1-1 所示。
连接器可以出于各种原因对数据源进行多次调用,包括元数据、结果缓存、分页等。 此行为是正常的,旨在以这种方式工作。
数据专业人员经常做的工作之一是将多个数据集追加到一起。无论这些数据集是包含在一个 Excel 工作簿中,还是分布在多个文件中,问题是它们需要被纵向【追加】到一个表中。
上回提到,Power BI借助Python做关联分析,可以轻松地找出物品中的频繁项集,且该频繁项集内的物品数量不限于2个。实现方式既可以通过Power BI里添加Python可视化控件直接生成Python式图表,也可在PQ里借助Python处理数据。前者最大的好处体现在与切片器联动中,是即时计算新的频繁项集。不足在于Python图表的风格与Power BI不一致,而且由于直接输出Python图(没有输出数据源),不便于开展其他分析。后者,正好解决了这些不足。
不知大家在工作中有没有过提取pdf表格数据的经历,按照普通人的思维,提取pdf的表格数据的方法可能会选择复制粘贴,但这是一个相当繁杂且重复的工作。而今天我们会讲解如何用python和excel来提取pdf的表格数据,看二者哪个更为方便!
本文节选自我正在撰写的一本新的PowerBI书籍,书名还没有想好,目录也没有,内容目前也很少。本不打算发出来,但最近遇到了很多小伙伴的一些共性问题,如今天所要讲的路径参数化。路径参数化有很多用途,一个简单的作用是更换数据源时方便快捷,但是由于最近很多小伙伴将PowerBI账号升级为PowerBI+office365,将数据源从本地Excel文件切换到onedrive for business,不知道该怎么方便地在两种“介质”中转换,所以这篇文章提前放出来以飨诸位。
在用Power Query处理数据表的过程中,经常碰到一个问题——标题行是变化的,比如下面这个例子,日期随着数据的变化而更新:
文章背景: 工作中,可能需要每个月汇总数据。如果数据源的格式固定,可以通过Power Query制作一份工具文件,每个月只需要更新数据源的路径,就可以省去重复的手工操作。
工欲善其事,必先利其器,没有好的工具,怎么能高效的开发出高质量的代码呢?本文为各ASP.NET 开发者介绍一些高效实用的工具,涉及SQL 管理,VS插件,内存管理,诊断工具等,涉及开发过程的各个环节,让开发效率翻倍。 Visual Studio Visual Studio Productivity Power tool: VS 专业版的效率工具。 Web Essentials: 提高开发效率,能够有效的帮助开发人员编写CSS, JavaScript, HTML 等代码。 MSVS
【每周一本书】之《Microsoft Power BI 数据可视化与数据分析》
在本系列的第 14 篇,我介绍了类似 BOM 的数据应该怎么存储,以及在 Power Query 中如何展开。那篇文章使用创建辅助查询的方法,从而简化了在查询编辑器的操作,小白都是可以理解和掌握的。但如果我们来回顾一下处理的过程,有很多重复的操作,比如合并和展开第 2 级数据,合并和展开第 3 级数据等等。有编程概念的人立即想到,应该用循环来解决啊。在编程语言中,循环是一种基础的控制结构,是基础的东西,但在 PQ 中却没有直接的循环语句,需要通过函数的辅助来实现。上篇介绍了 List.Generate 函数之后,我们可以对 BOM 数据的展开进行优化了。
前面我们介绍了Power BI 是什么,今天介绍如何用Power BI 获取数据。
中讲解了在Power BI中对两个表进行合并查询,数据集大小影响了效率。尤其是在进行合并查询之前删除了不需要的列,可以较大地提升合并查询的效率。但是我们不禁要问:
Power Query提供了大量数据连接器。 这些连接器从 TXT、CSV 和Excel文件等数据源到Microsoft SQL Server等数据库,以及 Microsoft Dynamics 365 和 Salesforce 等常用 SaaS 服务。 如果未在 “获取数据 ”窗口中看到数据源,则始终可以使用 ODBC 或 OLEDB 连接器连接到数据源。
在使用Power Query的时候,我们会编写一些自定义函数,以方便在多个地方需要进行同样的处理时,可以直接调用。
在Excel中,拆分是一项常见的任务,而Excel中的“分列”功能只能将单列文本拆分成多列。如果想拆分并提取文本中的数字,或者将文本拆分成多行,那么使用Power Query是一个好的选择。
微软宣布开启 Copilot for SQL Azure 内部预览,提供自然语言到 SQL 的转换和数据库自助管理功能。
参数化查询增加了查询的灵活性。Power Query 可以设置和管理参数,同一工作簿下所有查询都可以使用。
本章专门讨论 Power Query 新手会面临的两个常见问题:理解 Power Query 是基于数据类型(而不是数据格式)的工具,以及如何理解和处理 Power Query 查询中的错误。
在Power Query里,如果遇到空值(null),就要注意对其进行操作(对比判断、筛选、计算等)时可能出现的特殊情形。
M 语言或者叫 M 查询语言是 Power Query (简称为 PQ) 幕后的英雄。据说 Power Query Editor 可视化操作可以实现 PQ 80% 的功能,所以从操作层面来说,大部分人不用学习 M 语言,但学习和掌握 M 语言无疑是在数据处理的时候如虎添翼,而且,有一些 M 的基础也能加深对 PQ 操作步骤的理解,进而有可能对这些应用的步骤做一些优化和改善。总的来说,M 是一种值得学习和掌握的技能,Excel 和 Power BI 都可以用。
Power Query 是微软提供的工具,Excel 2013 版作为插件加载使用,从 Office 2016 版开始,Power Query 的功能集成到 Excel 中,可以直接使用。微软推出 Power BI Desktop 后,一系列的工具,比如 Power Query, Power Pivot, Power View 等,都集成在其中。Power Query 定位查询,中文一般翻译为超级查询,主要作用是连接不同种类的数据源,进行数据的转换。下图来自微软官方对 Power Query 的介绍,可以帮助理解。Power Query 主要实现连接和转换功能。
1. Visual Studio Visual Studio Productivity Power tool:Visual Studio 专业版(及以上)的扩展,具有丰富的功能,如快速查找,导航解决方案,可搜索的附加参考对话框等 ReSharper:提高 .NET 开发人员生产力的工具,提高代码质量,通过提供快速修复消除错误,等等 MZ-Tools:它可以在方法、文件、项目、解决方案或项目组、选定的文本,文件组合或项目组合中找到字符串。结果示于下面的结果窗口中,比由 Microsoft IDE 提供的要更方
导语:Power Query 是可证明的,在这个星球上性价比最高的数据处理工具,如果你的工作中需要处理数据,注意,是处理,不是分析,那么此工具必须掌握。对此,90%的鼠标点击,5%的猜测以及5%的公式能力足以。本文来自《Master Your Data》的第十章,非常重要,必须掌握。
我们在日常工作中不可避免的会遇到按条件查询数据的情况。如果是单条件查询,我们通常会使用VLOOKUP函数解决;当遇上两个或多个条件查询时,我们还继续使用函数,则效率会有所降低。
视觉,视觉,视觉。本月的(几乎)所有有关视觉效果的内容都包含大量新视觉效果和对现有视觉效果的更新。此外,我们正在帮助用户入门引入画布水印。Power BI出现了一个闪亮的新图标,我们向Power BI Desktop初始屏幕添加了关闭选项。可视化的个性化现已普遍可用,并且我们在预览中引入了动态M查询参数。在移动端,我们(除其他外)增加了对缺口显示的支持,在服务上,我们对“新外观”体验进行了一些更新。
本篇讲解 List.Generate 函数的用法。这个函数的功能是用于生成 list,可以是单值,也可以是结构化类型,比较灵活,使用起来有一定难度。
据说,全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。这个“啤酒+尿布”的购物篮组合,就是关联分析的一个经典应用场景。简单来说,关联分析就是在大量数据中找到最常出现的组合。
函数是 Power Query (PQ) 解决问题的核心。之前的博客文章我多层刻意在完成查询的步骤之后显示高级编辑器中 M 语言代码,想必大家已经对 M 的函数有了初步印象,尽管不一定很关注。本篇介绍 M 函数比较重要的知识点。
👆点击“博文视点Broadview”,获取更多书讯 传统的Excel单表虽然可以有100万行数据的承载量,但是在实际分析时,20万行的数据就已经让传统的Excel非常吃力了。 但是,如果使用Excel中的Power Query和Power Pivot商务智能组件,即使是上百万行数据,也可以在短时间内快速完成处理和分析。 Power Query在Excel和Power BI Desktop中都是内置组件,并且管理界面和知识体系保持了高度一致。 其实,Power BI中的Power Query和Power P
要创建高级查询,请使用查询编辑器。mashup 查询由由let表达式封装的变量、表达式和值组成。变量可以通过使用 # 标识符和引号中的名称来包含空格,如 #"Variable name"。
近几年,Python是越来越火了,就连地产大佬潘石屹都在年近不惑之时开始学习Python编程语言,我们做数据分析和运营的怎能不熟练运用呢?
以工资类所得应交个税为例,最新的个税起征点为 5000 并按下表的级次进行缴税(假设没有其它扣除项)。
毫无疑问,对于开始就以表格形式处理数据的人来说,最简单的方法之一是打开 Excel 并开始在工作表中记录数据。虽然 Excel 并不是真正打算充当数据库的角色,但这正是实际发生的事情,因此 Power Query 将 Excel 文件和数据视为有效数据源。
正如上周技术小结中说得那样,对这个项目来说,SQL和BI不是必须的。所以今天我们来看看纯Excel的实现方案。
Vim是从 vi 发展出来的一个文本编辑器。代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。
M语言是Power Query的后台函数式编程语言,你在Power Query界面的操作过程都会记录下来并翻译成M语言。
几乎所有的教程都会告诉你,使用 Power BI 获取数据最简单的方式是从本地excel表中获取,紧接着教你如何从本地文件夹中获取多个文件。
Excel Power Query功能强大,但我一直没有涉足,因为Excel太博大精深了,光是Excel本身的功能、Excel公式与函数、VBA就够研究的了。然而,新的东西总是要接触的,毕竟也是Excel的一部分。后续会学习一些这方面的知识并与大家分享。本文主要学习整理自stringfestanalytics.com,供参考。
在日常办公工作中,我们可能会碰到多个或者几百上千个数据结构都相同 sheet工作表需要你进行合并汇总。而excel和python都能进行工作表的合并,那你知道他们两个的操作谁更为好用的吗?今天就分别介绍excel和python合并工作表的方法,看看合并工作表那家强!
在电商行业的数据管理中,一般会把库存数据转换成单条数据的数据表,在传统Excel中操作比较耗时耗力。而使用Power Query,就会变得十分轻松。假如我们需要将图1的数据转换成图2的数据样式。
PowerQuery是一个微软创建的基于Excel的免费插件,可以在Excel2010(及更高版本)使用。在Excel 2016及PowerBIDestop中已经内置。
进入PowBI,弹出的如下页面也可以直接关闭,在Power BI中想要导入数据需要通过Power Query 编辑器,Power Query 主要用来清洗和整理数据。
Vim是一个超牛的编辑器,命令功能十分强大 。而且这些命令大都可以进行组合 , 比如,9yy命令表示复制9行内容,9表示要复制的行数,同样100dd表示删除100行,当数字和命令合作的时候,就比单纯的
点击左上 File > Settings > Themes ; 如下图,左边是设置 菜单的主题,右边是设置代码的主题。修改后即可见效果。
图1所示的工作表中,列A中有许多空行,要使用每段空行上方单元格中的内容来填充这些空行,结果应该如下图2所示。
领取专属 10元无门槛券
手把手带您无忧上云