首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Power Query 真经 - 第 3 章 - 数据类型与错误

图 3-1 Excel 示例数据 在这里看到 Excel 已被格式化数据。虽然表格显示每个数值都被四舍五入到第一显示小数位数,但会注意到它们都被格式化为显示 6 位小数。...默认情况下,Power Query 设置数据类型时只预览前 1000 行,这意味着如果数据集中第一个小数值显示第 1001 行,Power Query 选择一个【整数】数据类型,导入时对该所有行进行四舍五入...它们甚至是斜体,这似乎表明它们确实是日期。 如果数据直接加载到 Excel 工作表。...如果它不能做到这一点,收到无法转换错误。虽然设置为【文本】数据类型时很少出现这种错误,但在【文本】更改为几乎任何其他类型时,这种错误就很常见了。...【注意】 也可以回到 “ErrorData 错误” 查询并强制刷新预览,但仍然需要等待数据加载,为什么不同时数据集加载到最终目的地呢? 可以结果得到两个观察结果,如下所示。

5.4K20

Power Query 真经 - 第 8 章 - 纵向追加数据

第一行提升为标题,显示列为:“Date”、“Account” 、“Dept” 和 “Amount”。 数据类型自动转换为【日期】、【整数】、【整数】和【小数】。...行数显示界面的左下方。 为了验证和可视化加载到 Excel 数据量,可以在这里用数据透视表来汇总数据。 选择 “Transaction” 表任何单元格【插入】【数据透视表】。...图 8-12 一月到三月记录现在显示一个【数据透视表】 【注意】 记住,如果查询被加载到 Excel 或 Power BI 数据模型,点击一次【刷新】就可以更新数据源和任何透视或可视化对象。...此时已经成功地创建了一个工作表读取数据 “黑科技”, “打印区域” 读取每一,如图 8-25 所示。...需要注意是,应用这种技巧场景第一行提升为标题是有风险,因为如果有人不关心日期,他们可能会删除 “Feb 2008” 这一,这就会导致出错。

6.7K30
您找到你想要的搜索结果了吗?
是的
没有找到

Power Query 真经 - 第 6 章 - Excel导入数据

与任何数据源一样,当 Excel 表导入时,Power Query 获得数据,然后尝试为每一设置数据类型。应该注意到,在这个过程Excel 工作表数据格式被忽略了。...尽管这个功能很好,很有帮助,但也有点令人沮丧,因为它强制在数据上使用表格格式。除了表和区域,这种方法是否可以其他 Excel 数据对象获得数据呢?...“Kind” 显示数据表包含是哪种对象。 “Hidden” 告诉用户该对象是否可见。 需要注意另一件事是,“Data” 显示 “Table” 对象与其他预览数据颜色不同。...Excel ,她并不包括命名区域内,但作为工作表读取时,它就显示出来了。如果该充满了 “null” 值,可以直接选择该并将其删除,或者思考下,这里是不是可以直接将它删除呢?...通过删除数据集中所有多余和行,重新设置 Excel 数据范围。如果这是一个由 Excel 中使用数据范围额外单元格所引发问题,那么 “Column7” 将不再出现。

16.4K20

Power Query 真经 - 第 5 章 - 平面文件导入数据

【注意】 问问自己,是否曾经 Excel 打开一个 “CSV” 或 “文本” 文件,发现其中一半日期是正确,而另一半则显示为文本?...5.3.2 清洗无分隔符文件 当开始清理一个无分隔符文件时,第一件事是数据转换成含有一表。本例,由于前 10 行没有什么价值,可以删除,第 11 行开始才是表数据。... Excel 用户界面,非打印字符被显示为一个方框小问号。 Power Query ,它们显示为一个空格。...【替换为】设置为 1 个空格,单击【确定】。 现在有一个完全干净数据集,可以加载到。 【注意】 不幸是,没有一个简单功能可以文本字符串删除内部 “空白”。...【注意】 数据载到数据模型( Excel 或 Power BI )只需要一次更新,就可以更新数据以及针对数据模型创建所有透视表 / 图。

5.2K20

Power Query 真经 - 第 9 章 - 批量合并文件

筛选到适当子文件夹级别(如有必要)。 扩展名转换为小写字母。 扩展名筛选限定为同一种文件类型。 名称通过筛选排除临时文件(以“~”开头文件名)。 执行任何需要额外筛选。...9.6 步骤 3:转换示例文件 触发原始合并之后,要做下一件事是清洗数据。这一步总体目标是做以下工作,来创建一个规范化数据集。 数据拆分成若干数据集中删除垃圾行和垃圾。...图9-22 【逆透视】数据前四是由文件夹和文件名驱动 【警告】 数据类型永远不会“转换示例文件”中继承。载到工作表或数据模型之前,一定要确保更改数据类型作为查询最后一步来设置。...:“Year”,“Quarter”。 结果( Excel 和 Power BI )如图9-24所示。此时 Power BI 展开到了季度级别来显示季度数据。...构建这些解决方案时,用户必须问自己第一个问题是,是否真的需要所有这些数据 2030 年,真的会关心 2019 年数据吗?如果要与前一年数据进行比较,可能最多需要 32 个文件。

4.8K40

Power Query 真经 - 第 4 章 - Excel 和 Power BI 之间迁移查询

此时,Power BI 执行文件中导入数据过程,并在完成后显示结果,如图 4-6 所示。...转到【主页】【转换数据】。 右击 “Sales” 查询,确保【启用加载】被选中。 转到【主页】【关闭并应用】。 图 4-8 加载到工作表查询显示其加载被禁用 这一次,表才会被加载到数据模型。...图 4-17 为什么 “Date” 所有的值都显示为 “Error” 阅读错误信息时,可以看到该正试图 “43131” 设置为一个日期。但是这个数字是怎么来呢?...在这里看到是 Power BI 文件创建表,这是 Excel 复制数据结果。有趣是,它 “Date” 不包含日期,而是包含一数值,如图 4-18 所示。...图 4-19 我们有我们日期序列号 【注意】 一个奇怪细微差别是,“Date” 顶部错误栏可能继续显示为红色。

7.7K20

Power Query 真经 - 第 7 章 - 常用数据转换

例如在本例,拆分列为多行与拆分列为多后再逆透视是等价,而头带有额外信息与内容位置一一对应,导致使用拆分列为多后再逆透视成为了本场景下正确方法,虽然步骤多了一点,但正确性是第一。)...【警告】 这个搜索框应用了一个筛选器,显示包含用户输入字符模式任何值。不接受通配符和数学运算符。 处理过程中有超过 1,000 行数据集时,遇到一个挑战。...但如果数据将被加载到 Excel 或 Power BI 数据模型为了后续制作透视表,那么对输出进行排序是不必要,因为展示层可以再进行排序,解决这个问题。...【注意】 【分组依据】对话框还有一个聚合选项可用【所有行】。这个神秘选项将在第 13 章进行探讨。 现在是时候完成这个数据集并将其加载到目的地了。 “Date” 重命名为 “Year”。...导入数据时,挑战一下自己,看看是否可以减少所携带细节和行数量。请记住,如果过度缩减数据,总是可以回到分组步骤并删除它(或重新配置它)。当数据集变得更小,解决方案更加稳定和性能会更好。

7.3K31

字段变化引发Power Pivot导入数据问题

使用Excel Power Pivot制造超级透视表时候,很多人喜欢外部数据直接导入Power Pivot,而不是使用Power Query预处理一番。...打开数据分析工作簿Power Pivot后台,选择“其他源”-“Excel文件”: 选择准备好店铺资料表,并勾选“第一行作为标题”。...非常遗憾,由于外部数据是直接通过Power Pivot导入,新增字段并不会自动显示,需要我们做一些额外设置。...2.删减字段引发问题 ---- 假设“开业日期”这个字段不再维护,店铺资料表删除。再次刷新Power Pivot,会发生什么?...系统报错,无法正常刷新: 这是因为原模型“开业日期”已经不存在,Power Pivot无法数据源获取该字段。

1.4K30

强大易用Excel转Json工具「建议收藏」

https://github.com/ylbs110/ExcelExportTool 功能说明 使用简单,不需要额外关联文件 批量处理excel文件 同一个excel文件可配置多个json并导出 可对...有主从关系则从表名称作为主表项,数据根据配置输出到该项(表为obj类型除外) 表格主从关系配置 主表名称为正常表名,作为最后输出表名 表名格式为 表名~主表名 需要配置对应主表主键...,表头以开头,可以仅为 可对表名加上修饰符进行输出限定,格式为 表名#修饰符,修饰符可以为: obj:该表每一项作为单独对象输出,如果是表则直接单独每一条数据作为子项目添加到上级表单 dic...限定表格式为 表名#修饰符~主表名 表格数据基本配置 键名为空或者健名前加上!...则该不会被读取 主键以*开头,没有主键则默认除映射主表列以外第一为主键 数据类型会自动识别,也可在列名后面可以跟修饰符进行限定,格式为 键名#修饰符 修饰符可以为: int : 如果是数值类型则强制转换为整形

6.6K20

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

读取外部数据 Excel 和 pandas 都可以各种来源以各种格式导入数据。 CSV 让我们 Pandas 测试中加载并显示提示数据集,这是一个 CSV 文件。...日期功能 本节提到“日期”,但时间戳处理方式类似。 我们可以日期功能分为两部分:解析和输出。Excel电子表格日期值通常会自动解析,但如果您需要,还有一个 DATEVALUE 函数。... Pandas ,您需要在从 CSV 读取时或在 DataFrame 读取一次时,纯文本显式转换为日期时间对象。 解析后,Excel电子表格以默认格式显示日期,但格式可以更改。... Pandas ,您通常希望使用日期进行计算时日期保留为日期时间对象。输出部分日期(例如年份)是通过电子表格日期函数和 Pandas 日期时间属性完成。...选择 Excel电子表格,您可以通过以下方式选择所需: 隐藏; 删除; 引用从一个工作表到另一个工作表范围; 由于Excel电子表格通常在标题行命名,因此重命名列只需更改第一个单元格文本即可

19.5K20

PQ小问题小技巧8个,第一个就很多人都遇到了!

2、PQ数据加载不完整问题 小勤:为什么PQ处理数据载到Excel时最后一行是一堆省略号? 大海:数据上载不全,某些版本里偶然存在这种情况,一般Excel里再刷新一下数据即可。...3、整列替换技巧 小勤:PQ所有值替换为null空值,怎么操作好呢? 大海:原删掉,直接 小勤:,怎么呀?...6、超过百万行数据载到Excel 小勤:我目前处理数据已经超过100万行了,我想要把power query清洗数据载到CSV中保存,但是加载时候总是显示不能完全加载缺失数据,跟Excel一样只能显示...大海:PQ本身不支持数据载到CSV,只能先加载Excel,然后再另存为CSV,但Excel本身对单表就是有行数限制,所以会显示不能完全加载情况。...,应加载到ExcelExcel设置。

2.2K30

2022年最新Python大数据Excel基础

数据计算 1.简单计算 Excel,使用函数要学会为单元格“命名”。...输入: conca自动提示,选择第一个字符串合并 选择要合并字符串用英文逗号分隔,额外添加字符串也用逗号分隔,用英文单引号或者双引号包起来 保留原百分号,需要用到文本格式化 数据排序 按数值大小排序...理解字段 创建透视表后,Excel面板分为三个区域,左边是透视表显示区,右上方是字段列表区,右下方是字段设置区 字段布局步骤 : 勾选需要字段 => 设置字段 =>(筛选,计算方式) => 查看透视表是否符合需求...字段设置有以下两个要点:即,透视表和行分别显示什么数据数据统计方式是什么。 字段设置 •移动字段 首先,字段可以字段列表中直接拖拽添加到下方区域。...如左下图所示,“日期【行】区域内,选中“日期”进行拖拽,可以拖动到【】区域内。 字段设置 •设置字段值 透视表是一种可以快速汇总大量数据表格。

8.2K20

字段变化引起Power Pivot故障

使用Excel Power Pivot制作超级透视表时候,很多人喜欢外部数据直接导入Power Pivot,而不是使用Power Query预处理一番。...打开数据分析工作簿Power Pivot后台,选择“其他源”-“Excel文件”: 选择准备好店铺资料表,并勾选“第一行作为标题”。...非常遗憾,由于外部数据是直接通过Power Pivot导入,新增字段并不会自动显示,需要我们做一些额外设置。...2.删减字段引发问题 假设“开业日期”这个字段不再维护,店铺资料表删除。再次刷新Power Pivot,会发生什么?...系统报错,无法正常刷新: 这是因为原模型“开业日期”已经不存在,Power Pivot无法数据源获取该字段。

17010

EasyExcel太方便易用了,强烈推荐

EasyExcel是阿里巴巴开源一个Excel处理框架,使用简单、节省内存。节省内存原理也很简单,解析Excel时没有文件数据全部加载到内存当中,而是磁盘文件中一行行读取。...创建实体类 EasyExcel易用性体现之一就是可以通过实体类中使用注解形式,来与Excel表头进行绑定。...完毕"); } } 该监听器,通过重写AnalysisEventListener方法来获得解析数据、表头信息,以及解析完毕之后执行操作信息。...当然,也可以使用实现Converter接口方式实现(同性别实现)。 排除指定Excel 很多场景下,Excel与实体类可能并不完全一致,这时就需要排除一些实体类字段。...:同一Excel可以调用方法时排除不同数据

3.6K20

Python数据分析数据导入和导出

verbose:指定是否显示详细信息。默认为False。 以上是read_excel()函数一些常用参数,还有其他参数可以需要时进行了解。...dayfirst(可选,默认为False):用于指定是否日期天作为第一位。 cache_dates(可选,默认为True):用于指定是否缓存解析日期时间数据。...pandas导入JSON数据 read_json() read_json函数是一个读取JSON文件函数。它作用是指定JSON文件加载到内存并将其解析成Python对象。...xlsx格式数据输出 to_excel to_excel函数是pandas库一个方法,用于DataFrame对象保存到Excel文件。...对象df保存为名为’data.xlsx'Excel文件,Sheet1写入数据,不保存索引,保存列名,数据第3行第2开始,合并单元格,使用utf-8编码,使用pandas默认引擎。

18110

单列文本拆分为多,Python可以自动化

标签:Python与Excel,pandas Excel,我们经常会遇到要将文本拆分。Excel文本拆分为,可以使用公式、“分列”功能或Power Query来实现。...示例文件包含两,一个人姓名和出生日期。 图2 我们任务如下: 1.把名字和姓氏分开 2.将出生日期拆分为年、月和日 让我们数据载到Python。...在这里,我特意“出生日期类型强制为字符串,以便展示切片方法。实际上,pandas应该自动检测此列可能是datetime,并为其分配datetime对象,这使得处理日期数据更加容易。...一旦我们Excel表加载到pandas,整个表将成为pandas数据框架,“出生日期将成为pandas系列。因为我们不能循环,所以需要一种方法来访问该系列字符串元素。...让我们“姓名”尝试一下,以获得名字和姓氏。 图7 拆分是成功,但是当我们检查数据类型时,它似乎是一个pandas系列,每行是包含两个单词列表。

7K10

Python基于Excel长度不定数据怎么绘制折线图?

本文介绍基于Python语言,读取Excel表格数据,并基于给定行数范围内指定数据,绘制多条曲线图,并动态调整图片长度方法。  首先,我们来明确一下本文需求。...现有一个.csv格式Excel表格文件,其第一为表示时间数据,而靠后几列,也就是下图中紫色区域内,则是表示对应日期属性数据;如下图所示。  ...其中,第一是一个表示时间、循环增长,其数值2023001开始,到2023365结束,然后会继续再从2023001开始,以此类推;并且每一个循环中,有些日期可能会缺失,即并不是每天都有数据。  ...我们现在希望,对于给定行数起始值与结束值(已知这个起始值与结束值对应第一数据,肯定是一个完整时间循环),基于表格后面带有数据几列(也就是上图中紫色区域内数据),绘制曲线图;并且由于这几列数据所表示含义不同...,也就是处于指定行数内数据;time就是第一数据,也就是一个循环内时间序列,time_x则用于显示图片x轴刻度——之所以需要这个,是因为我这里希望用字符形式来表示图片中x轴刻度(如果用数字的话

8210

Python基于Excel数据绘制动态长度折线图

本文介绍基于Python语言,读取Excel表格数据,并基于给定行数范围内指定数据,绘制多条曲线图,并动态调整图片长度方法。   首先,我们来明确一下本文需求。...现有一个.csv格式Excel表格文件,其第一为表示时间数据,而靠后几列,也就是下图中紫色区域内,则是表示对应日期属性数据;如下图所示。   ...其中,第一是一个表示时间、循环增长,其数值2023001开始,到2023365结束,然后会继续再从2023001开始,以此类推;并且每一个循环中,有些日期可能会缺失,即并不是每天都有数据。   ...我们现在希望,对于给定行数起始值与结束值(已知这个起始值与结束值对应第一数据,肯定是一个完整时间循环),基于表格后面带有数据几列(也就是上图中紫色区域内数据),绘制曲线图;并且由于这几列数据所表示含义不同...,也就是处于指定行数内数据;time就是第一数据,也就是一个循环内时间序列,time_x则用于显示图片x轴刻度——之所以需要这个,是因为我这里希望用字符形式来表示图片中x轴刻度(如果用数字的话

11210

一步一步教你制作销售业绩分析报告

1、使用Excel文件创建日期表   新建Excel文件,Excel工作表手动填写相应日期字段(注意:第一日期是必须,其他日期字段大家可以按需求添加即可) ?   ...小结:Excel方式处理日期表最大优势在于可以随时进行改动,也可以添加,方便在报表中使用数据。   ...PowerBI中会自动识别业务数据涉及日期范围生成日期表。本文中业务数据日期范围2018-1-1到2019-12-31所有日期。当然我们还需要添加日期,如年份,月份等。...可视化面板拖放日期表中年,月字段和销售明细表本期销售业绩和去年同期销售业绩,来展现效果查看验证度量值是否取数准确。 ? 计算好本期销售业绩和去年同期销售业绩后,开始新建同比度量值。...这里添加KPI Indicator图表控件,大家可以业务场景选择不同业务指标。注意:商店中有些控件会显示需要额外购买,该类型控件属于收费控件 ? 按照下图添加相应值 ?

5.2K21

Power Query 真经 - 第 1 章 - 基础知识

然后它自动增加了这一步,数据载到目的地之前 “锁定” 这些数据类型。会看到最常见数据类型如下所示。 日期 / 时间(用日历 / 时钟图标表示)。 整数(用 123 图标表示)。...完成后,数据载到新工作表一个表,如图 1-14 所示。...幸运是,右边【字段】列表中选择一个表切换到【数据】区域时,仍然可以看到这些信息。当这样做时,加载总行数显示页面的左下角。...此时,Power Query 针对更新数据源执行它每一个步骤,更新输出加载到目的地。最棒一点是什么呢?让刷新变得非常容易。 Excel :转到【数据】【全部刷新】。... Power BI :转到【主页】【刷新】。 在此之后,剩下工作就是等待 Power Query 文件读取数据,对数据进行处理,并加载到 Excel 表或 Power BI 数据模型

4.9K31
领券