在Power Query中读取csv的前n行，而不解析整个文件

在Power Query中，可以使用以下步骤来读取csv文件的前n行，而不解析整个文件：

打开Power Query编辑器：在Excel中，选择"数据"选项卡，然后点击"从文本/CSV"按钮。
在弹出的对话框中，选择要读取的csv文件，并点击"导入"按钮。
在Power Query编辑器中，你会看到一个预览窗口，显示了csv文件的内容。
在预览窗口中，点击右上角的"编辑"按钮，进入编辑模式。
在编辑模式中，你可以看到Power Query的脚本编辑器，显示了数据的转换步骤。
在脚本编辑器中，找到"Source"步骤，这是读取csv文件的步骤。
在"Source"步骤上方，点击右键，选择"复制"。
在"Source"步骤下方，点击右键，选择"插入"，然后选择"自定义"。
在新插入的步骤中，点击右键，选择"重命名"，将其命名为"CustomSource"。
在"CustomSource"步骤中，点击右键，选择"编辑"。
在编辑窗口中，你可以看到Power Query的M语言代码。
在M语言代码中，找到"Source"部分，这是读取csv文件的代码。
在"Source"部分的代码中，找到"File.Contents"函数，这是读取整个文件的函数。
将"File.Contents"函数替换为以下代码：

Csv.Document(File.Contents("文件路径"),[Delimiter=",", Encoding=1252, QuoteStyle=QuoteStyle.None, SkipLines=n])

其中，"文件路径"是你的csv文件的路径，"n"是你想要跳过的行数。

点击"确定"按钮，保存修改。
返回到Power Query编辑器，你会看到预览窗口中只显示了前n行数据。

这样，你就成功地在Power Query中读取了csv文件的前n行，而不解析整个文件。请注意，这个方法只是跳过了文件中的前n行，而不是只读取前n行。如果你想要只读取前n行数据，可以在"CustomSource"步骤后添加一个"Table.FirstN"步骤来实现。

相关·内容

Power Query 真经 - 第 5 章 - 从平面文件导入数据

【注意】问问自己，是否曾经在 Excel 中打开一个 “CSV” 或 “文本” 文件，发现其中一半的日期是正确的，而另一半则显示为文本？...（译者注：通过指定数据源来自的地域，Power Query 会根据当地的默认规则来识别数据，而 “Changed Type” 是基于已经解析好的数据再更改数据格式，是两件不同的事。）...Power Query 将扫描数据集的前 1000 行，看看它能找出什么规律。除此之外，还需要回到导出数据的程序中去，并进行一些测试，以弄清数据的来源。...图 5-4 导入带有分隔符的文件到 Power Query 编辑器中【注意】请记住，Power Query 会尝试解析数据类型，使用【控制面板】的【区域】设置来识别这些数据元素。...5.3.2 清洗无分隔符文件当开始清理一个无分隔符文件时，第一件事是将数据转换成含有一列的表。在本例中，由于前 10 行没有什么价值，可以删除，从第 11 行开始才是表中的列数据。

5.1K2 0

批量汇总CSV文件数据，怎么只剩一列数据了？

即：在用Power Query批量汇总CSV文件数据时，自定义写公式解析文件，结果展开时，只有一列数据：对于这个问题，一般情况下是不会出现的，Csv.Document函数会自动识别出该文件分成了多少列...所以，我专门要了他所需要汇总的部分文件来看，发现两个特点：该CSV文件明显是从某些系统导出来的；该CSV文件在具体数据前，有多行说明信息，每行信息都只有第一列有内容（这个可能不是关键影响因素，经自己构建...CSV测试，这种情况不影响所有数据的读取）而针对这个单独文件，通过从CSV文件导入的方式，是可以完全识别出所有数据的，但生产的步骤（源）里，是一个完整的参数信息，其中明确指出了列数：...根据这个情况，我们直接修改前面批量汇总时使用的公式，加入Columns参数，结果解析正常：后续再按解析出来的内容进行整理合并即可，关于其中处理掉多余行、再合并等方法，可以参考以下系列免费视频...上面的例子，主要体现大家可能会遇到的情况：从某些系统导出来的CSV文件，可能在不给出解析函数的某些参数时，部分数据读取不全的情况（这种情况在自己模拟的CSV文件中没有出现），一旦出现类似情况，可以尝试从单文件角度先研究解决办法

1.5K2 0

Power Query 真经 - 第 1 章 - 基础知识

1.2 提取在本章节中，将看到在 Excel 或 Power BI 中导入一个简单的 “CSV” 文件到 Power Query 中，用来展示 Power Query 是如何处理上述任务的、它在用户界面上是如何显示的...【数据类型检测】：这个选项允许用户设置如何判断各字段的数据类型，通过前 200 行，或基于整个数据集，或根本不检测数据类型。另一件需要注意的重要事情是，由于大小限制，数据预览是被截断的信息。...这个提取的过程中，Power Query 的内部算法解析了数据源的内容并以表显示。第 1 行看起来与接下来的几行不同，它看起来像一个标题。...（译者注：作为最佳实践，要注意这个数据类型推断是基于每列的前 200 行，是双刃剑，既可以自动推断数据类型，也可能由于样本太少而导致推断错误。...在 Power BI 中：转到【主页】【刷新】。在此之后，剩下的工作就是等待 Power Query 从文件中读取数据，对数据进行处理，并加载到 Excel 表或 Power BI 的数据模型中。

4.8K3 1

PQ-数据获取2：CSV（及文本文件）数据源获取及需要注意的问题

如CSV中经常在数据前加说明文字，如下图所示：对于这个数据，我们按前面标准的方法导入，结果却是这样的：尼玛，怎么只有一列？...原来，CSV是靠逗号分隔的，但第一行里没有逗号，于是被Power Query识别为只有一列——有时候，太智能自动化了也不是什么好事。那怎么办呢？...实际上，Power Query导入的一些参数是可以修改的。...如下图所示，单击【应用步骤】中【源】右边的齿轮按钮：出现以下窗口（因为是CSV类文件，所以Power Query中默认以CSV文档的方式导入）：为了能避免CSV类文档中逗号分隔的问题...，这里通过选择改成“文本文件”：这个时候，整个文件会被当做只有一列：数据进来了，第一行不要的，先删掉：按逗号拆分列：最后，提升第一行为标题：

9214 0

PQ-数据获取：CSV（及文本文件）数据源获取及需要注意的问题

如CSV中经常在数据前加说明文字，如下图所示：对于这个数据，我们按前面标准的方法导入，结果却是这样的：尼玛，怎么只有一列？...原来，CSV是靠逗号分隔的，但第一行里没有逗号，于是被Power Query识别为只有一列——有时候，太智能自动化了也不是什么好事。那怎么办呢？...实际上，Power Query导入的一些参数是可以修改的。...如下图所示，单击【应用步骤】中【源】右边的齿轮按钮：出现以下窗口（因为是CSV类文件，所以Power Query中默认以CSV文档的方式导入）：为了能避免CSV类文档中逗号分隔的问题，这里通过选择改成...“文本文件”：这个时候，整个文件会被当做只有一列：数据进来了，第一行不要的，先删掉：按逗号拆分列：最后，提升第一行为标题：终于搞定，后面想搞啥就搞啥去吧。

1.2K2 0

使用Power Query时的最佳做

备注若要查看Power Query中可用连接器的完整列表，请参阅Power Query中的连接器。提前筛选建议始终在查询的早期阶段或尽早筛选数据。...上次执行昂贵的操作某些操作需要读取完整的数据源才能返回任何结果，因此在Power Query 编辑器中预览速度较慢。例如，如果执行排序，则前几行可能位于源数据末尾。...在Power Query 编辑器中，此类操作只需要读取足够的源数据才能填充预览。如果可能，请先执行此类流式处理操作，最后执行任何成本更高的操作。...这有助于最大程度地减少每次向查询添加新步骤时等待预览呈现的时间。临时处理数据子集如果在Power Query 编辑器中向查询添加新步骤很慢，请考虑先执行“保留第一行”操作并限制要处理的行数。...然后，添加所需的所有步骤后，删除“保留第一行”步骤。使用正确的数据类型Power Query中的一些功能与所选列的数据类型相关。

3.5K1 0

Power Query 真经 - 第 8 章 - 纵向追加数据

本章不会解决用户在转换中触发错误的问题（尽管以后的章节会解决），但会向用户展示 Power Query 如何合并两个或更多的数据集，而不必担心用户把最后几行的数据粘贴过来导致数据重复。...浏览 “第 08 章示例文件 / Jan 2008.csv”【导入】【转换数据】。 Power Query 将打开该文件，并为该数据源自动执行以下步骤。...图 8-2 这些查询显示在 Excel 的【查询 & 连接】窗格（左）和在 Power Query【查询】导航窗格（右） 8.1.1 追加两个表下一项工作是创建用于后续分析的整个表，这需要将上述表格追加在一起...它显示的行数随用户添加的数据而变化，可以在 Power Query 编辑器的左下角看到这一点，如图 8-5 所示。...至此，已经探索了用外部数据源的手动追加，以及如何为工作簿中的数据生成自动更新系统，有没有可能把这些合并起来，创建一个系统，可以推广到合并一个文件夹中的所有文件，而不必在 Power Query 中手动添加每个文件

6.6K3 0

常用PQ语法

power query学习笔记，记录下一些不可直接操作但使用频次相对较高的一些语法大数据时代的来临，每天需要处理的数据量都很大，对于部分计算机语言学起来比较吃力的同学，可以选择PQ进行大体量数据的处理...Table.Skip(table,n) #跳过n行 Table.FirstN(table,n) #取前n行 Table.AddColumn(已添加自定义, "日期", each Text.Middle...]) #读取excel文件的第一个sheet Table.AddColumn(源, "自定义", each Excel.Workbook([Content],true){Name="powerquery..."}[Data]) #读取excel文件的sheet名为 powerquery的sheet Table.AddColumn(源, "自定义", each Csv.Document([Content...],[Delimiter=",", Columns=13, Encoding=65001, QuoteStyle=QuoteStyle.None]) #读取csv文件

4912 0

Power Query 真经 - 第 3 章 - 数据类型与错误

默认情况下，Power Query 在设置数据类型时只预览前 1000 行，这意味着如果数据集中的第一个小数值显示在第 1001 行，Power Query 将选择一个【整数】数据类型，在导入时对该列的所有行进行四舍五入...最后一个设置，【列配置文件】当选择一整列时，在屏幕底部提供了一个更详细的视图。【注意】如果检查 Power Query 窗口底部的状态栏，会看到【基于前 1000 行的列分析】这句话。...这不是很明显，但这些字是可以单击的，将允许更改分析范围：【基于整个数据集的列分析】，而不是默认的 1000 行。将会注意到，一些统计数据和图表没有显示在 “Units Sold” 列中。...【警告】在利用删除行之前，建议先浏览整个数据，以确保可以这样做。最谨慎的方法是替换错误，而最强硬的方法是删除任何列中有错误的行。使用哪一种方法完全取决于数据本身。...在 Excel 中可能允许的这样做，因为 Excel 在 “Units Sold” 列乘以 10 之前，会隐含地将 “Units Sold” 列转换为数值类型，而 Power Query 则会反馈：“不

5.2K2 0

优化Power BI中的Power 优化Power BI中的Power Query合并查询效率，Part 1：通过删除列来实现

本篇文章主体部分为翻译Chris Webb的一篇文章。合并查询在Power Query中是很成熟的应用，相当于SQL中的各种JOIN（抽时间会写几篇SQL的join，算是SQL的小核心）。...但同时，在Power Query中合并查询是一个常见的影响刷新效率的因素。在我的工作中，经常会遇到对一些非文件夹性质的数据源进行合并查询操作，所以我一直在想，有没有办法可以对其进行优化。...以下是我的测试数据源，只有一个CSV格式的文件，100万行7列数字格式的数据A, B C, D, E, F 和G: ? 在本次测试当中，我使用了SQL Server 事件探查器去计算刷新的时间。...首先，我对这个CSV文件创建了两个连接，按照惯例，将第一行转为标题，将7列数字全都定义为整数格式。...– 0 秒以上的确能够得出结论：合并查询时，列数的多少的确会影响效率，以上还揭示了：在以上两个查询中，读取数据是立刻发生的，几乎不占用时间，相比之下，最开始的两次查询中读取数据的时间甚至要比执行SQL

4.5K1 0

让系统自动选择空闲的GPU设备！帮你一次解决抢卡争端

比如Tensorflow，在tensorflow \ python \ framework中定义了设备函数，返回一个用户执行操作的GPU设备的上下文管理器对象。...还有我自己查到的index，name，power.draw, power.limit ? 于是我们有了基本思路，用os.popen执行相关命令，解析返回文本信息。...return: a dict of gpu infos Pasing a line of csv format text returned by nvidia-smi 解析一行...','power.limit']+qargs cmd='nvidia-smi --query-gpu={} --format=csv,noheader'.format(','.join(qargs...by nvidia-smi 解析一行nvidia-smi返回的csv格式文本 ''' numberic_args = ['memory.free', '

3.7K11 0

开发 | 如何为TensorFlow和PyTorch自动选择空闲GPU，解决抢卡争端

比如Tensorflow，在 tensorflow\python\framework 中定义了device函数，返回一个用来执行操作的GPU设备的context manager对象。...还有我自己查到的index，name，power.draw, power.limit ? 于是我们有了基本思路，用os.popen执行相关命令，解析返回文本信息。...return: a dict of gpu infos Pasing a line of csv format text returned by nvidia-smi 解析一行...','power.limit']+qargs cmd='nvidia-smi --query-gpu={} --format=csv,noheader'.format(','.join(qargs...by nvidia-smi 解析一行nvidia-smi返回的csv格式文本 ''' numberic_args = ['memory.free', 'memory.total

1.2K8 0

Power Query 系列 (02) - 从文件导入数据

Power Query (本文和以后也用 PQ 作为 Power Query 的缩写) 数据处理的起点是获取数据，在我所接触过的数据处理工具中，PQ 能处理的数据源种类算是比较多的，比如基于文件、基于数据库...导入文本文件/CSV 文件基本上，大体所有的工具都接受文本文件/CSV文件作为数据源，CSV 文件和普通的文本文件区别主要在于分隔符，CSV 默认逗号分隔而已。...所以我们在不同的系统间进行数据迁移的时候，没有好的方法，就可以用 CSV 文件作为载体。...导入的步骤基本和导入文本文件相同，但因为 json 文件的格式原因，PQ 不能直接上载，而是进入 Power Query Editor 界面。....85))，大家可以把这个数据放在扩展名为 xml 的文件中。

1.8K2 0

大数据分析工具Power BI（三）：导入数据操作介绍

导入数据操作介绍进入PowBI，弹出的如下页面也可以直接关闭，在Power BI中想要导入数据需要通过Power Query 编辑器，Power Query 主要用来清洗和整理数据。...，操作步骤如下：1、点击"转换数据"，打开Power Query编辑器2、选择"新建源"->"Excel工作簿"，导入对应的 excel 数据二、导入csv或文本数据导入csv或文本格式数据与导入Excel...复制粘贴到"2021年销售信息表"文件夹内：然后在Power Query 页面点击"刷新预览"即可将相应的"2022年销售信息表"全部excel数据合并在一起。...二进制数据默认就是对应的Content列的内容。是否使用标题：true表示使用第一行作为标题，不填或null或false都表示不使用。...如果还有其他文件夹的数据，只要包含以上excel中的这些列，都可以直接放入到表格读取的文件夹中后，点击"刷新预览"就会将数据批量导入进来。

2.2K4 1

mysql之存储引擎体系结构查询机制（二）

3，不管表采用什么样的存储引擎，都会在数据区，产生对应，不管表采用什么样的存储引擎，都会在数据区，产生对应的一个的一个frm文件（表结构定义描述文件） csv存储引擎数据存储以数据存储以CSV文件...文件特点：不能定义没有索引、列定义必须为NOT NULL、不能设置自增列不适用大表或者数据的在线处理 CSV数据的存储用,隔开，可直接编辑CSV文件进行数据的编排数据安全性低注：编辑之后...；在所有组中，id值越大，优先级越高，越先执行 select_type 查询的类型，主要是用于区分普通查询、联合查询、子查询等 SIMPLE：简单的select查询，查询中不包含子查询或者union...，则没有使用索引 rows 根据表统计信息或者索引选用情况，大致估算出找到所需的记录所需要读取的行数 filtered 它指返回结果的行占需要读到的行 (rows 列的值) ) 的百分比表示返回结果的行数占需读取行数的百分比...， filtered extra 十分重要的额外信息 Using filesort ： mysql 对数据使用一个外部的文件内容进行了排序，而不是按照表内的索引进行排序读取 Using temporary

7654 0

Pandas 2.2 中文官方教程和指南（十·二）

names 数组样式，默认为`None` 要使用的列名列表。如果文件不包含表头行，则应明确传递`header=None`。不允许在此列表中存在重复项。...如果列头行中的字段数等于数据文件主体中的字段数，则使用默认索引。如果大于，则使用前几列作为索引，以使数据主体中的字段数等于列头中的字段数。表头后的第一行用于确定列数，这些列将进入索引。...nrowsint，默认为None 要读取的文件行数。用于读取大文件的片段。 low_memoryboolean，默认为True 在块中内部处理文件，从而在解析时降低内存使用，但可能混合类型推断。...如果您依赖 pandas 推断列的 dtype，解析引擎将会推断数据的不同块的 dtype，而不是一次推断整个数据集的 dtype。因此，您可能会得到包含混合 dtype 的列。...当文件在每个数据行末尾都有分隔符时，解析器会产生一些异常情况，导致解析混乱。

1450 0

pandas.read_csv 详细介绍

pandas.read_csv 接口用于读取 CSV 格式数据文件，由于它使用非常频繁，功能强大参数众多，所以在这里专门做详细介绍，我们在使用过程中可以查阅。...列名 names 如果文件不包含列名，那么应该设置 header=None，列名列表中不允许有重复值。...，解析列名将变为 ‘X’, ‘X.1’…’X.N’而不是 ‘X’…’X’。...(c引擎不支持) # int, default 0 pd.read_csv(filename, skipfooter=1) # 最后一行不加载读取行数 nrows 需要读取的行数，从文件开关算起，经常用于较大的数据...请注意，无论使用chunksize还是iterator参数以块形式返回数据，整个文件都将被读取到单个DataFrame中。

5.2K1 0

BI为什么我的查询运行多次？

不过，即使在此处，也可以获取多个请求，因为数据源未缓存 (例如本地 CSV 文件) ，因此对数据源的请求不同于由于下游操作 (可以更改折叠) 而缓存的请求，缓存太小 (相对不太可能) ，或因为查询大致同时运行...详细信息：缓冲表加载到Power BI Desktop模型在Power BI Desktop中，Analysis Services (AS) 使用两个评估来刷新数据：一个用于提取架构（即通过请求零行实现的架构...详细信息：禁用数据隐私防火墙后台数据下载 (也称为“后台分析”)与为数据隐私执行的评估类似，默认情况下，Power Query编辑器将下载每个查询步骤的前 1000 行预览。...设置Power Query编辑器无需重新连接或重新创建查询，只需在Power Query编辑器中打开要测试的查询。如果不想使现有查询混乱，可以在编辑器中复制查询。...此步骤假设你不担心源之间的数据泄漏，因此，可以使用Excel中的“设置快速组合”选项中所述的“始终忽略隐私级别”设置设置来完成数据隐私防火墙的禁用，或者使用“忽略隐私级别”，并可能会提高Power BI

5.5K1 0

批量汇总文件数据，有多种文件类型怎么办？

小勤：批量合并多文件数据时，有多种文件格式怎么办？大海：这个问题解决的思路很简单，Power Query里针对不同的格式有不同的解析函数。...大海：一次性解析出来是可以，但是，因为不同类型文件的数据会因为分隔符或文件构成等不同而存在不同。...比如：文本文件可能是用tab键分隔数据 csv则经常用逗号分隔数据而Excel里即使只有一个表，也要先解析出表，然后才能进一步解析出表里的数据…… 小勤：对哦。这样问题就复杂了。大海：嗯。...大海：先按文件类型分别合并，最后在一次性合并（追加）啊。小勤：有道理啊。反正如果是不同类型的文件的话，即使写函数公式也只能分开处理。大海：嗯。...所以，你通过从文件夹新建查询的方式将数据接入Power Query后，可以直接根据扩展名进行筛选：比如可以先筛选txt类的：然后就可以直接按照文本文件的数据汇总方法了

7601 0

Power Query 真经 - 第 2 章 - 查询管理

Power Query 不仅需要从 “CSV” 文件中调用相同的数据，而且还必须处理 “暂存” 查询的所有步骤，然后才能处理和加载 “客户” 查询的结果。...图 2-3 在 Power Query 编辑器中 “Basic Import.csv” 文件的预览效果很多用户有过这样的经验：建立了一个表，但在几个月后，业务变更导致需要调整表的列，如何确保在查询中用到的表是否包含需要的列...在 Power BI 中可以单独配置每个查询，而 Excel 只允许用户在一个 Power Query 会话中创建的所有查询选择一个加载目的地（自 Power Query 编辑器可以在 Excel 中使用以来...110 万行的表加载到 Excel 的表中，因为这超过了 Excel 的表容量限制，而数据模型则不受限，甚至可以加载 1 亿行数据，如果的确需要的话，当然，需要一定的加载时间。）...图 2-20 在 Power Query 编辑器中通过拖放更改文件夹顺序（译者注：在原书的示例文件中，其排列顺序是：Data Model，Staging Queries，Raw Data Sources

2.6K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云