开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么我得到键错误，即使列存在于pandas中？

在使用pandas时，有时候会遇到"KeyError"的错误，即使我们确认列确实存在于DataFrame中。出现这种情况的原因可能是以下几种情况：

列名大小写问题：在pandas中，列名是大小写敏感的。如果我们使用了错误的大小写来引用列名，就会导致"KeyError"错误。例如，如果我们的列名是"Name"，但我们尝试使用"name"访问该列，就会出现错误。因此，要确保使用正确的大小写来引用列名。
列名前后存在空格：有时候，列名可能在前后存在空格，这可能是在数据导入或处理过程中不小心添加的。当我们使用带有空格的列名访问列时，也会导致"KeyError"错误。解决方法是通过使用.strip()方法去除列名前后的空格，或者使用.rename()方法重命名列名。
使用多级索引：如果DataFrame具有多级索引（即层次化索引），那么访问列时需要使用完整的索引路径。如果我们只提供了其中一部分索引路径，就会导致"KeyError"错误。解决方法是使用df.loc[]来访问列，并提供完整的索引路径。例如，如果有两级索引["A", "B"]和["C", "D"]，我们可以使用df.loc[:, ("A", "C")]来访问对应的列。
数据类型不匹配：在某些情况下，DataFrame中的列可能具有不同的数据类型，例如字符串、整数或浮点数。如果我们尝试在一个数据类型的列上执行不支持的操作，也会导致"KeyError"错误。在这种情况下，需要先将列转换为正确的数据类型，然后再执行操作。
数据缺失：如果我们的DataFrame中存在缺失值（NaN），并且尝试在这些缺失值上执行操作，也可能导致"KeyError"错误。在这种情况下，可以使用.dropna()方法删除包含缺失值的行，或使用.fillna()方法将缺失值替换为其他值，然后再执行操作。

总结起来，解决"KeyError"错误的方法是确保使用正确的大小写引用列名、去除列名前后的空格、使用完整的索引路径（如果有多级索引）、处理数据类型不匹配问题，以及处理数据缺失的情况。

相关搜索:为什么我在phoenix测试中得到这个外键错误？为什么我得到错误“空字段值，即使它不是空的？即使所有列都存在于表中，我也会收到错误"Invalid Column Name“为什么我在嵌套的Dict中得到一个键错误？为什么即使我提供了数据，我也会得到一个验证错误？为什么我在线程错误中得到异常？迭代键列表，如果键存在于给定行/列中，则添加到Pandas DF 为什么即使实现了Iterable，我也会得到foreach编译器错误？为什么即使我在参数中传递文本文件，我也会得到这个文件错误和cat错误？为什么我在下面给出的Django代码中得到一个键错误？为什么我在userDataPersistance示例中得到此错误为什么我在post中得到错误？拉威尔为什么我在flutter中得到这个错误包为什么我从python代码中得到unicode错误？为什么我在Ajax请求中得到400错误为什么我得到“按另一列排序”错误Power BI 为什么我在DataGridView中得到未排序的列？为什么即使在生产环境中我也只能得到100个事务为什么我在Angular中得到这个模板解析错误为什么我在puppeteer中得到文档没有定义错误？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

干货！直观地解释和可视化每个复杂的DataFrame操作

操作数据帧可能很快会成为一项复杂的任务，因此在Pandas中的八种技术中均提供了说明，可视化，代码和技巧来记住如何做。 ?...Merge 合并两个DataFrame是在共享的“键”之间按列（水平）组合它们。此键允许将表合并，即使它们的排序方式不一样。...合并不是pandas的功能，而是附加到DataFrame。始终假定合并所在的DataFrame是“左表”，在函数中作为参数调用的DataFrame是“右表”，并带有相应的键。...包括df2的所有元素，仅当其键是df2的键时才包含df1的元素。 “outer”：包括来自DataFrames所有元素，即使密钥不存在于其他的-缺少的元素被标记为NaN的。...“inner”：仅包含元件的键是存在于两个数据帧键（交集）。默认合并。记住：如果您使用过SQL，则单词“ join”应立即与按列添加相联系。

13.3K2 0

直接请教pandas比gpt还好用

这好办，今天就带大家看看 pandas 里面，是如何使用 openpyxl 读取 excel 文件。不要忘记一键三连。你的点赞、收藏、关注，是我创作的动力。...使用任何能导航代码的 ide，我使用的是 vscode ，输入 pandas 的 read_excel 方法，按住 ctrl 键，鼠标点击方法，即可进入源码文件。...到底 pandas 是如何组织代码？代码中一些奇怪的操作，是为什么？我们一一拆解。行 612 是什么鬼？通过查 openpyxl 的文档，可以知道，原来有些程序(wps？)...或库，在保存文件的时候，会写入关于工作表数据的范围最大行和列的信息。...此时如果只是正常遍历读取，得到的结果是所以 while 循环就是移除这些多余的空单元格如果这种"假单元格"出现在数据行下方: 此时就多了许多空行所以，pandas 在遍历过程中，记录了最后有记录的行索引

3121 0

解决Pandas KeyError: “None of )] are in the “问题

解决Pandas KeyError: "None of [Index([…])] are in the [columns]"问题摘要在使用Pandas处理数据时，我们可能会遇到一个常见的错误，即尝试从...问题描述当我们尝试从DataFrame中选择一组列，但其中一些列并不在DataFrame中时，就会出现这个问题。...', 'commentCount'], dtype='object')] are in the [columns]" 原因这个错误的主要原因是我们尝试访问DataFrame中不存在的列。...可能的原因有：列名的拼写错误或大小写错误。数据源的结构已经发生了变化，导致某些预期的列不再存在。数据源中没有足够的数据来生成所有预期的列。解决方案 1....总结在使用Pandas处理数据时，我们必须确保我们尝试访问的列确实存在于DataFrame中。通过动态地选择存在的列，我们可以确保代码的健壮性，即使数据源的结构发生了变化。

5681 0

解决KeyError: “Passing list-likes to .loc or [] with any missing labels is no long

Pandas库进行数据处理时，我遇到了一个错误：KeyError: "Passing list-likes to .loc or [] with any missing labels is no longer...这是由于最新版本的Pandas库不再支持将缺少标签的列表传递给.loc或[]索引器。在本文中，我将分享如何解决这个错误并继续使用Pandas进行数据处理。...解决方法方法一：使用.isin()方法过滤标签一种解决方法是使用Pandas的.isin()方法来过滤标签，以确保只选择存在于DataFrame中的标签。...我们使用列表推导式和.columns.isin()方法来过滤标签，仅选择存在于DataFrame列中的有效标签。...然后，我们使用.reindex()方法来重新索引DataFrame，仅选择存在于有效标签中的列。

3421 0

数据城堡参赛代码实战篇（四）---使用pandas合并数据表

，那么pandas会自动搜索两个DataFrame中的相同列，如果有，则按该列进行合并，如果没有，则会报下面的错： pandas.tools.merge.MergeError: No common columns...（inner），结果中的键是交集，即只有key值为‘a'和’b'的列，因此上述合并df1和df2的代码和下面的代码等同： pd.merge(df1,df2,how='inner') 另一个需要注意的地方是...，pandas对相同的键做笛卡尔积运算。...a 0.0 5 5.0 a 0.0 6 3.0 c NaN 可以看到，左外连接求取的是左边DataFrame即df1的键值，即['a','b','c']，那么如果某些键不存在于右边的...a 0.0 5 5.0 a 0.0 6 NaN d 2.0 可以看到，右外连接求取的是右边DataFrame即df2的键值，即['a','b','d']，那么如果某些键不存在于左边的

1.8K6 0

《Python for Excel》读书笔记连载11：使用pandas进行数据分析之组合数据

引言：本文为《Python for Excel》中第5章Chapter 5：Data Analysis with pandas的部分内容，主要讲解了pandas如何将数据组合，即concat、join和...前面的内容链接如下： 1.为什么为Excel选择Python？ 2.为什么为Excel选择Python？...幸运的是，组合数据框架是pandas的杀手级功能之一，它的数据对齐功能将使工作变得非常轻松，从而大大减少引入错误的可能性。...，从而自动匹配列名，即使它们在两个数据框架中的顺序不同。...merge接受on参数以提供一个或多个列作为联接条件（joincondition）：这些列必须存在于两个数据框架中，用于匹配行：由于join和merge接受相当多的可选参数以适应更复杂的场景，因此你可以查看官方文档以了解关于它们的更多信息

2.5K2 0

Pandas 的Merge函数详解

在日常工作中，我们可能会从多个数据集中获取数据，并且希望合并两个或多个不同的数据集。这时就可以使用Pandas包中的Merge函数。...如果两个列的名称都存在于两个DataFrame中，则可以使用参数on。...在Inner Join中，根据键之间的交集选择行。匹配在两个键列或索引中找到的相同值。...这是因为它将根据键的距离合并键，而未排序的DataFrame将抛出错误消息。使用merge_asof类似于其他的合并操作，需要传递想要合并的DataFrame及其键名称。...这就是为什么合并发生在这个键上。而order_date ' 2017-04-01 '和' 2017-04-05 '根本没有匹配，因为在delivery_date中没有小于或等于它们的值的值。

2803 0

快速提升效率的6个pandas使用小技巧

，出现频率非常高，而且pandas功能之多让人咋舌，即使pandas老手也没法保证能高效使用pandas做数据分析。...从剪切板中创建DataFrame pandas中的read_clipboard()方法非常神奇，可以把剪切板中的数据变成dataframe格式，也就是说直接在excel中复制表格，可以快速转化为dataframe...() 这功能对经常在excel和python中切换的分析师来说简直是福音，excel中的数据能一键转化为pandas可读格式。...如果说我只要需要数值列，也就是数据类型为int、float的列，可以通过select_dtypes方法实现： df.select_dtypes(include='number').head() 选择除数据类型为...在上图中，glob()在指定目录中查找所有以“ data_row_”开头的CSV文件。 glob()以任意顺序返回文件名，这就是为什么使用sort()函数对列表进行排序的原因。

3.3K1 0

6个提升效率的pandas小技巧

，即使pandas老手也没法保证能高效使用pandas做数据分析。...然后在python中执行pd.read_clipboard()，就能得到一模一样的dataframe数据表： pd.read_clipboard() ?...这功能对经常在excel和python中切换的分析师来说简直是福音，excel中的数据能一键转化为pandas可读格式。 2....如果说我只要需要数值列，也就是数据类型为int、float的列，可以通过select_dtypes方法实现： df.select_dtypes(include='number').head() ?...在上图中，glob()在指定目录中查找所有以“ data_row_”开头的CSV文件。 glob()以任意顺序返回文件名，这就是为什么使用sort()函数对列表进行排序的原因。

2.8K2 0

嘀~正则表达式快速上手指南（下篇）

在步骤2中可以避免这种情况。 ? 为了避免由 From: 域导致的错误，我们要用一个 if 来检查 sender 是不是 None。...值得注意的是，即使教程看起来是线性的，即使教程看起来是直截了当的，但实践中需要更多的尝试。第二步中使用了一个之前熟悉的正则表达式 \w\S*@.*\w, 用来匹配实际的邮件地址格式。...在步骤3A中，我们使用了if 语句来检查s_email的值是否为 None, 否则将抛出错误并中断脚本。...我们的小型测试文件中只有7个。全部代码如下: ? 我们已经打印出了emails 列表的第一项, 它是由键和键值对组成的字典. 由于使用了 for 循环，因此每个字典拥有相同的键，但键值不同。...使用 pandas 处理数据如果使用 pandas 库处理列表中的字典那将非常简单。每个键会变成列名, 而键值变成行的内容。我们需要做的就是使用如下代码: ?

4K1 0

python：Pandas里千万不能做的5件事

作为一个在进入数据分析领域之前干过开发的攻城狮，我看到我的同行以及新手在使用 Pandas 时会犯很多低级错误。今天我说出这五个坑，让大家别一而再，再而三的掉坑里。...错误3：让Pandas消耗内存来猜测数据类型当你把数据导入到 DataFrame 中，没有特别告诉 Pandas 列和数据类型时，Pandas 会把整个数据集读到内存中，只是为了弄清数据类型而已。...错误4：将DataFrames遗留到内存中 DataFrames 最好的特性之一就是它们很容易创建和改变。但不幸的副作用是，大多数人最终会得到这样的代码： ?...发生的情况是你把 df2 和 df1 留在 Python 内存中，即使你已经转移到 df3。...如果你是在服务器上，它正在损害该服务器上其他所有人的性能（或者在某些时候，你会得到一个 "内存不足 "的错误）。

1.5K2 0

飞速搞定数据分析与处理-day4-pandas入门教程

背景这个并不是书籍里的章节，因为书籍中的pandas节奏太快了，基本都是涉及很多中高级的操作，好容易把小伙伴给劝退。我这里先出几期入门的教程，然后再回到书籍里的教程。...Pandas 介绍什么是 Pandas? Pandas是一个用于处理数据集的Python库。它具有分析、清理、探索和操作数据的功能。 为什么要用Pandas?...• 两个或多个列之间是否存在关联? • 平均值是多少？? • 最大值? • 最小值? pandas还可以删除不相关的行，或者包含错误的值，如空值或空值。这被称为“清理”数据。...一个 Pandas Series就像表格中的一列。它是一个一维数组，容纳任何类型的数据。...print(myvar["y"]) 作为系列的键/值对象在创建一个系列时，你也可以使用一个键/值对象，比如字典。

2323 0

其实你就学不会 Python

Pandas 中主要用一个叫 DataFrame 的东西来处理这类表格数据，上面的表格读入 DataFrame 后是这样的：看起来和 Excel 差不多，只是行号是从 0 开始的。...，为什么出来这么多列，它像是对每一列都做了同样的动作，好奇怪。...明明分组汇总结果也是个有行有列的结构化数据表，继续用 DataFrame 不好吗？为什么要再搞一种东西？让人费解。 Python 并没有止步于这两个。...估计到这里不少人已经晕了，完全搞不清我都在胡说八道些什么。嗯，这就对了，这才是职场人员的正常状态。...结果，编程基本靠搜，即使跑对了也还是搞不懂记不住，下次还得搜。再进一步，将各部门员工按照入职时间从早到晚进行排序。

981 0

pandas中ix的使用详细讲解

这是为什么呢？这是由于ix的复杂特点可能使ix使用起来有些棘手：如果索引是整数类型，则ix将仅使用基于标签的索引，而不会回退到基于位置的索引。如果标签不在索引中，则会引发错误。...而，s.loc[:6]返回了KeyError错误，这是因为标签6并不在索引中。那么，s.ix[:6]报错的原因是什么呢？...那么，给ix一个整型数字，ix会立即使用iloc操作，而不是报KeyError错误。...举例，考虑有下述例子中的Dataframe。我们想得到直到包含标签’c’的行和前4列。...到此这篇关于pandas中ix的使用详细讲解的文章就介绍到这了,更多相关pandas ix内容请搜索ZaLou.Cn以前的文章或继续浏览下面的相关文章希望大家以后多多支持ZaLou.Cn！

1.8K1 0

分享一个Pandas应用实战案例——使用Python实现根据关系进行分组

遍历数据框的每一行 for _, row in df.iterrows(): sender = row['发起'] receiver = row['接收'] # 检查发起者是否已存在于映射关系中...()) + 1 if groups else 1 groups[sender] = group # 检查接收者是否已存在于映射关系中 if receiver not in...in result.keys(): result[v] = k else: result[v] += "," + k print(result) 运行之后可以得到如下结果...['夏侯', '荀彧'], ['孙权', '鲁肃'] ] g.add_edges_from(data) nx.draw_networkx(g) 代码运行后的结果如下：三、总结大家好，我是皮皮...往期精彩文章推荐：盘点一个Python自动化办公的问题——批量实现文件重命名（方法一）使用Pandas返回每个个体/记录中属性为1的列标签集合 Pandas实战——灵活使用pandas基础知识轻松处理不规则数据

2012 0

手把手教你用Pandas透视表处理数据（附学习资料）

本文重点解释pandas中的函数pivot_table，并教大家如何使用它来进行数据分析。...数据使用pandas中pivot_table的一个挑战是，你需要确保你理解你的数据，并清楚地知道你想通过透视表解决什么问题。...列vs.值我认为pivot_table中一个令人困惑的地方是“columns（列）”和“values（值）”的使用。...“Quantity”列将对我们有所帮助，所以将“Quantity”添加到“values”列表中。...我一般的经验法则是，一旦你使用多个“grouby”，那么你需要评估此时使用透视表是否是一种好的选择。高级透视表过滤一旦你生成了需要的数据，那么数据将存在于数据帧中。

3.1K5 0

Python数据分析的数据导入和导出

例如，usecols='A:C'表示只读取A、B和C列。 dtype：指定每列的数据类型。可以是字典（列名为键，数据类型为值）或None。 skiprows：指定要跳过的行数。...例如，kw={'allow_comments': True}表示允许在JSON文件中包含注释。返回值： Python对象：将JSON数据解析后得到的Python对象。...txt文件中的数据时,可以使用pandas模块中的read_table方法。...header：指定数据中的哪一行作为表头，默认为‘infer’，表示自动推断。 names：用于指定列名，默认为None，即使用表头作为列名。...，不保存索引列，保存列名，数据从第3行第2列开始，合并单元格，使用utf-8编码，使用pandas的默认引擎。

2331 0

合并Pandas的DataFrame方法汇总

因此，如果其中一个表中缺少user_id ，它就不会在合并的DataFrame中。即使交换了左右行的位置，结果仍然如此。...在上面的示例中，还设置了参数 indicator为True，以便Pandas在DataFrame的末尾添加一个额外的_merge 列。...“id006”和“id007”只存在于右DataFrame中（在本例中是df1）。...在上述示例中，它是user_id键。...也会得到类似上面的相同结果。

5.7K1 0

干货｜一文搞定pandas中数据合并

一文搞定pandas的数据合并在实际处理数据业务需求中，我们经常会遇到这样的需求：将多个表连接起来再进行数据的处理和分析，类似SQL中的连接查询功能。...pandas中也提供了几种方法来实现这个功能，表现最突出、使用最为广泛的方法是merge。本文中将下面?四种方法及参数通过实际案例来进行具体讲解。...参数on 用于连接的列索引列名，必须同时存在于左右的两个dataframe型数据中，类似SQL中两个表的相同字段属性如果没有指定或者其他参数也没有指定，则以两个dataframe型数据的相同键作为连接键...参数suffixes 合并的时候一列两个表同名，但是取值不同，如果都想要保存下来，就使用加后缀的方法，默认是 _x,_y，可以自己指定 ? ? 参数sort 对连接的时候相同键的取值进行排序 ? ?...— 02 — concat 官方参数 concat方法是将两个 DataFrame数据框中的数据进行合并通过axis参数指定是在行还是列方向上合并参数 ignore_index实现合并后的索引重排

1.3K3 0

pandas 分类数据处理大全（附代码）

这是因为使用str会直接让原本的category类型强制转换为object，所以内存占用又回去了，这是我为什么最开始说要格外小心。解决方法就是：直接对category本身操作而不是对它的值操作。...在合并中，为了保存分类类型，两个category类型必须是完全相同的。这个与pandas中的其他数据类型略有不同，例如所有float64列都具有相同的数据类型，就没有什么区分。...当对category列分组时，默认情况下，即使category类别的各个类不存在值，也会对每个类进行分组。一个例子来说明。...默认情况下，当按category列分组时，即使数据不存在，pandas也会为该类别中的每个值返回结果。...category列的分组:默认情况下，获得数据类型中每个值的结果，即使数据中不存在该结果。可以通过设置observed=True调整。

1.2K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭