如何在pandas dataframe中组合具有重复名称的列？

在pandas dataframe中，如果存在具有重复名称的列，可以使用多级列索引来组合这些列。下面是一种方法：

首先，将具有重复名称的列重命名为不同的名称，以便在组合时不会发生冲突。可以使用rename()函数来实现这一点。

df = df.rename(columns={'duplicate_col': 'duplicate_col_1'})

然后，使用MultiIndex.from_tuples()函数创建一个多级列索引对象，并将重复列的新名称作为元组传递给该函数。

df.columns = pd.MultiIndex.from_tuples([('duplicate_col', 'duplicate_col_1')])

最后，使用join()函数将具有相同名称的列组合在一起。

df = df.join(df[('duplicate_col', 'duplicate_col_1')])

这样，具有重复名称的列就会被组合在一起，并且可以通过多级列索引进行访问。

这种方法适用于任意数量的具有重复名称的列。如果有多个具有重复名称的列，可以按照上述步骤为每个重复列重命名，并使用join()函数将它们组合在一起。

注意：以上答案中没有提及腾讯云相关产品和产品介绍链接地址，因为该问题与云计算品牌商无关。

如何在pandas dataframe中组合具有重复名称的列？

、、、

我得到了pandas的数据帧，如下所示：enter image description here 根据省份，有多个针对澳大利亚的列，这些列的标题是澳大利亚、澳大利亚1、澳大利亚2等等。例如，我希望有一个名为Australia的列，其中包含每个省份的值的总和，并且我希望避免重复的列名。如何在Python中使用pandas dataframe

浏览 33提问于2020-12-12得票数 2

回答已采纳

1回答

如何向python dataframe插入多个包含空值的连续列

、

我有一个有四个列"1990“、"2000”、"2006“和"2012”的dataframe stations和区域数据。若要在间隔期间插入年份，我希望在空白中插入带有空值的列。我确实使用pandas.DataFrame.insert在特定位置插入列，但无法找到如何使用多个列(如pandas.DataFrame.insert[1, ["

浏览 0提问于2019-08-15得票数 3

回答已采纳

1回答

将双循环python替换为apply

、、、

有没有人知道有没有可能用更快的函数来代替python中的双循环呢？例如，我有这样的数据帧：df["col_1"] = ["hello", "salut","hello", "bye", "bye","hi","hello",我想应用这个函数来创建一个类似的列，如下所示：我可以用双循

浏览 16提问于2017-08-10得票数 0

回答已采纳

1回答

我有一个熊猫dataframe (源代码格式为CSV)，当我认为它应该是'pandas.core.series.Series‘时，其中一个列是'method’类。"troublesomeColumn“是文本列，其他文本列自然导入为'pandas.core.series.Series‘.我不知道是什么导致了这个问题，我在专栏中找不到任何异常值。我希望它是一个“pandas.core.series.Series”，这

浏览 5提问于2020-06-25得票数 0

回答已采纳

2回答

Pandas表达式导致列爆炸(或在重名环境中删除包含子串的列)

我使用下面的pandas表达式 df = df[df.columns[~df.columns.str.contains('Unnamed:')]] 若要删除包含未命名的列，请执行以下操作。我从这里拿到了这个Remove Unnamed columns in pandas dataframe 由于某种原因，在某些情况下，此行会导致列的爆炸 df shape in (2000, 1451)after dropping Unnamed (2000, 385

浏览 21提问于2019-06-24得票数 1

回答已采纳

3回答

熊猫数据-选择相似的行

、、

是否有办法选择“相似”的行(而不是重复的！)在熊猫的资料里？我想知道在不同的地区是否有类似的名称的学校。我所能想到的就是选择一个随机的学校名称，并手动检查dataframe中是否存在类似的名称，方法如下： df[df[

浏览 3提问于2020-08-12得票数 0

2回答

如何组合两个不同形状和不同列名的DataFrame列

、、

有人能帮我组合/Union 2的数据，谁有不同的形状与不同的列名称。如您所见，1 dataframe为3列，而第2 dataframe仅包含1列。我想将dataframe02clientid列放在dataframe01Turtlemint profile_id列下面，并创建具有垂直名称的</

浏览 12提问于2022-08-23得票数 -1

回答已采纳

1回答

将两个数据格式与一些公共列合并，其中公共数据的组合需要一个自定义函数。

、、、

True False 0.0 0.514.0 True True如您所见，它们具有相同的索引在现实生活中，可能会有更多常见的列，如1.0或其他数字尚未定义的列，以及两边更多的唯一列。我需要组合这两个数据格式，以便保留所有唯一的列，

浏览 2提问于2018-10-08得票数 6

回答已采纳

1回答

Pandas Dataframe丢弃记录及其副本

我希望删除基于列的pandas Dataframe中具有重复项及其重复项的记录

浏览 18提问于2019-11-14得票数 0

回答已采纳

2回答

附加和处理重复

、

我有一个带有timeseries数据的df。现在，我想添加更多的数据，通过使用DataFrame.append()来实现。将附加的数据包含新列和重复值。因此，我通过在追加后删除重复的值来清理。有更好的办法吗？2021-02-11 17.089 16.316 15.733 15.630 2021-02-10 17.425 16

浏览 2提问于2021-02-16得票数 0

1回答

python pandas通过计算表达式添加新的计算列(其他列的组合)

、、、、

我对pandas和数据帧还很陌生，我需要在我的数据帧中添加一个新的列，这就像是在算术运算的基础上组合其他列。Dataframe columns:sum() distinct()etc..所以我的问题是如何在pandas dataframe上计算它，它在d

浏览 1提问于2018-05-05得票数 1

2回答

大熊猫组合

、

如何在Pandas中创建具有以下输出的Dataframe？每个列的可能值为True或False。我想得到所有可能的行组合。

浏览 1提问于2020-03-16得票数 1

回答已采纳

1回答

基本问题-使用函数迭代pandas* dataframe列*

、、

我正在努力学习最基本的东西。我在pandas dataframe中只有一列名称，我想使用fuzzywuzzy库中的3-4个函数来比较字符串中的潜在重复项。所以我要检查第一个名字和其余的列内容，然后第二个名字，依此类推。列将有数百个(如果不是数千个)名称。我想创建一个名称组合的

浏览 0提问于2020-03-01得票数 2

2回答

为大熊猫中的分类数据行分配散列

、、、

D F False第一列和第二列可以采用三个值之一。因此，总共有18个可能的行(并不是所有的组合都可以在每个数据帧上表示)。因此，all_combination_df是一个df，它包含

浏览 1提问于2016-11-05得票数 5

回答已采纳

1回答

pandas read_csv()从CSV内容返回带有.1和.2的重复条目

、、

我正在使用pandas read_csv()方法将CSV文件的第一行读入列表，如下所示。imagine, expected_columns=["NewYork","Sydney","Sydney","Sydney"] 现在，目标CSV文件也具有相同的列，如"NewYork“、"Sydney如上所述，当我使用Pandas read_csv()读取CSV时，它将CSV文件<e

浏览 3提问于2021-07-23得票数 0

2回答

在dataframe* (Python)中修改重复行*

、、

我正在使用Pandas中的dataframe，我需要一个解决方案来自动修改其中一个具有重复值的列。它是一个列类型'object‘，我需要修改重复值的名称。dataframe如下：0 New York 2001 20 1 Pa

浏览 10提问于2021-12-28得票数 4

回答已采纳

1回答

“DataFrame”对象没有“str”属性

、、、、

我尝试遍历列，以便在df的所有列中的特定单元格(例如'Users 0')中找到0，并将该单元格替换为null。我试着运行这个： for col in df.columns: df.loc[sa[col].str.contains('0'), col] = '' 但是它给了我一个没有属性'DataFrame‘的'str’对象

浏览 26提问于2021-03-31得票数 0

1回答

熊猫:寻找重复的栏

、

我有一个包含不同dtypes的数据文件，如int、float、object、datatime等。我正在执行data cleaning，以列出或查找数据文件中的重复列名。重复标准如下：具有相同数据值的列我试着使用transpose方法df.T.duplicated()来列出重复的列名，但对于大数据格式来说似乎比较慢。我知道我们可以使用pivot、pivot_tabl

浏览 0提问于2023-05-21得票数 0

回答已采纳

2回答

如果它们的索引值相同，如何将一个DataFrame列复制到另一个数据帧中

、

在名称为‘DataFrame’的列中创建了一些重复单元格值的关键字后：df = pd.DataFrame({'keys': [1,2,2,3,3,3,3],'values这些新创建的键在“DataFrames”列下没有重复的单元格值： df_sum = df_a.groupby('k

浏览 4提问于2016-09-03得票数 2

回答已采纳

1回答

更改DF的列格式，其中某些列是块

、、、

下面我描述了我的DF，我需要改变它。AMA'}]15 [{'id': 4, 'name': 'Exchange'}] I需要更改列"需要更改列“硬币”：将键提取为单独的列并将它们的值放在那里。，我需要更改列“类别”：删除键&q

浏览 1提问于2022-07-13得票数 -1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在pandas dataframe中组合具有重复名称的列？

相关·内容

如何在pandas dataframe中组合具有重复名称的列？

如何向python dataframe插入多个包含空值的连续列

将双循环python替换为apply

熊猫数据导入列作为“方法”类转换为“系列”

Pandas表达式导致列爆炸(或在重名环境中删除包含子串的列)

熊猫数据-选择相似的行

如何组合两个不同形状和不同列名的DataFrame列

将两个数据格式与一些公共列合并，其中公共数据的组合需要一个自定义函数。

Pandas Dataframe丢弃记录及其副本

附加和处理重复

python pandas通过计算表达式添加新的计算列(其他列的组合)

大熊猫组合

基本问题-使用函数迭代pandas* dataframe列*

为大熊猫中的分类数据行分配散列

pandas read_csv()从CSV内容返回带有.1和.2的重复条目

在dataframe* (Python)中修改重复行*

“DataFrame”对象没有“str”属性

熊猫:寻找重复的栏

如果它们的索引值相同，如何将一个DataFrame列复制到另一个数据帧中

更改DF的列格式，其中某些列是块

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐