如何将pandas数据帧重新排列到此特定配置中？

将pandas数据帧重新排列到特定配置中可以使用pandas库中的重塑函数。常用的重塑函数有"pivot"、"pivot_table"、"melt"和"stack/unstack"。

"pivot"函数用于将数据从长格式转换为宽格式，即将行索引的唯一值转换为列名，将列索引的唯一值转换为行索引。使用该函数，需要指定一个列作为新数据帧的列索引，一个列作为新数据帧的行索引，以及一个列作为新数据帧的值。例如：

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
                   'B': ['one', 'one', 'two', 'two', 'one', 'one'],
                   'C': ['x', 'y', 'x', 'y', 'x', 'y'],
                   'D': [1, 2, 3, 4, 5, 6]})

pivot_df = df.pivot(index='A', columns='B', values='D')

这里将列"A"作为新数据帧的行索引，列"B"作为新数据帧的列索引，列"D"作为新数据帧的值。得到的新数据帧"pivot_df"如下所示：

B    one  two
A            
bar    5    4
foo    1    3

"pivot_table"函数用于对数据进行透视汇总，可以进行更复杂的操作，例如添加聚合函数，指定多个列作为索引和列等。使用该函数，需要指定一个列作为新数据帧的列索引，一个列作为新数据帧的行索引，以及一个列作为新数据帧的值。例如：

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
                   'B': ['one', 'one', 'two', 'two', 'one', 'one'],
                   'C': ['x', 'y', 'x', 'y', 'x', 'y'],
                   'D': [1, 2, 3, 4, 5, 6]})

pivot_table_df = df.pivot_table(index='A', columns='B', values='D', aggfunc=sum)

这里将列"A"作为新数据帧的行索引，列"B"作为新数据帧的列索引，列"D"作为新数据帧的值，并使用"sum"函数对值进行求和。得到的新数据帧"pivot_table_df"如下所示：

B    one  two
A            
bar    11   4
foo    3    3

"melt"函数用于将宽格式数据转换为长格式数据，即将多列的数据转换为一列。使用该函数，需要指定一个或多个列作为保持不变的列索引，然后将其他列的值合并为一列。例如：

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
                   'B': ['one', 'one', 'two', 'two', 'one', 'one'],
                   'C': ['x', 'y', 'x', 'y', 'x', 'y'],
                   'D': [1, 2, 3, 4, 5, 6]})

melted_df = df.melt(id_vars=['A', 'B'], value_vars=['C', 'D'])

这里将列"A"和"B"作为保持不变的列索引，列"C"和"D"的值合并为一列。得到的新数据帧"melted_df"如下所示：

    A    B variable  value
0  foo  one        C      x
1  foo  one        C      y
2  foo  two        C      x
3  bar  two        C      y
4  bar  one        C      x
5  bar  one        C      y
6  foo  one        D      1
7  foo  one        D      2
8  foo  two        D      3
9  bar  two        D      4
10 bar  one        D      5
11 bar  one        D      6

"stack/unstack"函数用于在多级索引之间转换，其中"stack"函数用于将列索引转换为行索引，"unstack"函数用于将行索引转换为列索引。例如：

import pandas as pd

df = pd.DataFrame({'A': ['foo', 'foo', 'foo', 'bar', 'bar', 'bar'],
                   'B': ['one', 'one', 'two', 'two', 'one', 'one'],
                   'C': ['x', 'y', 'x', 'y', 'x', 'y'],
                   'D': [1, 2, 3, 4, 5, 6]})

stacked_df = df.set_index(['A', 'B']).stack()
unstacked_df = stacked_df.unstack()

这里先将列"A"和"B"设置为行索引，然后使用"stack"函数将列索引转换为行索引，得到"stacked_df"：

A    B   
foo  one  C      x
          D      1
     two  C      x
          D      3
bar  two  C      y
          D      4
     one  C      x
          D      5
dtype: object

再使用"unstack"函数将行索引转换为列索引，得到"unstacked_df"：

B    one  two
A            
bar    5    4
foo    1    3

以上就是将pandas数据帧重新排列到特定配置中的几种方法。具体选择哪种方法取决于数据的结构和需求。腾讯云提供了云原生数据库TDSQL和云服务器CVM等相关产品，可用于存储和处理重塑后的数据。你可以访问腾讯云官方网站获取更多产品信息和使用文档。

如何将pandas数据帧重新排列到此特定配置中？

、、、

我正在尝试重新排列一个熊猫数据帧，如下所示：转换成如下所示的数据帧：这是以这样的方式导出的，即对于每个原始行，创建多个行，其中前两列保持不变，第三列是该新列来自下一原始列中的哪一列，并且第四列是相应的浮点值我不认为这是一个数据透视表，但我不确定如何清楚地获得它。抱歉，如果之前有人问过这个问题，我似乎找不到我要找的东西。如果我的解释或格式不够理想，我也要道歉！谢谢你的帮助。

浏览 9提问于2020-11-07得票数 1

回答已采纳

1回答

Pandas DataFrame -通过多个列值对行进行求和

、、、

我正在Python中处理Pandas数据帧，我想对数据集进行以下重新排列：我尝试使用for循环，但我想知道是否有更简单的解决方案使用Pandas -我找不到更优雅的解决方案。

浏览 2提问于2019-12-05得票数 0

1回答

Azure机器学习服务- dataset API问题

、

我在示例笔记本中看到，它使用的是Dataset.Tabular.from_delimited_files(train_data)，它只从https路径获取数据。我想知道如何使用pandas dataframe直接自动配置而不是使用dataset API。或者，如何将pandas数据帧转换为表格数据集以传递到自动配置？

浏览 2提问于2019-12-03得票数 0

1回答

将表格数据排序到Quintile/Deciles中

我正在努力将我的数据表排序为五分表/十分表等。我只是在使用一些状态数据进行练习，因为我是新手和学习者。到目前为止，这是我的代码。

浏览 12提问于2020-06-16得票数 0

2回答

Pandas中分类变量的顺序

、

我有一个Pandas数据帧，看起来像这样： ? 其中，a, b, c, d是分类变量，例如a < b < c < d和b > 3 * a，c > 2 * b和d > 1.5 * c。如果给定了这些显式关系，那么如何使用所有其他隐式关系(如c > 6 * a、d > 9 * a和d > 3 * b )将行添加到此数据帧中。有什么想法吗？

浏览 14提问于2019-10-11得票数 2

回答已采纳

1回答

如何将文件夹中的多个ann文件(从brat注解)读取到一个pandas数据帧中？

、、、、

我可以将一个ann文件读入pandas dataframe，如下所示： df = pd.read_csv('something/something.ann', sep='^([^\s]*)\s', engine='python', header=None).drop(0, axis=1) df.head() 但我不知道如何将多个ann文件读取到一个pandas数据帧中。如何将多个ann文件读入一个<e

浏览 6提问于2021-08-16得票数 0

回答已采纳

1回答

Pandas数据帧多个数据库表

、、、、

我有一个API包装器，可以从特定的产品中提取数据。我面临着如何将json数据映射到数据库(postgresql)的问题。我已经阅读了Pandas dataframe，但我不确定这是不是正确的方法。1)是否可以选择哪些行可以进入数据帧？ 2)数据帧内的每一行都需要插入到两个不同的数据库表中。我需要在TableA中插入10列，获得新插入行的id，然后在TableB<e

浏览 14提问于2020-05-15得票数 1

回答已采纳

2回答

追加在for循环中生成的pandas数据帧

、

然后，我将excel文件中的数据读取到pandas数据帧中。我想不出如何将这些数据帧附加在一起，然后将数据帧(现在包含所有文件中的数据)保存为新的Excel文件。这是我尝试过的： data = pandas.read_excel(infile)

浏览 2提问于2015-02-23得票数 111

回答已采纳

1回答

在Angular应用程序中加载配置数据

、

在我的angular应用程序中，如果用户授权，我希望从服务器加载一些用户特定的配置数据。这些数据将在整个应用程序中使用。我已经实现了基于cookie的令牌身份验证。如何将应用程序延迟到此数据加载完成？

浏览 0提问于2017-02-28得票数 0

回答已采纳

2回答

将Pandas Dataframe写入DBF文件？

、、、

我正在使用shapefile，它将属性数据存储在DBF文件中。我需要使用Pandas操作属性，并将新的DBF数据写回磁盘。不幸的是，Pandas数据帧没有df.to_dbf方法(而R有)。如何将pandas数据帧保存为DBF文件？

浏览 208提问于2017-07-04得票数 4

回答已采纳

1回答

向数据框添加新列，其中包含基于数据框年份的值

、、

我有一个数据帧 import pandas_datareader as webreaderimport numpy as np from pandas.plotting import register_matplotlib_converters我希望将列"deb/eq“添加到此数据框

浏览 19提问于2021-04-27得票数 1

回答已采纳

1回答

Y轴的动态范围(Plotly - Python)

、、

当我把自动范围条形图显示得不如可能的好。然后我决定放置固定的范围，但我的图形有时会超出y轴。所以我想放入动态范围[0，df‘’yaxis‘+ 500]。它会显示错误:就像是带外。barmode=‘group’,bargroupgap=0.1,)

浏览 3提问于2018-11-29得票数 1

1回答

在python dataframe中水平添加特定列中的值

、、

我已经使用numpy数组从python pandas创建了一个dataframe，但是我想知道如何水平地而不是垂直地添加特定列中的值。让我们假设我有这个数据帧： df = pd.DataFrame(data=data1) 📷 如何将1.2,3.5,2.2添加到(-1，label) (-2，label) (0，label)的第二行

浏览 10提问于2021-02-08得票数 1

回答已采纳

1回答

相当于numpy.array2string的Pandas

、

Pandas和NumPy有很多方法来配置数组和数据帧字符串转换。这些选项大多是使用和设置的全局选项。 NumPy还提供了来执行单个阵列的字符串化操作，并提供了该特定操作的详细配置。我在Pandas中找到的最接近的东西是，它临时修改全局选项，然后恢复它们。(NumPy具有类似的上下文管理器。)但是，这仍然会修改全局选项，使其不适合并发代码或可能在并发程序中使用的库代码。有没有调用stringify数据帧的自定义显示选项，甚至不需要临时修

浏览 0提问于2020-12-08得票数 0

2回答

pandas等同于R的cbind (垂直连接/堆叠向量)

、、、

假设我有两个数据帧：....test1 = pandas.DataFrame([1,2,3,4,5]).... test2 = pandas.DataFrame如何将这两列合并为数据帧的两列，类似于R中的cbind函数？

浏览 4提问于2015-02-19得票数 45

回答已采纳

3回答

使用openpyxl将pandas数据帧复制到excel

、、、、

我将一些复杂的格式保存在一个模板文件中，我需要将来自pandas数据帧的数据保存到这个模板文件中。问题是，当我使用pd.to_excel保存到此工作表时，pandas会覆盖格式。有没有办法将df表中的值“粘贴”到工作表中？我使用的是pandas 0.17import pandas as pd wb= openpyxl.load_workbook(&

浏览 5提问于2016-04-16得票数 22

2回答

从pandas* df更新数据库中的现有行*

、、

我有一个PostgreSQL数据库。Pandas有一个“to_sql”函数，可以将数据帧的记录写入数据库。但我还没有找到任何文档，说明在我使用完dataframe时如何使用pandas更新现有的数据库行。目前，我可以使用pandas read_sql_table将数据库表读取到数据帧中。然后，我会根据需要处理数据。但是，我还不能弄清楚如何将该<

浏览 73提问于2015-04-13得票数 25

2回答

如何在jupyter中有条件地格式化pandas行组

、、

我在pandas中有一个数据帧，看起来有点像这样： A B C1 0.7 0.13 0.10.3 3 0.2 0.1 在jupyter中打印熊猫数据帧时，默认输出样式是使用交替的浅色和灰色背景对每行进行着色。我在这里找到了一些文档：https://pandas.pydata.org/pandas-docs&#

浏览 19提问于2019-08-27得票数 2

回答已采纳

1回答

使用Pandas模块写入Excel文件

、、

如何使用Pandas模块将项目列表[1,2,3,4,5]写入excel文件中的特定选项卡中，从特定的行和列位置开始？是否涉及pandas.DataFrame.to_excel函数?我是否要先将列表转换为序列，然后将序列转换为数据帧，然后将数据帧写入excel文件？

浏览 24提问于2016-08-04得票数 0

1回答

pandas数据帧中基于序列的列重排

、

我有一个熊猫数据框架，如下所示。我希望根据XX_和YY_列的顺序重新排列数据帧中的列。import numpy as npimport mathimport redf = pd.DataFrame(data,columns=['XX_4','XX_2','XX_3&#x

浏览 8提问于2019-11-06得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何将pandas数据帧重新排列到此特定配置中？

相关·内容

如何将pandas数据帧重新排列到此特定配置中？

Pandas DataFrame -通过多个列值对行进行求和

Azure机器学习服务- dataset API问题

将表格数据排序到Quintile/Deciles中

Pandas中分类变量的顺序

如何将文件夹中的多个ann文件(从brat注解)读取到一个pandas数据帧中？

Pandas数据帧多个数据库表

追加在for循环中生成的pandas数据帧

在Angular应用程序中加载配置数据

将Pandas Dataframe写入DBF文件？

向数据框添加新列，其中包含基于数据框年份的值

Y轴的动态范围(Plotly - Python)

在python dataframe中水平添加特定列中的值

相当于numpy.array2string的Pandas

pandas等同于R的cbind (垂直连接/堆叠向量)

使用openpyxl将pandas数据帧复制到excel

从pandas* df更新数据库中的现有行*

如何在jupyter中有条件地格式化pandas行组

使用Pandas模块写入Excel文件

pandas数据帧中基于序列的列重排

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐