一种基于另一列的子组向Pandas数据帧添加新列的有效方法

在Pandas数据帧中，可以使用apply方法结合匿名函数来基于另一列的值添加新列。具体步骤如下：

导入Pandas库：

import pandas as pd

创建数据帧：

data = {'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

这将创建一个包含两列（A和B）的数据帧df。

使用apply方法和匿名函数创建新列：

df['C'] = df['B'].apply(lambda x: x * 2)

上述代码将基于列B的值创建一个新列C，新列的值是列B中每个元素的两倍。

完整代码如下：

import pandas as pd

data = {'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

df['C'] = df['B'].apply(lambda x: x * 2)

这样就在数据帧df中成功添加了新列C，新列的值基于列B的值计算而来。

这种方法适用于基于某一列的值进行计算或转换，并将结果作为新列添加到数据帧中的场景。对于Pandas中其他的数据操作，例如数据过滤、分组、排序等，也可以使用类似的方法来实现。

推荐的腾讯云相关产品：腾讯云弹性MapReduce（EMR），产品介绍链接地址：https://cloud.tencent.com/product/emr

一种基于另一列的子组向Pandas数据帧添加新列的有效方法

、、、

我有一个包含各种列的数据帧，如下所示： import numpy as np2.1 2 102.3 2 30 我使用"apply“和"lambda”创建一个新列，以填充具有相同"Group I

浏览 47提问于2021-04-20得票数 1

回答已采纳

2回答

确定组内最小值，并将列设置为Row Pandas的另一列

、

很难在不显示示例的情况下进行描述，但是我想在我的pandas数据框中创建一个列，其中的值等于基于组中另一列的最小值的另一列的值。假设我有以下数据帧：我的目标是创建一个新的列'd‘，它等于c中的

浏览 16提问于2020-02-06得票数 1

回答已采纳

1回答

如何从pandas向子数据框添加新列

、、

我开始与熊猫合作，所以这可能是一个很明显的问题，但我已经与它斗争了一段时间，没有找到解决方案。考虑一下这个数据帧： import pandas_datareader as pdr end=datetime.datetime(2020, 1, 1)) 现在，我可以简单

浏览 3提问于2020-09-24得票数 0

回答已采纳

1回答

Python:根据值和条件在交叉表中添加一列

、、、、

我有一个由0和1组成的NumPy数组创建的Pandas交叉表。，如下所示： col_0 0 1 ---------------------1 53 79 我想在这里添加一列关于误报和漏报的错误百分比我使用ct[2] = ct.apply(lambda row: row[0] + row[1], axis = 1)向交叉表添加了一个

浏览 8提问于2019-02-06得票数 1

回答已采纳

3回答

如何将多列的乘积创建成新的列pandas

、、

'dummy_2' : [1, 1, 0, 0, 1, 1], 'dummy_3' : [1, 1, 1, 0, 0, 0]}) 我想将产品添加为新列(在相同的数据帧中)，每列的产品和另外两列。因此，生成的数据帧如下所示： df = pd.DataFrame({ 'dummy_1&#x

浏览 15提问于2019-02-11得票数 1

回答已采纳

1回答

如何在sqlite3中追加一列并用pandas* Series填充它的值*

、、

我想使用存储在pandas Series中的值将一列追加到sqlite3数据库中现有的表中。我的原始DataFrame df如下所示：0 1 2并且在sqlite3中也以表的形式存储。如果我将列添加到df中，如下所示：那么df将是：0 1 2 3而sqlite3 db中的表还没

浏览 24提问于2020-02-07得票数 0

回答已采纳

2回答

R和/或Pandas-Python函数根据条件创建新变量

、、

我很难找到解决问题的正确方法。我有一个NBA数据集，其中一个列/变量是球员的位置。例如，C代表中心，SG代表投篮后卫，SG-SF代表投篮后卫/小Fowrad。我的目标是创建5个新变量-一个用于篮球中的每个位置: PG，SG，SF，PF，C，其中球员在每个列中的值为1，新位置列在原始数据集中列出。例如，Tyson Chandler在新</

浏览 0提问于2021-01-25得票数 0

2回答

在链中的pandas中添加组属性(类似于R中的dplyr group_by - mutate )

、、、

我想将一些组属性作为新列添加到pandas数据帧中，但不会破坏链。我知道这在R中使用dplyr是可能的，但我不能让它在pandas中工作。dplyr代码为(用于在列A中添加每个组的列B的最大值)： df %>% mutate(max = max(B)) %>%

浏览 8提问于2020-08-10得票数 0

回答已采纳

3回答

DataFrames -平均列数

、、、

我在pandas中有以下数据框架 Column 1 Column 2 Column3 Column 4 12 2 3 我希望创建一个数据帧，其中包含列1和列2，列3和列4的平均值，等等。ColumnAvg(12) ColumnAvg(34)

浏览 40提问于2020-09-20得票数 3

回答已采纳

2回答

更快的方法来遍历Pandas* Dataframe？*

、、

我有一个字符串列表，比方说：我有一些Pandas Dataframe，比如：df = pd.DataFrame(data, columns = ['fruit_source', 'value']) 我想要基于对

浏览 2提问于2022-01-08得票数 3

回答已采纳

1回答

非常大的制表符分隔的文本文件的列选择

、、

我正在处理一个非常大的以制表符分隔(大约20000行* 30000列)的.txt形式的表，这使得文件大于20 tab。我检查了桌面的内存，似乎无法直接使用R中的read.delim或python中的pandas来读取该文件。我目前正在考虑基于列的过滤器制作表的一个小子集，新的文本文件将是20000行* 1200列。我已经将目标文件的</e

浏览 34提问于2020-10-19得票数 0

回答已采纳

6回答

通过匹配列表中的字符串值在pandas数据框中构建新列

、、、、

我正在尝试基于数据帧中已有的另一个列SearchCol3，在pandas数据帧中构建一个新列NewCol4。测试SearchCol3的每个值以查看它是否包含列表stings中的任何子字符串。如果SearchCol3中的值包含列表strings中的一个子字符串，那么列表replacement中的

浏览 2提问于2015-12-16得票数 3

2回答

如何基于另一列部分字符串在熊猫上添加列

、

我试图在数据帧(组列)中添加一个新列，其值基于另一列(用户列)中的部分字符串。用户的编码方式如下: AA1、AA2、BB1、BB2等等。我想要的是组列对所有AA用户都有一个'AA‘值。在寻找了一种方法之后，我想出了下面的一行： df['group'

浏览 3提问于2016-06-06得票数 2

回答已采纳

1回答

将多列一次添加到多索引Pandas数据帧

、

我有一个dataframe multiindex pandas dataframe dfSecond Begin Begin2 4 4我想添加两个同名的列Second Begin End，但这只返回了NaN 另一种方法是使用类似for循环的方法

浏览 1提问于2020-08-25得票数 0

1回答

将列表追加到pandas数据帧的第一行和第一列

、、、

我有一个4300x4300的pandas数据帧(行和列)，并希望在第一行和第一列中添加一个列表。我不知道如何做到这一点，如果不完全用零…填充数据帧旧的4300 x 4300数据帧示例(摘录)： ? 要添加的列表示例：“轴”，“输出”，“组”，“多”，“记录” 新的A x A数据

浏览 11提问于2019-06-13得票数 1

回答已采纳

1回答

串联成数据帧时创建的NaN列

、、

我已经创建了一个输出变量'a = pd.Series()'，然后使用一个for循环运行多个模拟，该循环使用以下代码将临时存储在'x‘中的模拟结果附加到连续列中的'a’，每个列都重命名为与模拟编号一致，从第0个位置开始： a = pandas.concat([a, x.rename(sim_count)], axis=1) 由于某种原因，结果数据帧在我的第一列模拟结果的左侧包含了

浏览 33提问于2019-04-02得票数 0

回答已采纳

1回答

最后N个数据点上的Pyspark结构化流窗口(移动平均)

、、、

我想在数据框中添加一些新的列，这些列主要基于过去N个数据点的窗口计算(例如:最近20个数据点的移动平均)，并且随着新数据点的交付，MA_20的相应值应该立即计算出来。因此，周一上午计算的移动平均值应该包括周五的数据！我尝试了不同的方法，但

浏览 26提问于2020-01-23得票数 3

1回答

迭代添加到?的最有效数据类型？

、

我有一个从网页迭代检索数据的网络刮取器，我想将提取的属性添加到熊猫数据帧(最终)中，以运行简单的统计和分析。每次抓取新页面时，当前脚本都会返回一个字典。我知道向现有的pandas数据帧添加新的行或列很慢，所以我的想法是在检索字典时将其添加到csv中，然后在数据收集完成时(可能

浏览 3提问于2018-10-01得票数 1

6回答

如何向嵌套字典列表中添加值列表？

、、、、

我想用新的键名将列表的每个值添加到不同列表的每个嵌套字典中。list_dicts = [{'id': 1, 'text': 'abc', 'language': 'en'}, {{'id':2, 'text': 'def', 'language':'nl'}] 使用的当前方法：I将list_

浏览 5提问于2020-10-12得票数 0

回答已采纳

1回答

Spark联合vs使用spark中的lit添加列

、

这是一个与火花相关的问题。我必须将静态数据添加到各种类型的记录中，每种类型的记录都被作为不同的数据帧处理(比如df1、df2、..df6)我打算添加的静态数据必须与所有6个数据帧一起重复。哪种方式性能更好：对于6个数据帧中的每一个，使用： .witColumn("testA", lit(&

浏览 104提问于2021-01-21得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

一种基于另一列的子组向Pandas数据帧添加新列的有效方法

相关·内容

一种基于另一列的子组向Pandas数据帧添加新列的有效方法

确定组内最小值，并将列设置为Row Pandas的另一列

如何从pandas向子数据框添加新列

Python:根据值和条件在交叉表中添加一列

如何将多列的乘积创建成新的列pandas

如何在sqlite3中追加一列并用pandas* Series填充它的值*

R和/或Pandas-Python函数根据条件创建新变量

在链中的pandas中添加组属性(类似于R中的dplyr group_by - mutate )

DataFrames -平均列数

更快的方法来遍历Pandas* Dataframe？*

非常大的制表符分隔的文本文件的列选择

通过匹配列表中的字符串值在pandas数据框中构建新列

如何基于另一列部分字符串在熊猫上添加列

将多列一次添加到多索引Pandas数据帧

将列表追加到pandas数据帧的第一行和第一列

串联成数据帧时创建的NaN列

最后N个数据点上的Pyspark结构化流窗口(移动平均)

迭代添加到?的最有效数据类型？

如何向嵌套字典列表中添加值列表？

Spark联合vs使用spark中的lit添加列

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐