首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用group by -根据pandas中other列上的条件创建一个新的coulmn

在pandas中,可以使用group by语句根据DataFrame中的某一列或多列的条件来创建一个新的列。group by是一种分组聚合的操作,它可以将数据按照指定的条件进行分组,然后对每个分组进行聚合计算。

首先,我们需要导入pandas库并读取数据到DataFrame中。然后,使用group by语句来分组数据,并使用agg函数对每个分组进行聚合操作。在agg函数中,我们可以指定要进行的聚合计算,例如求和、平均值、计数等。

下面是使用group by根据pandas中其他列上的条件创建一个新的列的步骤:

  1. 导入pandas库并读取数据到DataFrame中:
代码语言:txt
复制
import pandas as pd

# 读取数据到DataFrame中
df = pd.read_csv("data.csv")
  1. 使用group by语句分组数据,并使用agg函数进行聚合计算:
代码语言:txt
复制
# 根据other列的条件分组并求和
df_grouped = df.groupby("other").agg({"column": "sum"})

在上述代码中,"other"是要根据其条件进行分组的列名,"column"是要进行聚合计算的列名,"sum"表示求和操作。根据"other"列的条件,将数据分组,并对"column"列进行求和计算。

  1. 创建一个新的列并将聚合计算结果赋值给该列:
代码语言:txt
复制
# 创建一个新的列并将聚合计算结果赋值给该列
df_grouped["new_column"] = df_grouped["column"]

# 打印结果
print(df_grouped)

在上述代码中,将聚合计算结果赋值给了一个新的列"new_column"。

对于这个问题,我们可以给出以下完善且全面的答案:

在pandas中,可以使用group by语句根据DataFrame中的某一列或多列的条件来创建一个新的列。group by是一种分组聚合的操作,它可以将数据按照指定的条件进行分组,然后对每个分组进行聚合计算。具体步骤如下:

  1. 导入pandas库并读取数据到DataFrame中。
  2. 使用group by语句分组数据,并使用agg函数进行聚合计算。
  3. 创建一个新的列并将聚合计算结果赋值给该列。

在这个问题中,我们根据"other"列的条件创建一个新的列。具体代码如下:

代码语言:txt
复制
import pandas as pd

# 读取数据到DataFrame中
df = pd.read_csv("data.csv")

# 根据other列的条件分组并求和
df_grouped = df.groupby("other").agg({"column": "sum"})

# 创建一个新的列并将聚合计算结果赋值给该列
df_grouped["new_column"] = df_grouped["column"]

# 打印结果
print(df_grouped)

以上是根据pandas中other列的条件创建一个新的列的完善且全面的答案。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 整理了10个经典Pandas数据查询案例

    9999 x 12数据集,是使用Faker创建,我在最后也会提供本文所有源代码。...在开始之前,先快速回顾一下Pandas查询函数query。查询函数用于根据指定表达式提取记录,并返回一个DataFrame。表达式是用字符串形式表示条件条件组合。...PANDASDATAFRAME(.loc和.iloc)属性用于根据行和列标签和索引提取数据集子集。因此,它并不具备查询灵活性。...Pandasquery()函数可以灵活地根据一个或多个条件提取子集,这些条件被写成表达式并且不需要考虑括号嵌套。...与数值类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件组合。 除此以外, Pandasquery()方法还可以在查询表达式中使用数学计算。

    22620

    10个快速入门Query函数使用Pandas查询示例

    ) 它是一个简单9999 x 12数据集,是使用Faker创建,我在最后也会提供本文所有源代码。...在开始之前,先快速回顾一下pandas -查询函数query。查询函数用于根据指定表达式提取记录,并返回一个DataFrame。表达式是用字符串形式表示条件条件组合。...pandas query()函数可以灵活地根据一个或多个条件提取子集,这些条件被写成表达式并且不需要考虑括号嵌套。...与数值类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件组合。 除此以外, Pandas Query()还可以在查询表达式中使用数学计算。...== 'Delivered'") 查询表达式包含了日期时间和文本列条件,它返回了符合查询表达式所有记录 替换 上面的查询中都会生成一个df。

    4.4K20

    10快速入门Query函数使用Pandas查询示例

    () 它是一个简单9999 x 12数据集,是使用Faker创建,我在最后也会提供本文所有源代码。...在开始之前,先快速回顾一下pandas -查询函数query。查询函数用于根据指定表达式提取记录,并返回一个DataFrame。表达式是用字符串形式表示条件条件组合。...pandas query()函数可以灵活地根据一个或多个条件提取子集,这些条件被写成表达式并且不需要考虑括号嵌套 在后端pandas使用eval()函数对该表达式进行解析和求值,并返回表达式被求值为TRUE...与数值类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件组合。...== 'Delivered'") 查询表达式包含了日期时间和文本列条件,它返回了符合查询表达式所有记录 替换 上面的查询中都会生成一个df。

    4.5K10

    整理了10个经典Pandas数据查询案例

    9999 x 12数据集,是使用Faker创建,我在最后也会提供本文所有源代码。...在开始之前,先快速回顾一下Pandas查询函数query。查询函数用于根据指定表达式提取记录,并返回一个DataFrame。表达式是用字符串形式表示条件条件组合。...PANDASDATAFRAME(.loc和.iloc)属性用于根据行和列标签和索引提取数据集子集。因此,它并不具备查询灵活性。...Pandasquery()函数可以灵活地根据一个或多个条件提取子集,这些条件被写成表达式并且不需要考虑括号嵌套。...与数值类似可以在同一列或不同列上使用多个条件,并且可以是数值和非数值列上条件组合。 除此以外, Pandasquery()方法还可以在查询表达式中使用数学计算。

    3.9K20

    高效10个Pandas函数,你都用过吗?

    Query Query是pandas过滤查询函数,使用布尔表达式来查询DataFrame列,就是说按照列规则进行过滤操作。...Insert Insert用于在DataFrame指定位置插入数据列。默认情况下列是添加到末尾,但可以更改位置参数,将列添加到任何位置。...Where Where用来根据条件替换行或列值。如果满足条件,保持原来值,不满足条件则替换为其他值。默认替换为NaN,也可以指定特殊值。..., raise_on_error=None) 参数作用: cond:布尔条件,如果 cond 为真,保持原来值,否则替换为other other:替换特殊值 inplace:inplace为真则在原数据上操作...,使用iloc: df.iloc[:3,:2] 使用loc: df.loc[:2,['group','year']]1 提示:使用loc时,索引是指index值,包括上边界。

    4.1K20

    数据处理技巧 | 带你了解Pandas.groupby() 常用数据处理方法

    pandas.groupby()实例演示 首先,我们自己创建用于演示数据,代码如下: import pandas as pd import numpy as np # 生成测试数据 test_data...同时计算多个结果 可能还有小伙伴问“能不能将聚合计算之后结果列进行重命名呢?”,该操作在实际工作中经常应用到,如:根据某列进行统计,并将结果重新命名。...在pandas以前版本需要自定义聚合操作,如下: # 定义aggregation汇总计算 aggregations = { #在values01列上操作 'values01': {...Transform操作 这样我们就可以使每个分组平均值为0,标准差为1了。该步骤日常数据处理中使用较少,大家若想了解更多,请查看Pandas官网。...这里举一个例子大家就能明白了,即我们以Team列进行分组,并且希望我们分组结果每一组个数都大于3,我们该如何分组呢?练习数据如下: ?

    3.8K11

    30 个小例子帮你快速掌握Pandas

    列将添加在末尾。如果要将列放在特定位置,则可以使用插入函数。 df_new.insert(0, 'Group', group) df_new ?...第一个参数是位置索引,第二个参数是列名称,第三个参数是值。 19.where函数 它用于根据条件替换行或列值。默认替换值是NaN,但我们也可以指定要替换值。...符合指定条件值将保持不变,而其他值将替换为指定值。 20.排名函数 它为这些值分配一个等级。让我们创建一个根据客户余额对客户进行排名列。...Geography列内存消耗减少了近8倍。 24.替换值 替换函数可用于替换DataFrame值。 ? 第一个参数是要替换值,第二个参数是值。 我们可以使用字典进行多次替换。 ?...25.绘制直方图 Pandas不是数据可视化库,但用它创建一些基本图形还是非常简单。 我发现使用Pandas创建基本图比使用其他数据可视化库更容易。 让我们创建Balance列直方图。

    10.7K10

    PythonforResearch | 2_数据处理

    条件选择背后逻辑: 使用 df[condition] 来请求 Pandas 过滤数据框 conditon是每行True或者False值序列(因此condition长度必须和 dataframe...行长度相同) 在 Pandas ,只需在整个列上编写一个布尔表达式,就可以为每一行生成 True 或 False 值 Pandas 仅会显示行为True值。...使用.groupby()实现组内操作,处理流程如下: Split: 根据某些条件将数据分为几组 Apply: 分别对每个组应用函数 Combine: 将结果组合到数据结构 参阅:http://pandas.pydata.org.../pandas-docs/stable/groupby.html 通过创建 group 对象拆分 dataframe 步骤 1:创建一个组对象,该对象指定我们要创建组。...如果要将每个组汇总到数据框一行,则可以使用以下两个示例许多选项: grouped.sum() 和 gropued.mean() grouped.sum() pricempgheadroomtrunkweightlengthforeign

    4.1K30

    Pandas

    方法 head(): tail(): 创建 DataFrame 创建 DataFrame 方式有很多种,一般比较常用是利用一个字典或者数组来进行创建 import pandas as pd import...使用 loc 传入行索引名称如果为一个区间,则前后均为闭区间 #条件表达式切片用法 print('条件表达式使用字典方式,xy123x<5x为:\n', xy123.loc[xy123[...'x']<3, ['x']])#条件表达式使用字典方式 print('条件表达式使用属性方式,xy123x>=8x, y1为:\n', xy123.loc[xy123.x>=8,...‐ stamps not contained in a time series to perform a range query: ''' ts[datetime(2011, 1, 7):] 需要注意是切片访问相当于在源时间序列上创建一个...()方法将 series 相同值看作一个类别,分别返回各个类别的记录数量,即频次,并根据 sort 值决定是否按频次排序。

    9.2K30

    Pandas Sort:你 Python 数据排序指南

    在单列上对 DataFrame 进行排序 要根据单列值对 DataFrame 进行排序,您将使用.sort_values(). 默认情况下,这将返回一个按升序排序 DataFrame。...在多列上对 DataFrame 进行排序 在数据分析,通常希望根据多列值对数据进行排序。想象一下,您有一个包含人们名字和姓氏数据集。...先按姓然后按名字排序是有意义,这样姓氏相同的人会根据他们名字按字母顺序排列。 在第一个示例,您在名为 单个列上对 DataFrame 进行了排序city08。...为了说明 使用.sort_index(),首先使用以下方法创建一个排序 DataFrame .sort_values(): >>> >>> sorted_df = df.sort_values(by...通常,这是使用 Pandas 分析数据最常见和首选方法,因为它会创建一个 DataFrame 而不是修改原始数据。这允许您保留从文件读取数据时数据状态。

    14.2K00

    Pandas之实用手册

    如果你打算学习 Python 数据分析、机器学习或数据科学工具,大概率绕不开Pandas库。Pandas一个用于 Python 数据操作和分析开源库。...pandas 核心是名叫DataFrame对象类型- 本质上是一个值表,每行和每列都有一个标签。...最简单方法是删除缺少值行:fillna()另一种方法是使用(例如,使用 0)填充缺失值。1.5 分组使用特定条件对行进行分组并聚合其数据时。...例如,按流派对数据集进行分组,看看每种流派有多少听众和剧目:Pandas 将两个“爵士乐”行组合为一行,由于使用了sum()聚合,因此它将两位爵士乐艺术家听众和演奏加在一起,并在合并爵士乐列显示总和...1.6 从现有列创建列通常在数据分析过程,发现需要从现有列创建列。Pandas轻松做到。

    18510

    【干货原创】Pandas&SQL语法归纳总结,真的太全了

    对于数据分析师而言,Pandas与SQL可能是大家用比较多两个工具,两者都可以对数据集进行深度分析,挖掘出有价值信息,但是二者语法有着诸多不同,今天小编就来总结归纳一下Pandas与SQL这两者之间在语法上到底有哪些不同...## Pandas airports.type.unique() 多个条件交集来筛选数据 多个条件交集来筛选数据,代码如下 ## SQL select * from airports where...要是我们需要筛选出来数据在一个列表当中,这里就需要用到isin()方法,代码如下 ## SQL select * from airports where type in ('heliport',...= 'MISC'] df.drop(df[df.type == 'MISC'].index) 更新数据 在SQL当中更新数据使用是update和set方法,代码如下 ### SQL update airports...调用统计函数 对于给定数据集,如下图所示 runways.head() output 我们调用min()、max()、mean()以及median()函数作用于length_ft这一列上面,代码如下

    48030

    20个能够有效提高 Pandas数据分析效率常用函数,附带解释和例子

    import numpy as np import pandas as pd 1. Query 我们有时需要根据条件筛选数据,一个简单方法是query函数。...where函数首先根据指定条件定位目标数据,然后替换为指定数据。...我们也可以使用melt函数var_name和value_name参数来指定列名。 11. Explode 假设数据集在一个观测(行)包含一个要素多个条目,但您希望在单独行中分析它们。...我们要创建一个列,该列显示“person”列每个人得分: df['Person_point'] = df.lookup(df.index, df['Person']) df ? 14....Merge Merge()根据共同列值组合dataframe。考虑以下两个数据: ? 我们可以基于列共同值合并它们。设置合并条件参数是“on”参数。 ?

    5.7K30

    pandas分组聚合转换

    同时从充分性角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码一般模式: df.groupby(分组依据)[数据来源].使用操作 例如第一个例子代码就应该如下: df.groupby...,比如根据性别,如果现在需要根据多个维度进行分组,只需在groupby传入相应列名构成列表即可。...return x**e df['a'].apply(my_exp,e =3) # 结果 0 1000 1 8000 2 27000 Name: a, dtype: int64 题目:创建一个列...'new_column',其值为'column1'每个元素两倍,当原来元素大于10时候,将列里面的值赋0   import pandas as pd data = {'column1':[1...题目:请创建一个两列DataFrame数据,自定义一个lambda函数用来两列之和,并将最终结果添加到列'sum_columns'当中    import pandas as pd data =

    11310
    领券