如何使用pandas中的条件在groupby中设置标志_在pandas groupby中查找满足条件的组_如何在每组pandas groupby对象中添加标志列 - 腾讯云开发者社区

python、pandas

如何对pandas groupby操作应用排序？下面的命令返回一个错误，指出'bool‘对象不可调用 import pandas as pd df.groupby('cokey').sort('A') cokey A B 11168155 18 56 11168155 0 18 11168155 56 96 11168156 96 152 11168156 0 96

浏览 1提问于2015-04-07得票数 14

回答已采纳

1回答

如何提高pandas GroupBy filter操作的性能？

python、pandas、group-by、pandas-groupby

这是我第一次问问题。我正在处理一个大型的CSV数据集(它包含超过1500万行，大小超过1.5 GB )。我正在将摘录加载到运行在Jupyter Notebook中的Pandas dataframes中，以基于数据集推导出一个算法。我根据MAC地址对数据进行分组，这导致了1+百万组。我的算法开发的核心是运行这个操作： pandas.core.groupby.DataFrameGroupBy.filter 根据数据集的不同，运行此操作需要3到5分钟。为了开发这个算法，我必须执行这个操作数百次，甚至数千次。此操作似乎是受CPU限制的，并且仅使用我的机器上可用的几个内核中的一个。我花了几个小

浏览 22提问于2019-02-10得票数 6

回答已采纳

1回答

当列介于两个值之间时，汇总Pandas数据

python、pandas

在python中，我有一个Pandas dataframe (df)，可以在下面进行复制。 import pandas as pd data = [['2021-09-12', 'item1', 'IL', 5], ['2021-09-12', 'item2', 'CA', 7], ['2021-08-13', 'item2', 'CA', 8], ['2021-06-12', 'item3', 'NY'

浏览 1提问于2021-09-21得票数 1

回答已采纳

1回答

使用groupby找到满足特定标准的元素的平均值

python、pandas

我有一个数据集，我需要使用Python和Pandas在满足特定标准的列中找到特定项目的平均价格。标准是“制造商”栏中的“本田”和“丰田”，“状况”栏中的“好”，“类型”栏中的“轿车”。价格在“价格”栏中。然后，我需要将特定的值返回到元组中。我知道我需要使用groupby()，但我不知道还能做什么 import numpy as np import pandas as pd df = pd.read_csv("vehicles.csv") def get_avg_prices(): df.groupby(['criteria','manufactur

浏览 3提问于2022-11-15得票数 0

1回答

从每个组中删除前n个

pandas

我有一个pandas数据框架，结构如下： idx | flag | val ---------------- 0 | a | 17 1 | a | 18 2 | a | 17 3 | a | 14 4 | a | 17 5 | b | 7 6 | b | 8 7 | b | 7 8 | b | 7 如何删除每个标志的前n个值？

浏览 11提问于2021-08-02得票数 1

回答已采纳

1回答

如何获取pandas中任意列中包含特定字符串的所有行的平均值？

python、pandas、dataframe

假设我有一个pandas数据框架，其中包含一个假设调查的答案。有两个问题：“美国国旗上的哪种颜色是你最喜欢的(你可以选择不止一种)？”和“你的月薪是多少？”第一个问题有几种可能的答案： 1. red, white, blue 2. red, white 3. red, blue 4. red 5. white, blue 6. white 7. blue 我想要得到在第一个问题的答案中分别包括红色、白色和蓝色的所有人的平均工资价值。我想得到这样的东西： FlagColor Salary red 4345 white 3444 blue 2356 我得到了所有选

浏览 28提问于2020-12-22得票数 1

1回答

DataFrame中N群的M

python、pandas、dataframe、group-by、pandas-groupby

我有一个DataFrame，列为a和b。对于列a中的每个组，我希望获得b列的第一个n唯一值的m行。作为一个简单的例子，假设m和n分别为2和3。下列数据集： a b 0 hello 1 1 hello 2 2 hello 0 3 hello 1 4 hello 3 5 hello 2 6 hello 3 7 hello 0 8 goodbye 0 9 goodbye 3 10 goodbye 1 11 goodbye 0 12 goodbye 2 13 goodbye

浏览 1提问于2018-02-07得票数 1

回答已采纳

5回答

Python Pandas:使用groupby()和agg()时是否保持顺序？

python、pandas、aggregate

我经常使用pandas的agg()函数对data.frame的每一列运行汇总统计信息。例如，下面是生成平均值和标准差的方法： df = pd.DataFrame({'A': ['group1', 'group1', 'group2', 'group2', 'group3', 'group3'], 'B': [10, 12, 10, 25, 10, 12], 'C': [100,

浏览 399提问于2014-10-20得票数 59

回答已采纳

1回答

选择Pandas数据框分组所依据的列

python、python-3.x、pandas、dataframe、pandas-groupby

我有一个熊猫数据帧flsa flsa[:10] auc topics ww top-n fold 0 0.668729 11 entropy 10 1 1 0.609736 11 entropy 10 2 2 0.654445 11 entropy 10 3 3 0.612886 11 entropy 10 4 4 0.596460 11 entropy 10 5 5 0.654208 11 en

浏览 8提问于2021-05-18得票数 0

回答已采纳

1回答

使用pandas dataframe查询sql

python、pandas、dataframe

我尝试使用pandas dataframe来检索结果，以获得相同的结果这是我的SQL查询： SELECT strftime('%m', date_report) as month, count(*) as total_infector from cases where has_travel_history = 't' and age >= '50' group by month order by total_infector desc limit 2 使用pandas数据帧： import pandas as pd df = pd

浏览 4提问于2020-09-01得票数 0

1回答

有条件地连接两个字符串列

python、pandas

我正在尝试用低于nth的字典替换重复项。我想知道我如何能够忽略某些值，这样它们就不会被替换。例如，如果出现名称'Jack‘，不要将其更改为'firstJack’，只需保留为'Jack‘即可。 import pandas as pd import numpy as np nth = { 0: 'first', 1: 'second', 2: 'third', 3: 'fourth'} data = {'Name':['Tom', 'To

浏览 14提问于2020-01-29得票数 1

回答已采纳

1回答

在另一列中查找与多个列匹配的位置

python、pandas、dataframe

我需要有1:1基数的结果，所以我需要测试COL1中的值在COL2中是否不止一次存在。 COL1 COL2 A 1 B 2 B 2 B 3 C 4 D 5 E 5 E 5 使用Python (最好是Pandas，除非有更好的方法)，我希望看到COL1中的值在COL2中有多个匹配的所有行？在上面的示例中，我想知道COL1=B何时在COL2中有多个匹配(即COL1 =B匹配/联接中的基数与COL2 =2&也是3？

浏览 1提问于2019-01-20得票数 1

回答已采纳

4回答

删除pandas后的组group

python、pandas

是否可以从pandas中的groupby对象中删除组(按组名)？即在执行groupby后，根据结果组的名称删除结果组。

浏览 3提问于2013-06-04得票数 21

回答已采纳

1回答

如何从pandas数据帧中另一列的多个值创建列中的值列表？

python、pandas

我有一个包含以下值的数据帧： filename, keyword, page A, red, 1 A, red, 2 A, green, 1 B, red, 1 B, green, 1 C, green, 2 如何将其转换为以下格式？ filename, keywords, pages A, [red, green], [1,2] B, [red, green], [1] C, [green], [2] 在Pandas中有没有简单的方法来做到这一点？如果列表不允许作为单元格值，是否有其他数据类型可以使用Pandas允许的数据类型？或者是Pandas数据帧的替代品，我可以将其存储在其中，然后将

浏览 5提问于2020-10-26得票数 0

2回答

Python -比较多列

python、pandas、csv

我正在尝试从库存中停用某些产品，如果所有大小的产品都有零库存，从使用熊猫的csv。Psuedo -按照"desc“对所有产品进行分组，如果所有"instock”等于零，则返回true为"inactive“ 我试过在pandas中使用groupby函数，但我搞不懂它是如何工作的。这是csv，我试着解释我的意思...

浏览 11提问于2019-08-12得票数 0

回答已采纳

4回答

Pandas -查找在每个类组中显示的唯一值

python-3.x、pandas

我有一个python pandas表，如下所示： class | id _____________________ A 12311894945 A 12311760566 A 12311433981 A 12299990440 A 12291758744 B 12311894945 B 12311760566 B 12311433981 B 12299990440 B 12291758744 C 1229

浏览 0提问于2021-03-05得票数 3

1回答

pandas groupby中"as_index = False“和"reset_index()”的区别

python、pandas、pandas-groupby

我只是想知道这两个人执行的功能有什么不同。数据： import pandas as pd df = pd.DataFrame({"ID":["A","B","A","C","A","A","C","B"], "value":[1,2,4,3,6,7,3,4]}) as_index=False： df_group1 = df.groupby("ID").sum().reset_index() reset_index()：

浏览 0提问于2018-08-16得票数 12

回答已采纳

1回答

Pandas Dataframe groupby和filter by max(key)

python、pandas、dataframe

td = [[10,'A'],[10, 'B'],[2, 'C']] import pandas df = pandas.DataFrame(td, columns=['col1','col2']) df.groupby('col1') All，我如何通过最大值(Key)获取组。在本例中为10 -> 'A'，'B‘ 谢谢!

浏览 0提问于2018-05-03得票数 1

1回答

如何在多个条件下过滤数据？

pandas

我有以下数据。 import pandas as pd import numpy as np d ={ 'ID1':['abc1','abc2','abc3','abc4','abc5','abc1','abc1','abc1','abc1','abc1','abc2','abc2','abc2','abc3'],

浏览 0提问于2019-04-03得票数 1

回答已采纳

2回答

如何使用Python在大型csv文件上打印特定年份

python、csv、pandas

import pandas fileref = open('chart.csv') f = pandas.read_csv(fileref) f_set = f[f.year >= 2005] print(f_set.groupby('y').namefromchart.nunique()) 所以我知道f_set会打印出我的y单元格，对应的年份是2005到current。如果我想打印2002到2009年的数据，该怎么办？

浏览 0提问于2016-10-20得票数 3

1回答

pandas中面向对象的数据帧清理模式

python、dataframe、oop

我需要在面向对象模式下编写python代码的帮助。我正在尝试使用pandas标记数据帧中的列值。有没有人可以帮助我如何入门，或者向我推荐一些资源？如何声明一个全局变量并指定温度和湿度的范围，然后编写一个函数来标记超出该范围的值？下面是我的代码： import pandas as pd filename = 'data.csv' #Read the dataframe and display the column names in the dataframe df = pd.read_csv('data.csv', encoding="Latin&#

浏览 15提问于2020-05-08得票数 0

2回答

如何将数据集与熊猫群相结合

python、pandas、dataframe、lambda、pandas-groupby

我有一个dataframe df和一个列df['table']，这样df['table']中的每一项都是具有相同标题/列数的另一个数据same。我想知道是否有办法像这样做groupby：原始数据： name table Bob Pandas df1 Joe Pandas df2 Bob Pandas df3 Bob Pandas df4 Emily Pandas df5 在小组讨论之后： name table Bob Pandas df containing the appended df1, df3,

浏览 0提问于2020-10-07得票数 7

回答已采纳

1回答

基于滚动周期的熊猫测试值再现

python、pandas

我试图找出一种方法来检查我现在的row value - df['ColM']是否在5天的回顾期内出现在下面的dataframe中。 import pandas as pd import numpy as np df = pd.DataFrame() df['ColN'] = ['AAA', 'AAA', 'AAA', 'ABC', 'ABC', 'ABC', 'ABC', 'ABC'] df['ColM'] = [

浏览 0提问于2018-04-30得票数 1

回答已采纳

2回答

Dask Dataframe groupby在pandas序列中的结果，我如何返回dask dataframe？

pandas、dataframe、pandas-groupby、dask

我正尝试在Dask中执行groupby函数来创建一个新的Dask数据帧。然而，当我做groupby时，结果是一个熊猫系列。当我在Pandas中执行相同的操作时，我确实返回了一个新的数据帧。如何返回新的dask数据帧？代码如下： g1 = df1.groupby(['SFDC_Refresh_Date', 'Forecast_Category']).Total.sum().compute() g1.dtypes 返回： dtype('float64') 和 type(g1) 返回 pandas.core.series.Series 当

浏览 4提问于2019-10-09得票数 0

1回答

根据条件删除熊猫群

python、pandas、filter

我有一个包含几个组的pandas数据框，我想排除那些不满足某些条件(在特定列中)的组。例如，删除这里的组B，因为它们在列"crit1“中有一个非数字的值。我可以根据条件df.loc[:, (df >< 0).any(axis=0)]删除特定的列，但不会删除整个组。不知何故，我不能进行下一步，并将其应用于整个团队。 name crit1 crit2 A 0.3 4 A 0.7 6 B inf 4 B 0.4 3 因此，过滤后的结果(只允许浮点数)应该是： A 0.3

浏览 5提问于2016-08-18得票数 6

回答已采纳

1回答

pandas.DataFrame.groupby.nunique()没有删除groupby列。这是一个错误吗？

python、pandas、pandas-groupby

尽管我将参数as_index设置为True，但pandas.DataFrame.groupby.nunique()会将我分组的列保留在结果中。 pandas版本为: 0.24.1 df = pd.DataFrame( {'a': [1, 1, 2, 3, 2], 'b': [1, 2, 3, 4, 4]} ) df.groupby('a', as_index=True).nunique() 输出为： # a b # a # 1 1 2 # 2 1 2 # 3 1 1 我期望： # b # a

浏览 0提问于2019-08-21得票数 2

2回答

为分组的pandas数据帧创建散点图

python、pandas、dataframe、matplotlib、scatter-plot

我有一个Pandas DataFrame，我想要按某个列进行分组。然后，我想对这个分组的数据帧做一个散点图。然而，如果我这样做了，我会得到一个错误，因为我分组的列是无法识别的。 # Data loading, processing and for more import pandas as pd import numpy as np # Visualization import seaborn as sns import matplotlib.pyplot as plt # set seaborn style because it prettier sns.set() df = pd.D

浏览 27提问于2020-12-17得票数 0

回答已采纳

1回答

在熊猫数据中迭代多列和多行

python、pandas

我对Pandas相当陌生，非常需要帮助，通过比较多组配对中的连续行来修改我的数据帧： Dataframe示例= idData idStation idCast Pressure 1 1 1 1505 2 1 1 1506 3 1 1 1507 4 1 1 1508 5 1 2 1505 6 1 2 1506 7 1 2 1503 8 1 2 1504 9 2 1 1505 10 2 1 1506 11 2 1 1507 等对于每个idStation和idCast对

浏览 1提问于2016-06-20得票数 1

2回答

如何保留大熊猫中另一列中具有最高值的列的值

python、python-3.x、pandas

我有以下数据： import pandas as pd df = pd.DataFrame({'var': ['A', 'A', 'B', 'B', 'C', 'C', 'C'], 'value': [1, 2, 1, 2, 3, 4, 5], 'input': [0.1, 0.1, 0.2, 0.2, 0.3, 0.3, 0.3]}) 我希望

浏览 0提问于2019-07-05得票数 1

回答已采纳

2回答

获取每个组的特定索引数。

pandas

在这个示例中，dataframe： import pandas as pd import numpy as np i = ['dog', 'cat', 'elephant'] * 3 df = pd.DataFrame(np.random.randn(9, 4), index=i, columns=list('ABCD')).sort_index() 什么是最快的方法，以获得每只动物的第二排作为数据？

浏览 0提问于2019-02-08得票数 2

回答已采纳

1回答

Pandas组中的唯一值

python、pandas、dataframe、data-science

我有一个数据帧，我需要分组，然后分组。从子组中，我需要返回子组是什么以及列的唯一值。 df = pandas.DataFrame({'country': pandas.Series(['US', 'Canada', 'US', 'US']), 'gender': pandas.Series(['male', 'female', 'male', 'female']),

浏览 9提问于2017-01-27得票数 6

2回答

在Pandas dataframe中查找重复值的计数和排序

python、pandas

我有一个有很多栏目的Pandas dataframe，其中两个是“电影标题”和“年龄”，我想找到平均年龄最低的前5部电影，但只包括至少有100次收视率的电影(所以至少有100行)。例如： movie title age Title 1 10 Title 2 12 Title 2 12 Title 3 13 Title 3 13 Title 3 13 应成为： movie title # of ratings avg age Title 1

浏览 3提问于2016-04-02得票数 4

回答已采纳

2回答

使用.apply()比较元素

python、pandas

我有一个由数千个条目组成的dataframe df，其中列"group“的值重复了2到10次。dataframe有七列，其中一列名为“url”，另一列名为“标志”。所有这些都是字符串。我想用Pandas来穿行这些团体。对于每个组，我希望在"url“列中找到最长的项，并在对应于该项的”标志“列中存储"0”或"1“。我试过以下几种方法，但我无法使它起作用。我希望1)去掉下面的循环，2)能够通过df.apply(.)比较组中的所有项。 all_groups = df["group"].drop_duplicates.tolist() for i

浏览 6提问于2017-08-08得票数 0

回答已采纳

1回答

如何在pandas中应用groupby，随着时间的推移进行特定于客户的查询

python、pandas、pandas-groupby

我有一些随时间推移的交易数据，我正在尝试在Pandas中应用groupby，这样我就可以建立平均收入支出，每年客户的平均交易数量，但不知道如何在Pandas中做到这一点。数据如下所示： CustomerID Year Revenue 123 2018 2000 126 2019 157 123 2019 563 674 2018 320 我尝试过不同的groupbys，例如： df.groupby(["CustomerID", "Year"]).median() 但这只会返回一个海量的数据帧。

浏览 9提问于2020-03-09得票数 0

2回答

Pandas -显示一列中的值的百分比，按其他列分组

python、pandas、percentage

因此，我有一个包含两列的Pandas DataFrame :第一个是等级，值从0到9，第二个是条件，值为0或1。等级(0-9/标准(0/1)) Grade Criteria 0 0 1 1 1 0 2 2 1 3 2 0 4 5 1 5 2 1 等我需要计算"Criteria rate"，它实际上是Criteria列中的“1”的总和，除以Criteria列中适当的行数，但按values列值分组。例如，对于等级=2

浏览 2提问于2018-09-05得票数 2

2回答

更有响应性的语法或函数，将列中单元格的值与以前的单元格和其他列进行比较

python、pandas、loops

我已经创建了一个循环来完成这项工作，但是执行效率很低。示例数据集： import pandas as pd df = pd.DataFrame([[6039,'ABC',2],[1319,'DEF',2],[6039,'ABC',2],[2811,'DEF',2],[9256223,'XYZ',2],[7021,'ABC',3],[1302,'DEF',3],[3344,'ABC',4],[7648411,'XYZ',4],[1190,'D

浏览 4提问于2022-08-06得票数 2

回答已采纳

4回答

转置和连接字符串

python、python-3.x、pandas

如何在不使用for循环的情况下转置和连接pandas数据帧？以下是输入数据： input_data = pandas.DataFrame({'a': ['fruit', 'fruit', 'fruit', 'food', 'food', 'food', 'food'], 'b': ['banana', '', 'apple', 'rice'

浏览 39提问于2019-05-29得票数 3

回答已采纳

2回答

基于自定义条件的csv中的行过滤

python、pandas、filter

假设我有一个csv，如下所示 +-----+-----------+---------+ | ID | state | city | +-----+-----------+---------+ | 101 | READY | | | 101 | DELIVERED | NEWYORK | | 101 | DELIVERED | LONDON | | 102 | READY | | | 102 | DELIVERED | LONDON | | 103 | READY | | | 103 | DELI

浏览 1提问于2020-08-03得票数 2

回答已采纳

2回答

熊猫在列间操作上的分组和聚合

pandas、aggregate

我是一个R和data.table用户，试图使用更多的Python和pandas，当我想在pandas中执行以下操作时，我感到非常沮丧，因为似乎没有一种简单的方法： df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [0.2, 0.2, 0.2, 0.1], 'c': [10, 9, 10, 22], 'd': [2, 3, 3, 1]}) 在R中，如果我想对b和c的乘积进行求和，并对d之和进行除法(按a分组)，我只需这样做： df[, sum(b*c)/sum(d), by=a] ，但对我来说，

浏览 3提问于2022-05-02得票数 1

回答已采纳

2回答

根据由某些事件分隔的记录创建事件编号列

python、pandas、dataframe

I有以下DATAFRAME I正试图到达这个DATAFRAME 我的代码在这里(包括我尝试的解决方案) import pandas as pd # Data myInput = {'name': ['TOM','TOM','TOM','TOM','TOM','TOM','TOM'], 'fruit': ['apple','apple','orange','orange

浏览 1提问于2021-03-09得票数 1

回答已采纳

1回答

pandas中的多行可以有一个唯一的索引吗？

python、pandas

pandas中的多行可以有一个唯一的索引吗？示例： index country value 1 NL 'hi' 2 NL 'wet' 3 SWE '4' 4 SWE 'maybe' 因此，在本例中，我不能将NL设置为索引，因为它不是唯一的。在pandas中，一个索引不能有多行吗？

浏览 1提问于2016-12-18得票数 3

3回答

Python Pandas-查找值超过阈值的第一个实例

python、pandas

我正在尝试根据另一个Python Pandas数据框列查找超过阈值的值的第一个实例。在下面的代码中，"Trace“列对于多个行具有相同的编号。我想要找到"Value“列超过3的第一个实例，然后，我想从该行获取其余信息，并将其导出到新的Pandas数据框中(如第二个示例所示)。有什么想法吗？ d = {"Trace": [1,1,1,1,2,2,2,2], "Date": [1,2,3,4,1,2,3,4], "Value": [1.5,1.9,3.1,5.5,1.1,3.6,1.9,6.2]} df = pd.DataFrame

浏览 24提问于2018-07-29得票数 3

回答已采纳

2回答

在没有pip安装包的Conda环境中运行。

python、pip、conda

我正在创建一个Conda环境，希望确保它允许任何人在我的存储库中运行脚本，而不必单独安装任何内容。但是，我已经在我的机器上编写了一些软件包，所以，如果我正确理解的话，我的一些导入可能会工作，因为我已经安装了它们，而不是因为它们安装在Conda环境中。例如，假设我使用conda create --name my_env python=3.8.8创建了一个环境。这不应该安装Pandas，但是如果我运行import pandas as pd，它就能工作。我相信这是因为我安装了潘达斯。我的问题是：如何测试脚本是否只适用于安装在conda环境中的包？

浏览 2提问于2021-11-03得票数 1

1回答

Python: pandas列上的多条件问题

python、pandas、conditional-statements

我有一个关于pandas专栏的多条件的问题。我有以下数据帧： A B C 0 0 9 0 1 1 8 0 2 1 9 0 3 1 5 1 4 1 9 1 5 1 8 1 6 -1 9 0 7 -1 5 -1 8 -1 7 -1 我试图实现的目标如下： 1.)如果A>0和B <6，则C应变为1，并保持该值，直到A发生变化(B可能大于6) 2.)如果A<0和B <6，C应该变成a -1，并保持到A改变(B可能超过6) 有什么建议如何在没有循环的情况下做到这一

浏览 0提问于2018-10-05得票数 1

10回答

Pandas 'count(distinct)‘等同

python、pandas、count、group-by、distinct

我使用Pandas作为数据库的替代品，因为我有多个数据库(、等)，并且我不能为SQL等效项创建一系列命令。我在DataFrame中加载了一个表，其中包含一些列： YEARMONTH, CLIENTCODE, SIZE, etc., etc. 在SQL中，要计算每年不同客户端的数量，应为： SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH; 结果将会是 201301 5000 201302 13245 我如何在Pandas中做到这一点呢？

浏览 11提问于2013-03-14得票数 350

回答已采纳

2回答

sum()得到一个意外的关键字参数'axis‘

python-3.x、pandas

clean_df = clean_df.groupby(by=index_keys).sum(axis=1, numeric_only=True) 抛出 sum() got an unexpected keyword argument 'axis' 我从相关问题中了解到，这与更新软件包有关。如何找出哪个包裹有问题？ $ pip show pandas Name: pandas Version: 1.2.0 >python -m pip check No broken requirements found.

浏览 18提问于2021-01-03得票数 1

回答已采纳

2回答

Swift:多目标处理:宏不工作

ios、xcode、macros、targets

引用和我创建了三个目标，每个目标都有不同的捆绑ids和应用程序图标。我还在“其他快捷旗”->“自定义迅速旗”部分添加了不同的旗子。喜欢对于第一个目标，我添加了"-DGOLD"，对于第二个目标，添加了"-DSILVER"，对于第三个目标，添加了"-DPLATINUM"。在AppDelegate中，我写了一段代码 #if GOLD print ("Gold") #elseif SILVER print ("Silver") #else print ("Platinum") #endif 菲

浏览 7提问于2017-08-03得票数 4

回答已采纳

1回答

Python -检查pd.DataFrame.groupby的所有可用函数？

python、pandas、group-by

我知道在pandas中，pd.DataFrame.groupby有相当多的方法，比如sum，mean，head，等等。我如何轻松地获得groupby所有可用函数的列表？我尝试使用dir()，但它不起作用。

浏览 23提问于2021-10-05得票数 0

2回答

熊猫串连后调整栏

pandas、python-3.8

我有一个数据文件，如下所示，它是在Pandas concat操作之后生成的： Date Col1 Col2 Col1 Col2 1/1/2021 1 3 2/1/2021 2 4 3/1/2021 5 6 4/1/2021 7 8 我想得到以下信息： Date Col1 Col2 1/1/2021 1 3 2/1/2021 2 4 3/1/2021 5 6 4

浏览 3提问于2021-11-07得票数 1

回答已采纳

1回答

使用groupby和groupby.size()的输出

python、pandas、group-by、scipy、conditional-statements

我有一个pandas数据框，其中包含参与者在用户研究期间操作的每个对象的一行。每个参与者都参与了3次研究，每种情况下(a，b，c)各一次，每种情况下约有300-700个对象。当我报告使用的对象的数量时，我希望确保这不会因条件的不同而有显着差异(我不希望它会这样做，但需要从统计上确认这一点)。我想我想运行方差分析来比较这3个条件，但我不知道如何获得方差分析所需的数据。我目前有一些pandas代码来对数据进行分组，并计算每个条件下每个参与者的行数(这样我就可以使用mean()和类似的方法来汇总数据)。下面是一个包含数据子集的示例： >>> tmp = df.groupby(

浏览 10提问于2016-09-19得票数 1

回答已采纳