Pandas Groupby，用于整数值的Group Concat

文章/答案/技术大牛

发布

1回答

python-3.x、pandas、pandas-groupby

我的pandas dataframe看起来像这样，我希望按键对它进行分组，并连接id的逗号分隔，然后创建一个新的dataframe。现在这里的问题是id列是整数。key id 1 abcd 5025923,5096021,5032121df.groupby('key'

浏览 5提问于2017-12-17得票数 4

2回答

Python、Pandas、DataFrame，添加与SQL GROUP_CONCAT等效的列

python、pandas、dataframe

我的问题与这里问的但没有回答的问题非常相似+------+---------+ +------+-| foghorn | 成为| team | group_concat('team').apply(lambda x: ',&#

浏览 0提问于2021-01-09得票数 1

1回答

Python快速DataFrame连接

python、pandas

我编写了一段代码，将DataFrame的部分连接到相同的DataFrame，以便按照某一列规范行的出现。in data.groupby(expectation, sort=False): while i < (max_count // int(counts[tag])): array =

浏览 3提问于2016-02-12得票数 5

回答已采纳

1回答

熊猫数据群中的索引第一行

python、pandas、dataframe、indexing、expand

我想知道是否可以根据索引(该索引的名称)创建每个组的第一行。这里发生的是索引被重置了，对于每个组，第一行是索引名？

浏览 1提问于2020-06-08得票数 0

回答已采纳

1回答

从python中的dataframe列表中收集2个或更多个数据

python、pandas、dataframe

我想从包含一些数据帧的列表中连接2个或更多的数据帧。DataFrameList = A，B，C，C，其中A，B，C是特定数据帧的名称。相同名称的数据帧有相同的行数，但没有列，而且它们有相同的id colmn.因此，想法是将所有具有相同名称的数据帧连在一起，最后我得到新的数据帧列表，这将是(基于上表) DataFramelist2 =

浏览 3提问于2017-06-02得票数 1

1回答

在熊猫中丢弃空时间组

python、pandas

我使用组按组将数据帧分组为不同的日期，然后根据使用concat的日期将它们分成训练组和测试组。gp = dfs_0.groupby(pd.TimeGrouper('B')) test = pd.concat([ gp

浏览 2提问于2017-08-11得票数 1

回答已采纳

1回答

CSV中大DataSet的Pandas GroupBy均值

python、pandas

一个常见的SQLism是"Select A，mean(X) from table group by A“，我想在pandas中复制这一点。假设数据存储在CSV文件中，并且太大而无法加载到内存中。如果CSV可以放在内存中，那么一个简单的两行代码就足够了：mean=data.groupby(data.A).mean()chunks=pandas

浏览 2提问于2014-04-21得票数 5

2回答

应用混合了布尔值和数值的pandas GroupBy

python、pandas-groupby

如何将pandas groupby应用于数值和布尔值的列？我想对数值列求和，并希望布尔值的聚合为any，即如果有任何True，则为True，如果只有False，则为False。

浏览 1提问于2020-06-16得票数 0

1回答

尝试应用extractall函数时，pandas返回"Cannot concat* indices not do number of levels“错误*

python、pandas、dataframe

在尝试从邮件正文中提取日期时，我遇到了错误：dfgroup= df.groupby('Subject') temp = dfgroup\s(PM|AM)))'))File "C:\Users\tioxr\AppDa

浏览 95提问于2018-01-30得票数 4

5回答

熊猫-如何通过对象获取最后n组，并将它们合并成一个数据

python、pandas、pandas-groupby

如何在df.groupby()之后获得最后的'n‘组，并将它们合并成一个数据帧。data = pd.read_sql_query(sql=sqlstr, con=sql_conn, index_col='SampleTime')在做了grouped.ngroups之后，我得到了277个组的总数。

浏览 0提问于2018-10-19得票数 13

回答已采纳

1回答

如何操作Dask的group* by返回的组？*

dask

in p.groupby("category"): groups.append(group) pd.concat(groups).sort_index() 我如何在Dask中做同样的事情？我不能按原样使用pandas函数，因为你不能在Dask中枚举groupby对象。这 impo

浏览 15提问于2019-10-18得票数 0

回答已采纳

1回答

Pandas GroupBy聚合不保留数据类型

pandas

我通过使用sum、max和min等函数将Pandas GroupBy和Groupby.agg用于我的数值列，但我注意到以前强加给我的列的数据类型(如np.int8、np.int16、np.int32)在GroupBy聚合后不会保留，实际上每一列都被覆盖为int64。Pandas版本1.1.5 我目前的解决方案是在完成groupby聚合后重新转换，这是一个已知的问题

浏览 19提问于2021-03-16得票数 1

回答已采纳

4回答

在pandas* df中查找timedelta对象的平均值和标准差*

python、pandas、datetime、mean、timedelta

我想从一个包含以下两列的dataframe中计算timedelta by bank的mean和standard deviation。当我运行代码(如下所示)时，我得到以下错误： pandas.core.base.DataError: No numeric types to aggregate 我的数据帧： bankFederal Reserve 8 days 13:27:11.387000 我的代码： means = dropped.groupby('b

浏览 84提问于2017-06-18得票数 27

回答已采纳

2回答

pandas将函数应用到每个组(输出并不是真正的聚合)

python、pandas、group-by

我有一个时间序列列表(=pandas dataframe)，并希望为每个时间序列(设备)计算matrixprofile。一种选择是迭代所有设备-这似乎很慢。第二种选择是按设备分组-并应用UDF。现在的问题是，UDF将返回1:1的行，即每个组不是一个标量值，而是作为输入输出相同数量的行。当返回1:1 (或至少是非标量值)时，是否仍有可能以某种方式向量化到达组的计算？import pandas as pd 'foo':[1

浏览 18提问于2020-11-09得票数 1

回答已采纳

1回答

熊猫群内的值随组群的变化

python、pandas

我有一个类似的系列：df=pd.DataFrame()df1 400 3 200 Name: Value, dtype: int64

浏览 0提问于2017-11-16得票数 2

回答已采纳

1回答

是否可以将pandas* GroupBy函数作为参数传递到python函数中？我该如何传递他们的观点呢？*

python、pandas、pandas-groupby

例如，在分位数的情况下，有一个用于告诉哪个分位数的参数，因此在这种情况下，我应该能够提供这个额外的参数。use to group.group_data = data.rank(pct = True).round(1).add_suffix('_grouper') out += [pd.concat([x, y

浏览 0提问于2017-12-07得票数 3

回答已采纳

1回答

如何使用Pandas* DataFrame替换lambda和分组以提高性能*

python、pandas、performance、datetime、dataframe

也许我的问题看起来很复杂，但本质上很简单。我是Python的新手，现在我面临着代码太慢的问题。下面是代码的优化版本。我将非常感谢一个小的代码审查和关于如何加速它的建议。我认为最慢的操作是.apply(lambda和grouping，但我不知道如何替代它们。'dt_hour']] = \ data.apply(lambda df: to_date_parts(df['SalesDate']), axi

浏览 2提问于2018-10-28得票数 0

2回答

在非常大的数据帧中使用掩码进行有效的条件选择

python、pandas、dataframe、selection、mask

1354 2017-08-07 05:26:00 5对于列'num‘中的每个和所有不同的值，我需要找到列'dt’的相应最小值。我正在使用带有掩码的列表理解，后面跟着一个操作符：它是有效的，但它真的花费了很多时间有没有其他更省时<

浏览 0提问于2021-01-20得票数 0

4回答

在熊猫中，是否有一个与.groupby相对的“非群居”操作？

python、pandas、group-by、pandas-groupby

12 jane 32 14 james 30 2group_df = group_df.aggregate({'name': name_join, 'age': pd.np.mean})然后执行一些聚合/汇总操作(在我<e

浏览 5提问于2013-11-21得票数 56

回答已采纳

3回答

熊猫中的新列-通过应用列表群将系列添加到数据中

python、pandas、dataframe、group-concat、pandas-groupby

4 B v 5我希望new列的结果以分组值作为列表0 A z('Id')['concat'].apply(list)获得的分组(它是一个比dataframe更小的Series )应用于原始数据from。我已经尝试了下面的代码，但它没有将其应用于dataframe： import pan

浏览 2提问于2016-11-04得票数 8

回答已采纳

点击加载更多