如何根据Pandas dataframe中的其他行添加聚合行

文章/答案/技术大牛

发布

2回答

、

1 1 1 2 1 3 1 2 2 1 5 2 2 2 9 7 2 3 2 6 我希望添加c为0的新行，并将d替换为a和b相同的现有行的最大d值： index a b c d 9 1 2 0 4 11 2 3 0 6 我可以使用什么命令

浏览 19提问于2019-05-16得票数 1

1回答

在Pandas dataframe中添加聚合/摘要行

、、、

假设我有如下数据框架：我已经学习了如何在这个的基础上将摘要/总行添加为一列。但是，我希望像上面的屏幕截图中显

浏览 4提问于2019-10-07得票数 1

回答已采纳

1回答

熊猫-附加DataFrame

、、

当附加到熊猫DataFrame时，附加的值不会添加到DataFrame中。df.append(DataFrame([[1]])

浏览 4提问于2021-06-19得票数 1

回答已采纳

1回答

Pandas "Group By“查询HDFStore中的大数据？

、、

在一个超过60列的HDFStore中，我有大约700万行。数据太多了，我放不进内存。我希望根据列"A“的值将数据聚合到组中。pandas 的文档假设我已经将所有数据放在一个DataFrame中，但是我不能将整个存储读取到内存中的DataFrame中。在HDFStore中对数据进行分组的</em

浏览 2提问于2013-04-04得票数 21

回答已采纳

1回答

groupby和get min，然后追加min行的值

、

我使用groupby，然后使用最小值作为聚合函数。我需要一些具有最小值的行的其他值。在下面的MWE中，我需要具有最小距离mindist的行的City值。import pandas as pd data = {'City' : ['London', 'Paris', 'Lyon','NY', 'Bristol&

浏览 3提问于2021-01-28得票数 0

1回答

将熊猫DataFrame作为PickledObjectField存储在Django Model中是不是一种坏做法？

、、

我在Django模型中存储一个熊猫DataFrame作为PickledObjectField。我需要根据特定的逻辑访问和修改这个DataFrame。Pandas使这项工作变得容易得多，我有一个使用Pandas选择和过滤器的engine类。我是否应该有一个单独的模型，将每一行存储在DataFrame中，然后使用django-pandas读取，执行操作并更新模型？这里

浏览 0提问于2018-12-15得票数 0

2回答

Pandas:根据组聚合添加新行

、

我想追加新的行，这样每个ID总是有5个拒绝代码。<code>A0</code>与ID C相同，我需要追加3行: EL3、EL4和EL5？<code>A1</code>

浏览 20提问于2019-12-03得票数 1

回答已采纳

1回答

如何在spark中使用pandas* split-apply-combine风格策略和scala api？*

、、、

我有一个scala函数，它接受一个spark dataframe并返回一个单值，也就是说两个值。这个函数很复杂，使用在DataFrame类中定义的聚合，调用其他java库，并且不能用SQL表达。它需要整个数据帧的内容来进行计算，它不能一次添加一行并建立一个结果。我有一个大的dataframe，其中包含一个列，我想用它将dataframe分成小块，并对每个小块执行上述计算。然后，我

浏览 28提问于2020-04-22得票数 0

3回答

如何根据pandas* dataframe中的其他行创建新列？*

、

我有一个200k行的数据框，我尝试在其他行的基础上添加列，但有一些条件。我试着实现它，但花了很多时间(2个小时)。下面是我的代码： for index in dataset.index: B_id = dataset.loc[indexdataset.at[index, 'D_mean'] = subset['D'].mean(

浏览 30提问于2020-01-03得票数 0

回答已采纳

1回答

如何在复制或群居熊猫DataFrame时保持主要秩序？

、、、、

我使用pandas.DataFrame作为业务应用程序中的数据结构(风险模型)，需要快速聚合多维数据。熊猫的聚合在很大程度上取决于在底层的numpy数组上使用的主要订购方案。其影响是：案例2: 5分46秒在包含45023行和100000列的DataFrame及其副本上。对索引执行聚合。该索引是一个具有15个级别的pd.MultiIndex

浏览 4提问于2019-05-23得票数 1

回答已采纳

1回答

如何根据其他行的条件创建列- Pandas* Dataframe？*

、、、

我有以下问题：名为df1的数据帧如下： Id PVF PM_year Year1 A175 56 54，对于每个组合(ID+Year)，它等于具有相同Id和前一年的PM_year的值…… 示例：对于索引为3的行，Id为'A6489‘，年份为2019年。因此，新列"PM_previous_year“的值应该是Id相同('A6489')且year等于2018

浏览 22提问于2021-01-25得票数 0

回答已采纳

0回答

pandas根据dataframe值向dataframe添加新行

、

当用户没有花钱时，我需要检查数据并添加行。例如，我需要添加如下行：1 a 3 0# get alli), 'amount_spent'] = 0 df = df.reset_index() 当我在大约90,000行的数据集上运行时，这似乎是令人难以置信<e

浏览 4提问于2017-06-07得票数 0

回答已采纳

2回答

pandas dataframe:根据其他行中的条目选择多行

、、、

根据评论更新(2018/11/06)：(a)获取参加“测试1”的学生和分数的数组？Stanley,81,Class,BDuke,83,Craig,85假设我有以下数据帧： import pandasJanet',81],['

浏览 1提问于2018-11-05得票数 1

2回答

来自其他列和行的DataFrame中的新列

、、

我想在现有的DataFrame，df中创建一个新的列V。我希望新列的值是该行中'x‘列中的值与它下面行中'x’列的值之间的差异。例如，在下图中，我希望新列的值为93.244598 - 93.093285 = 0.151313。我知道如何根据Pandas中现有的列创建一个新列，但我不知道<e

浏览 4提问于2022-07-26得票数 1

回答已采纳

1回答

使用Python3和Anaconda，我在ipython上导入了pandas和os。我有一个非常大的csv文件。在对文件使用read_csv之后，我尝试对两列使用.groupby()，但它将数据类型从DataFrame更改为DataFrameGroupBy，并且我不能再对其运行数据框方法。我想不出任何可以尝试的东西。我对熊猫的经验很少，通过codecademy获得的。我的代码似乎可以在那里工作。import os import pandas as pd

浏览 19提问于2019-06-21得票数 0

回答已采纳

1回答

在DataFrame中插入新行时出错

、、、、

我从字典中创建了一个dataframe，并将它的一个列设置为我的索引。：dict={"S.NO":[1,2,3,4,5], "FEES

浏览 12提问于2022-12-04得票数 0

2回答

获取特定列的行和- Python

、、、、

', 100, 200], ['Belgium', 15, 80], ['Germany', 125, 300]]# Create the pandas DataFrame3 Ne

浏览 3提问于2022-09-13得票数 1

回答已采纳

1回答

使用熊猫时，值的长度与索引长度不匹配。

、

在使用Pandas时，我得到了'ValueError:值的长度与索引长度不匹配‘。我使用Pandas‘'pd.read_excel方法从Excel电子表格中读取数据，然后使用Pandas’filter方法过滤数据。我创建了“dataSubset”来表示过滤后的数据。我使用“dataSubset”创建了几个“平均”列，分别表示多个列的平均值。然后我创建'finalData‘，它表示连接所有计算出的平均值列的

浏览 4提问于2022-02-02得票数 0

回答已采纳

1回答

按行名分组Pandas DataFrame

、、、、

我有一个简单的Pandas DataFrame，它有行名和2列，类似于下面的内容。from pandas import DataFrame, Seriesdf = DataFrame({'col13, 4], index=row_names), 'c

浏览 2提问于2014-04-03得票数 0

回答已采纳

1回答

基于值而非指数的大熊猫Skiprow条件

、、、

我正在试着阅读熊猫的csv文件。2018 11 Yes28/05/2018 50 No30/05/2018 27 No我想在阅读之前而不是之后过滤它。

浏览 2提问于2018-05-30得票数 5

回答已采纳

点击加载更多