在pandas数据帧上按条件高效地增量值_在Pandas数据帧元素上应用条件_在pandas groupby数据帧上应用条件聚合 - 腾讯云开发者社区

、、、

我有一个pandas数据框架，我想在其中比较Var1和Var2中的值 import pandas as pd data = [['foo', 'foo', 1613030200], \1613030985]] df = pd.DataFrame(data, columns = ['Var1', 'Var2', 'ts']) df 其思想是添加一个名为group的单独列，只有在检测到=x['

浏览 14提问于2021-02-11得票数 1

回答已采纳

1回答

从pandas dataframe中选择特定行

、、

我在pandas数据帧中执行了group by，以查看每个位置和每个日期有多少行。agg_count = df.groupby(['date', 'location']).count() 现在，我希望看到这个新数据帧中满足特定条件的行。比如说，计数大于50。我如何高效地迭代这个巨大的数据帧来获得这些行？

浏览 1提问于2013-03-26得票数 1

回答已采纳

1回答

如何使用pandas有效地为序列中缺失的数据点添加行？

、

我有以下一天发生的销售数量的时间序列数据集作为pandas数据框架。date, sales20161225,220161231,820161224,520

浏览 5提问于2017-01-10得票数 1

回答已采纳

2回答

将根据给定需求选择的某些行放入另一个数据帧中

、

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

2回答

对给定列表顺序的数据帧进行排序Python

、、

现在，我想按名称对数据帧进行排序，但不是按字母顺序，而是按给定的顺序。因此，例如，我希望在名称行上按以下顺序对数据帧进行排序： L = ['marc','paul','beck','julia','rest'] 如果我有一个数据帧，其中包含一行名称，我希望marc位于顶部如何在pyt

浏览 16提问于2019-02-26得票数 2

1回答

根据每组值的分位数过滤数据帧

、、

假设我有一个这样的数据帧： import pandas as pd df = pd.DataFrame({'col1':['A','A', 'A', 'B','B'], 'col2':[2, 4, 6, 3, 4]}) 我希望只保留那些在col2处的值小于col1的每组值的第x个分位数的行。例如，对于第60个百分位数，数据帧应如下所示： col1

浏览 30提问于2020-01-31得票数 1

回答已采纳

1回答

优化pandas数据帧到json的成本

、、、

我的目标是按1列对数据帧进行排序，并尽可能高效地返回一个json对象。对于复制，请定义以下数据帧：import numpy as np0 74 892 53 394 69

浏览 2提问于2018-08-27得票数 2

回答已采纳

2回答

创建pandas数据帧:在numpy上映射函数

、、、

我正在创建一个pandas数据帧，并使用numpy来模拟值。我想将随机生成的in分配给pandas中的两列，为此，我编写了一个返回字母数字in的函数。但是，在我当前的代码中，它只调用该函数一次，并为所有行返回相同的ids。我需要为每一行提供唯一的ids，因此需要高效地迭代pandas数据帧。理想情况下，.apply可以做到这一点，但是，我需要在创建pandas数据帧</em

浏览 20提问于2020-07-04得票数 1

回答已采纳

1回答

熊猫填补了性能问题

、、

我有一个具有多索引(Date，InputTime)的数据帧，该数据帧的列(Value，Id)中可能包含一些NA值。我想要填充正向值，但只按日期填充，而且我找不到以一种非常有效的方式这样做的方法。下面是我拥有的数据帧类型：下面是我想要的结果：因此，为了按日期正确填充，我可以使用groupby(level=0)函数。groupby很快，但是应用于数据帧group by date的填充函数实在太慢了

浏览 2提问于2015-10-08得票数 5

2回答

、、

我正在处理一个CSV文件，它被加载到一个数据帧(python/pandas)中。原始数据帧是df_origen，每行都有一个名为value的度量值，该度量值以1小时为间隔。我需要按15分钟的周期将新数据帧中的每行“调整”为4行。data df_origen中可能会有跳变。我做到了。periods=96 * diff.days, freq='15Min'), columns=['from_tim

浏览 0提问于2016-11-29得票数 0

3回答

在排序的Pandas数据帧上高效地搜索范围

、、

我希望在Pandas dataframe的已排序列中的某个范围内搜索值，换句话说，即已排序的Series。有数百万行，所以性能很重要，我想使用二进制搜索来降低复杂性。第一个问题是Pandas.Series.searchsorted(value)，我不能断定这个值是否确实存在于序列中。我更喜欢像Pandas.Series.searchsorted(range)这样的东西来返回该范围内的值的第一个索引。有没有什么包可以帮上忙？我正在考虑编写自己的二进制搜索函数，但我不想破坏Pandas/numpy

浏览 1提问于2017-04-28得票数 1

1回答

Spark中的用户定义函数(UDF)是否在集群工作节点上并行运行？

、

假设我在python中创建了一个函数，所以将一个数字求幂为2： def squared(s):%sql select id, squaredWithPython(id

浏览 33提问于2019-10-10得票数 0

回答已采纳

1回答

从Python字典中的值获取键

、、

因此，在本例中，最大的得分值是0.986，我想打印CV值9。请帮帮忙。

浏览 16提问于2018-06-10得票数 0

回答已采纳

1回答

如何用Python在海运中绘制聚合数据？

、、、

我有一个跨越时间的测量数据，其中包含了副本。我正在尝试用海运绘制这个数据文件的聚合和汇总版本。数据如下： "t":([A, B]) "cond“是条件，”度量值“是不同的复制(每个条件2次)，"t”是时间维度。为了在</em

浏览 2提问于2015-12-15得票数 1

回答已采纳

2回答

如何使用pandas读取大型CSV文件中的几行内容？

、、

使用Pandas，我想读取散布在整个文件中的少量行。我想我可以在没有熊猫的情况下做到这一点，遵循这里的步骤：How to read specific lines of a large csv file 在pandas中，我尝试使用skiprows来只选择我需要的行FILESIZE) if row not in rows2keep) signal = pd.read_csv('train.csv', skiprows=rows2skip) 我希望这段代码能很快地返回一个小的数据<

浏览 21提问于2019-05-14得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云