如何在Pandas DataFrame中累积每n条记录？

文章/答案/技术大牛

发布

1回答

、

我有一个熊猫DataFrame，其中包含每15分钟在一个站点收集的降雨量。要将此转换为小时总数，我希望能够找到每4行的总和。下面的代码是我尝试过的代码： e = c['Rainfall'].groupby(c.index//4).cumsum() DataFrame C保存降雨量收集数据的位置。

浏览 12提问于2019-12-19得票数 0

回答已采纳

3回答

我如何加快我的代码，而不是使用for循环？

、、

这里有两个数据集"Y_N“和"data”。"Y_N“有8000条记录，在”数据“中有160万条记录。在两个数据集中，每个记录都以字符串的形式出现。因此，我的任务是将"Y_N“的每一条记录与”数据“的每一条记录相匹配，并为每一种组合计算相似指数。我通过使用for循环来完成这个任务，但是它需要更多的时间(可能

浏览 12提问于2022-02-22得票数 2

2回答

比较两列后，Pandas计数器递增

、、

我想在pandas中创建一个简单的计数器，每完成一个循环就递增一次。这应该很简单，但我搞不懂...这是我想要做的，用一个说明性的熊猫DataFrame：如果有人向我展示如何使用自定义函数在pandas.apply中做到这一点，我会很高兴的本质上，我循环遍历DataFrame中的每一条记录/行，并比较两列。我知道我可能可以

浏览 19提问于2018-12-16得票数 3

回答已采纳

1回答

亚马逊精品食品:将文本文件转换为pandas DataFrame

、

我有一个这种格式的文本文件中的数据。我想把它当做pandas dataframe来读。

浏览 0提问于2018-03-02得票数 0

1回答

如果在python中进行搜索，那么获取结果就更快了。一张垃圾清单还是一张熊猫的数据？

、、、、

如果我想搜索“符号”(如1000150)并返回"val“(例如。0.15)哪种方法更快：或我打算同时测试两种方法，但我想知道是否有公认的pythonic方法，或者在某些条件下，一种方法比另一种方法要快得多(例如，我有一种感觉，在更长的时间列表中，DataFrame会因为它的类型而更快

浏览 5提问于2021-02-15得票数 3

回答已采纳

1回答

将字符串解析为Dataframe

、、

///n103///t1002///t2///t0.119///t2342342342///tHello there!///n1044///t1003///t2///t0.119///t2342342342//&#

浏览 0提问于2019-10-21得票数 0

2回答

采样Pandas Dataframe的最快方法？

、、、

首先，我想从三个数据帧(每个数据帧150行)中随机抽样，并将结果连接起来。其次，我想尽可能多地重复这个过程。对于第1部分，我使用以下函数： def get_sample(n_A, n_B, n_C): B = df_B.sample(n = n_B, replace=False) C = df_C.sample(n = n<

浏览 5提问于2018-12-28得票数 4

回答已采纳

2回答

Pandas顺序计数多个索引中唯一对的出现次数

、、、、

我已经完成了一个数据记录练习，有一个两列的多索引: dataframe。每天，每个人记录他们做过的运动(如果他们锻炼的话)。我想添加另一列，按顺序对该日志中的条目进行计数，如下所示。因此，对于每一对独特的日子和人，数到1。import pandas as pd 'Person':['Joe'

浏览 4提问于2020-09-19得票数 2

回答已采纳

1回答

Python(MySQL连接器)：获取实时数据并更新变量

、

我有一个包含超过2000万条记录的MySQL DB，现在我正在开发一个带有dash和plotly的仪表板。我想不断地将数据更新到dash服务器，以及如何在我的数据库中输入新数据。我读了很多文章，但都没能解决我不断用新数据更新记录的问题。我正在使用dataframe的read_sql函数从DB读取记录到pandas dataframe。

浏览 28提问于2020-08-20得票数 1

1回答

Python Pandas:在每个元素中使用pd.Series填充数据帧

、、

对于n个时间序列，每个序列的T值需要存储在长度为T的pandas序列的pandas Dataframe中，如下所示： DataFrame： index | Data 0 | pd.Seriesn-1 | pd.Series 我试图通过读取另一个数据帧来填充循环中n=2和T=3的空数据帧，但没有成功。下面是我的简化版本，在每一行中使用一个常量pd.Series： import pandas as p

浏览 14提问于2020-06-17得票数 1

回答已采纳

1回答

为熊猫的数据分配非唯一的ID

、、

我有一个数据文件df { "name": [ "for stackoverflow", ],) 我想添加一个列my_id，它为每三个记录分配从1开始

浏览 0提问于2020-12-16得票数 1

回答已采纳

4回答

Pandas直方图df.hist()分组依据

、、

如何使用group by绘制带有pandas DataFrame.hist()的直方图？我有一个包含5列的数据框："A“、"B”、"C“、"D”和"Group“使用：我得到了4列中每一列的历史记录。我尝试了一下，但没有成功： df.h

浏览 0提问于2017-08-25得票数 18

回答已采纳

1回答

熊猫以往记录的时间序列累加与当前行的一列匹配

、、、、

我试图添加一个列，该列表示与给定列的行当前值匹配的先前记录的累积和，让我们以一个例子为例。|2 |7 ||2020-01-09|C |5 |7 | cumsum列将被概括为“对标签与当前行相同的所有过去记录的累积和df.loc[(df['label']==current label) & (df['t'] <= current index)].cumsum()，它不会显式地循环for

浏览 3提问于2021-05-06得票数 0

回答已采纳

2回答

按字母顺序对查询单词进行排序，并从单个行中删除重复单词

、

我想从Pandas DataFrame的每一行中对给定查询的单词进行排序，然后从它们中删除重复的单词。如何在每一行上分别执行此任务，如:给定DataFrame：-------------2.resident evilSr.No | Query1. gears of

浏览 4提问于2016-08-03得票数 1

回答已采纳

3回答

如何获得由第二个变量(Python)组成的单词频率计数

、

使用Pandas，我能够为我的数据描述字段中的每一条记录找到最频繁的N个单词。但是，我有两个列:一个分类列和description字段。如何找到每个类别中最常见的单词？现行相关代码keywords=pandas.DataFrame(Counter

浏览 6提问于2020-06-06得票数 2

回答已采纳

2回答

Pandas -根据列值有条件地选择列名

、

如何在python中根据DataFrame的列值选择列名？非常感谢，foo.set_index('a') a x

浏览 4提问于2018-11-14得票数 1

4回答

按组规范DataFrame

、

假设我已经生成了如下数据：m = 3然后我创建了一些分类变量：并生成一个DataFrame：df = pd.DataFramedata, indx[:,None])

浏览 6提问于2014-09-25得票数 37

回答已采纳

2回答

熊猫:如何在一列中检查重复值，并从另一列创建值的成对列表

、、

116 300 610 200 4(5,3)，(5,4)，(3,4)，(6,9) 元组中数字的顺序并不重要，即(5,3)和

浏览 0提问于2015-03-13得票数 1

回答已采纳

2回答

熊猫累积值滞后的条件产品？

、、

我试图得到一个根据另一个变量的乘积和和的滞后值变化的累积和(听起来有点像数学上的胡言乱语，我知道。)请容忍我)import pandas as pddf['n'3 1.000000 1000000现在，我们需要迭代地将xx乘以n的滞后值，然后取该值的累积和： c

浏览 6提问于2014-09-06得票数 3

回答已采纳

1回答

将DataFrame列相互作图

、、、

如何在忽略索引的情况下绘制DataFrame列？例如： x y1 1 103 3 20我试过：import pandas as pddf1.plot(df1['x'],df1['y']) 第一种情况产生两幅图，一条对应于纵坐标中的每</e

浏览 4提问于2016-05-31得票数 0

回答已采纳

点击加载更多