从df_a中的特定行计算其在过去一年中在df_b中出现的次数

文章/答案/技术大牛

发布

1回答

python、pandas、dataframe

我有两个数据框架，如下所示，我想返回在特定日期之前一年(对于特定的人)有多少成功(是)，即to check中的每个条目定义history中的范围。例如，在to_check，迈克20200602中，我想知道在迈克的历史上(1年前，直到20200602)有多少成功(是)。 ? 通过使用"to_check“作为列表，我想出了一种笨拙的方

浏览 6提问于2021-04-23得票数 2

回答已采纳

4回答

在两个相同形状的数据之间查找更大的行。

python、pandas

我有两个形状相同的数据，并试图找到df中的所有行，其中每个值都大于df中的相应行。迷你示例：df_B = pd.DataFrame({'one':[1,8,12],'two':[10,5,3]}) 我只想返回0行。one t

浏览 0提问于2018-09-02得票数 0

回答已采纳

4回答

熊猫比较数据帧切片

python、loops、numpy、pandas

我正在处理熊猫中的两个数据帧(df_A有6500行，df_B有750万行)，已经到了无法避免重复遍历行的地步。7896 190基本上，我需要将df_A中的每个唯一投标人与df_B中的投标人进行比较，然后我需要找到投标人in匹配的</em

浏览 0提问于2015-05-29得票数 0

回答已采纳

1回答

根据一列中的值和另一列中的边界值将列添加到数据Fast的快速方法

python、pandas、dataframe、vectorization

我正试着做这样的事。我有一个df，df_A，它有一列“循环”，其单调递增的值。我还有另一个df，df_B，它有两个列，"cycle_bound“和"name”。我想要做的是在df_A中创建一个列，即“名称”，这样对于循环< cycle_bound (并且大于以前的cycle_bound)的所有值，<em

浏览 0提问于2022-04-15得票数 0

1回答

从另一个dataframe索引中根据日期和月份重新排列数据

python、pandas

我有两个数据：datetime var2016-10-16 111.0206612016-10-19 115.241448datetime var20002000-01-04 167.8160462000-10-15 114.232790

浏览 3提问于2017-12-04得票数 1

回答已采纳

2回答

评估df的每一行中的日期时间函数是否在另一个df的日期时间范围内。

python、pandas、datetime、for-loop、series

我是python的新手，我需要一些关于日期时间函数的问题的帮助。我有一个df_a，它有一个名为time的专栏，我正在尝试在这个df_a中创建一个新的列id。我希望id列的时间是否包含在“日期”和"date_new“之间的df_b列的时间范围内，例如，第一行

浏览 1提问于2019-04-01得票数 3

回答已采纳

2回答

用另一个df的间隔突变df中的中位数

r、dplyr、tidyverse

我正在寻找一种方法，以计算中值在一个df与间隔从另一个数据帧。示例：df_b <- tibble(lower_limit = c(1, 5, 11, 19),现在，我想在df_b中突变一个名为“中位数”的向量，

浏览 4提问于2021-09-14得票数 1

回答已采纳

1回答

熊猫在合并两个数据时创建一个标志

python-3.x、pandas、dataframe、merge

我有两个df - df_a和df_b，number cur2000 USDnumber和df_b合并，df_a.fillna(value={'amount

浏览 0提问于2018-06-14得票数 1

回答已采纳

2回答

Pandas数据帧的矢量化计算

python、pandas、numpy

我有一个小问题，我已经使用循环解决了这个问题，但我正在尝试看看是否有一种方法可以尝试向量化其中的一些，以尝试提高性能。实际上，我有两个数据帧(DF_A和DF_B)，其中DF_B中的行是基于DF_A中的相应行和上面DF_B中的行的总和，我确实有DF_B

浏览 3提问于2018-03-08得票数 1

1回答

您是否可以附加到数据框中，同时在附加的数据框中添加和填充字段？

python、pandas

您是否可以在将新字段填充到附加的数据帧(df_B)中的同时，将其附加到数据帧(例如，从df_A - to - df_B)？在某些情况下，我会将df_A行附加到df_B中，但我希望用一个字符串填充df_B中的一个字段，该字符串解释了为什么在附加时会发生附加。我

浏览 0提问于2020-03-20得票数 1

1回答

pandas 'DataFrame‘对象没有属性'map’

python、python-3.x、pandas、dictionary、dataframe

我有两个df - df_a和df_bnumber cur code2000 USD 800df_a = df_a.merge(df_b.loc[df_b.deletion != 'L'], how='left', on=['number', 'code']) 另外，

浏览 1提问于2018-08-08得票数 4

回答已采纳

1回答

用更快的方法对熊猫数据进行多次索引

python、pandas

对于df_a中的每一行，我都希望在df_b中找到标识符相同的行(和-- df_a行的位置属于df_b行的开始和结束位置)。df_a看起来像：| Name |

浏览 1提问于2020-04-23得票数 1

回答已采纳

1回答

基于匹配和概率的条件模拟

df_B的第2列和第3列。如果df_A的值为零，则df_B的值不会更改。例如，df_B的前两个值不应该在第一次迭代中更改，因为df_A的前两个值是零。如果df_A的值是1或负1，那么df_B的相应值将采用给定的特定概率(在本例中为20%)<

浏览 4提问于2017-03-07得票数 0

1回答

基于指数补码的Python大熊猫元素提取

python、numpy、pandas

我有一个数据框架，我从中选择了两个子集dfs，df_a和df_b。例如，在iris数据集中：df_b = iris[iris.Name == "Iris-virginica"] 获取iris中既不在df_a中也不在df_b中的所有元素的最佳方法

浏览 0提问于2013-02-20得票数 13

回答已采纳

2回答

如何从另一个数据中计数与密钥匹配的值？

python、pandas

我希望在一个数据文件中计数与另一个数据匹配的值。0 key1 32 key2 84 key3 10我想要计算df_b中有多少值与df_a中的每个键匹配。此外，我还想计算其中哪些部分超过5。1 1.0 我尝试在df

浏览 2提问于2021-11-25得票数 0

回答已采纳

2回答

在dataframe df_a中迭代行，并根据df_b中的df_a值更新数据帧df_b

python、dataframe、pyspark、apache-spark-sql、pyspark-dataframes

我有一个dataframe df_b，它必须基于dataframe df_a值进行更新。---+-----++-----+-----+| bat| 5|+-----+-----+如果‘header_oper’..isin(‘插入’，'update')在'head_seq'.Iterate df_a 上对df_a进

浏览 6提问于2020-08-07得票数 0

2回答

交织数据帧行的整洁函数方式

r、dplyr、functional-programming、purrr

我相信这是使用Bresenham的直线算法，它将较短的数据帧均匀地分散在较长的数据帧中。4:9, l = letters[4:9]),) reduce(l, interleave_rows) 我在一个闪亮的应用程序中使用它作为reduce的一部分，它有点慢。我也不认为这是一个非常整洁或功能性的</em

浏览 8提问于2020-07-31得票数 0

回答已采纳

5回答

是否有一种有效的方法来比较两个DataFrames或Series中每列的值？

python、pandas、dataframe、for-loop、series

我有两个DataFrames，我试图找到最好的方法来迭代df_a中的每一行，看看其中任何一个值是否与df_b中的相应行不同。如果一个值是不同的，我想考虑行是不同的。示例：df_a = pd.DataFrame({'ID':['E1', &#x

浏览 2提问于2020-06-12得票数 0

回答已采纳

1回答

什么是计算大熊猫数据中每行历史值最有效的方法？

pandas、dataframe、performance、loops

假设我有两只熊猫的资料(df_a & df_b)，每一行代表一个玩具和关于该玩具的特性。一些假装的特征：假设df_a相对较小(数千行中的10s)和df_b相对较大(>100万行)。然后，对于

浏览 8提问于2021-12-14得票数 1

回答已采纳

1回答

将列中最后一个非零之前的所有值替换为0。

python、pandas、numpy、dataframe

我有两个具有相同索引和形状的数据，例如A和B。我的目标是计算df_B中每一行的和，但如果对于df_A中最后一个非零值以下的任何行，这些相应的行将不被计算在df_B中的和中。这是一个示例，显示了我正在做的事情： df_A =

浏览 1提问于2020-11-13得票数 0

回答已采纳

点击加载更多