Pandas:按组过滤数据帧，条件匹配组中至少一项_从数据帧中删除基于条件的组- pandas groupby_如何按日期将列中的值汇总到与pandas中的给定条件匹配的组中？ - 腾讯云开发者社区

python、pandas

我有数据帧 ID url session111 vk.com 1222 wsj.com222 wsj.com 3333 wikipedia.org 5 333 rt.com 5 我知道我可以用df.url.str.contains过滤，但是我怎么用session添加条件呢

浏览 63提问于2016-11-26得票数 2

回答已采纳

1回答

熊猫按每个组的唯一出现次数进行聚合

pandas

在pandas中，如果条件值出现一次，我会分析组。我已经在下面的第一步中包含了一个样例数据帧，试图识别这样的组。因此，假设在下面的数据框中，我希望过滤原始数据框中曾经具有大于6的花冠长度的虹膜物种。在最后一个命令中，我正在计算具有大于6的花冠长度的独特物种组的数量(因此，至少我可以计算它们)。但是，我真正想要的是原始数据

浏览 0提问于2020-10-10得票数 0

2回答

使用pandas数据帧分组后值序列的条件

python、pandas

我搜索了google和stackoverflow，以便根据每组条件和顺序找到正确的过滤方法。找不到！我在pandas中有一个跟踪数据集，我想过滤那些发起注册并成功登录的用户。14 06:10:40.004 2 signupsuccess 2019-07-14 06:10:45.004 我只想让user 2出现在我的最终数据帧中我写了下面的代码，它没有考虑到user_id组。sig

浏览 45提问于2019-08-06得票数 0

1回答

比较两种数据格式，在Pandas/Pyspark中分配标签和拆分行

python、pandas、numpy、pyspark、apache-spark-sql

我有两个数据文件，包括expected_orders和actual_orders详细信息。输入数据：我希望在dataframe中创建一个label字段，并根据以下条件拆分行：按国家、产品和日期组在两个数据帧中按国家和产品进行排序，对于每个组，如果行的日期和qty是匹配的，那么指定标签相同的实际日期/相同的预期日期如果qty匹配但日期不同，则

浏览 3提问于2022-11-29得票数 1

1回答

基于不同滤波器的特定广告匹配

php、elasticsearch、redis、logic、weblogic

我的网站上有很多过滤器，例如，你可以按价格、类别、城市、条件…过滤广告。我将这些过滤器保存在我的数据库中，用于该用户的，假设我的站点有大约100 K的active 这是基本版本。过滤器： pricecondition country，县，市min，max (新老…)带/

浏览 0提问于2020-09-28得票数 0

1回答

Pandas过滤器，分组，然后转换

python-3.x、pandas、pandas-groupby

我有一个pandas数据帧，如下所示： df = a1. 1 a10 a2 1 a

浏览 12提问于2020-07-13得票数 1

回答已采纳

2回答

与小组比较值-熊猫

python、pandas、group-by、filtering

首先，我有一个有以下列的数据框架：多个行可以包含相同的group。= date_current.issue_date.amaxdate_before = date_current.values - pd.Timedelta(weeks=4*n)hh = history[history[

浏览 1提问于2017-05-23得票数 2

回答已采纳

1回答

dask read_parquet方法的过滤给出了不需要的结果

python、dataframe、filtering、dask、fastparquet

然而，有时它不会根据给定的条件进行过滤。示例:使用dates列创建和保存数据框架import numpy as npdf = pd.DataFrame({'dates':dates, 'nums': nums}) ddf = dd.from_<e

浏览 0提问于2018-07-09得票数 8

回答已采纳

1回答

我正在尝试按照groupby('Key').apply(UDF)方法将pandas_udf应用于我的PySpark数据帧以进行一些过滤。为了使用pandas_udf，我定义了一个输出schema，并在列Number上有一个条件。作为一个例子，这里的简化思想是我只希望返回具有奇数Number的行的ID。这就带来了一个问题，有时在一个组中没有奇怪的Number，因此UDF只返回一个空的数据帧，这与为N

浏览 2提问于2020-05-18得票数 3

1回答

在熊猫中丢弃空时间组

python、pandas

我使用组按组将数据帧分组为不同的日期，然后根据使用concat的日期将它们分成训练组和测试组。pd.concat([ gp.get_group(group) for i,group in enumerate( gp.groups) if i == len(gp)-1 ]) 回溯(最近一次调用)：文件“，第1行，文件”，第1行，文件"C:\Progra

浏览 2提问于2017-08-11得票数 1

回答已采纳

1回答

Scala中的Spark分组贴图UDF

scala、dataframe、apache-spark

我正在尝试编写一些代码，使我能够在数据帧的一组行上计算一些操作。在PySpark中，这可以通过定义类型为GROUPED_MAP的Pandas UDF来实现。然而，在Scala中，我只找到了一种创建自定义聚合器(UDAF)或传统UDF的方法。我的临时解决方案是生成一个关键字列表，该列表将对我的组进行编码，这将允许我过滤数据帧并对数据帧的每个子集执行操作。执行的操作是按</e

浏览 2提问于2020-04-08得票数 2

3回答

根据特定列的值对3列数据帧进行分组，以创建字典列表

python、pandas、dataframe、pandas-groupby

我是Python Pandas的新手，有一个关于使用Pandas、Dataframe、groupby和filters的问题。以下是我的示例数据帧： data = { 'B': ['B1', 'B2', 'B3

浏览 11提问于2020-12-07得票数 2

3回答

筛选出没有满足条件的行数足够的组。

python、pandas

bar某些值的数据。对于上面的例子：组bar = 001不会被过滤掉，因为对于bar = 001，至少有foo小于threshold = 0的n_below = 2条目和foo大于threshold = 0的n_above组bar = 002将被过滤掉，因为对于bar = 002，至少没有foo大于threshold = 0的n_above = 2条目。组bar = 003将被过滤掉，因为对于bar = 003，至少</

浏览 4提问于2017-02-15得票数 4

回答已采纳

3回答

Pandas:在组中将值向下移动一行

python、pandas、dataframe

我有一个Pandas数据帧，我想创建一个新列，它的值是另一列的值，向下移位一行。最后一行应该显示NaN。我尝试的实现相当可耻地崩溃了，所以我显然误解了一些基本的东西。

浏览 1提问于2014-10-09得票数 44

回答已采纳

4回答

在pandas中过滤GroupBy之后的组，同时保留这些组

python、pandas、pandas-groupby

在pandas中，我想要做的是：df.groupby('A').filter(lambda x: x.name > 0) - group by列A，然后过滤名称为non positive的组。我想按这个顺序来做，因为它应该对计算要求较低，因为filter后面跟着groupby会遍历DataFrame两次，不是吗(首先过滤，然后分组)？此外，克隆分组中的组(到字典或其他东西)将失去无缝返回到数据帧</e

浏览 3提问于2018-04-14得票数 12

1回答

Pyspark / Spark:删除不包含特定值的组

apache-spark、pyspark、group-by

我想按<code>D0</code>列对数据帧进行分组。我怎样才能只保留那些至少包含一个<code>D1</code> 'X‘的组呢？<code>A2</code>有什么想法吗

浏览 12提问于2020-03-25得票数 0

1回答

你能根据一个和或计数或多个变量来过滤一个熊猫数据框吗？

python、pandas

我试图根据一组or条件过滤Pandas数据帧，但它们都非常相似，我想知道是否有更有效的方法来编写它。具体地说，我希望包括来自dataframe (df)的行，其中一组变量中的任何一个都是1：df.query(&qu

浏览 0提问于2020-09-16得票数 0

2回答

按组和条件对Pandas数据帧进行排序

pandas、pandas-groupby

我试图根据组满足条件对数据框架进行排序。这是我试图实现的排序顺序：-Test==0组，仅对最后一列进行排序。import pandas as pd df=pd.DataFrame({"First":[100,100,100,1

浏览 1提问于2019-02-03得票数 3

回答已采纳

1回答

如何将扩展窗口应用于groupby结果的名称？

pandas、pandas-groupby

我想使用pandas将数据帧按一列分组，然后对这些组运行扩展窗口计算。想象一下下面的数据帧： G ValA 1B 3C 5 C 7 我正在寻找的是一种按列G对数据进行分组的方法(结果是组['A', 'B', 'C'])，然后将函数首先应用到组A中的项，然后应用到组

浏览 14提问于2021-11-15得票数 0

回答已采纳

1回答

在联接表中选择需要满足每个链接的多组条件的项。

php、mysql、sql、jointable

我正在寻找一种使SQL查询选择一个独立的condition_value_ids Item_Id的方法，在该查询中，所有条件都被链接到每个组中的至少一个。9 3 22 将返回ID 1和3的ItemS (因为条目1/3在每个条件组中至少匹配了一个condition_value_id链接，

浏览 3提问于2014-02-14得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云