腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4530)
视频
沙龙
4
回答
Pandas
:
按
组
过滤
数据
帧
,
条件
匹配
组
中
至少
一项
python
、
pandas
我有
数据
帧
ID url session111 vk.com 1222 wsj.com222 wsj.com 3333 wikipedia.org 5 333 rt.com 5 我知道我可以用df.url.str.contains
过滤
,但是我怎么用session添加
条件
呢
浏览 63
提问于2016-11-26
得票数 2
回答已采纳
1
回答
熊猫
按
每个
组
的唯一出现次数进行聚合
pandas
在
pandas
中
,如果
条件
值出现一次,我会分析
组
。我已经在下面的第一步
中
包含了一个样例
数据
帧
,试图识别这样的
组
。因此,假设在下面的
数据
框
中
,我希望
过滤
原始
数据
框中曾经具有大于6的花冠长度的虹膜物种。在最后一个命令
中
,我正在计算具有大于6的花冠长度的独特物种
组
的数量(因此,
至少
我可以计算它们)。但是,我真正想要的是原始
数据
浏览 0
提问于2020-10-10
得票数 0
2
回答
使用
pandas
数据
帧
分组后值序列的
条件
python
、
pandas
我搜索了google和stackoverflow,以便根据每组
条件
和顺序找到正确的
过滤
方法。找不到!我在
pandas
中有一个跟踪
数据
集,我想
过滤
那些发起注册并成功登录的用户。14 06:10:40.004 2 signupsuccess 2019-07-14 06:10:45.004 我只想让user 2出现在我的最终
数据
帧
中
我写了下面的代码,它没有考虑到user_id
组
。sig
浏览 45
提问于2019-08-06
得票数 0
1
回答
比较两种
数据
格式,在
Pandas
/Pyspark中分配标签和拆分行
python
、
pandas
、
numpy
、
pyspark
、
apache-spark-sql
我有两个
数据
文件,包括expected_orders和actual_orders详细信息。输入
数据
:我希望在dataframe
中
创建一个label字段,并根据以下
条件
拆分行:
按
国家、产品和日期
组
在两个
数据
帧
中
按
国家和产品进行排序,对于每个
组
,如果行的日期和qty是
匹配
的,那么指定标签相同的实际日期/相同的预期日期如果qty
匹配
但日期不同,则
浏览 3
提问于2022-11-29
得票数 1
1
回答
基于不同滤波器的特定广告
匹配
php
、
elasticsearch
、
redis
、
logic
、
weblogic
我的网站上有很多
过滤
器,例如,你可以
按
价格、类别、城市、
条件
…
过滤
广告。我将这些
过滤
器保存在我的
数据
库
中
,用于该用户的,假设我的站点有大约100 K的active 这是基本版本。
过滤
器: pricecondition country,县,市min,max (新老…)带/
浏览 0
提问于2020-09-28
得票数 0
1
回答
Pandas
过滤
器,分组,然后转换
python-3.x
、
pandas
、
pandas-groupby
我有一个
pandas
数据
帧
,如下所示: df = a1. 1 a10 a2 1 a
浏览 12
提问于2020-07-13
得票数 1
回答已采纳
2
回答
与小组比较值-熊猫
python
、
pandas
、
group-by
、
filtering
首先,我有一个有以下列的
数据
框架:多个行可以包含相同的group。= date_current.issue_date.amaxdate_before = date_current.values - pd.Timedelta(weeks=4*n)hh = history[history[
浏览 1
提问于2017-05-23
得票数 2
回答已采纳
1
回答
dask read_parquet方法的
过滤
给出了不需要的结果
python
、
dataframe
、
filtering
、
dask
、
fastparquet
然而,有时它不会根据给定的
条件
进行
过滤
。示例:使用dates列创建和保存
数据
框架import numpy as npdf = pd.DataFrame({'dates':dates, 'nums': nums}) ddf = dd.from_<e
浏览 0
提问于2018-07-09
得票数 8
回答已采纳
1
回答
PySpark
数据
帧
Pandas
UDF返回空
数据
帧
pandas
、
dataframe
、
apache-spark
、
pyspark
我正在尝试按照groupby('Key').apply(UDF)方法将
pandas
_udf应用于我的PySpark
数据
帧
以进行一些
过滤
。为了使用
pandas
_udf,我定义了一个输出schema,并在列Number上有一个
条件
。作为一个例子,这里的简化思想是我只希望返回具有奇数Number的行的ID。这就带来了一个问题,有时在一个
组
中
没有奇怪的Number,因此UDF只返回一个空的
数据
帧
,这与为N
浏览 2
提问于2020-05-18
得票数 3
1
回答
在熊猫
中
丢弃空时间
组
python
、
pandas
我使用
组
按
组
将
数据
帧
分组为不同的日期,然后根据使用concat的日期将它们分成训练
组
和测试
组
。pd.concat([ gp.get_group(group) for i,group in enumerate( gp.groups) if i == len(gp)-1 ]) 回溯(最近一次调用):文件“,第1行,文件”,第1行,文件"C:\Progra
浏览 2
提问于2017-08-11
得票数 1
回答已采纳
1
回答
Scala
中
的Spark分组贴图UDF
scala
、
dataframe
、
apache-spark
我正在尝试编写一些代码,使我能够在
数据
帧
的一
组
行上计算一些操作。在PySpark
中
,这可以通过定义类型为GROUPED_MAP的
Pandas
UDF来实现。然而,在Scala
中
,我只找到了一种创建自定义聚合器(UDAF)或传统UDF的方法。 我的临时解决方案是生成一个关键字列表,该列表将对我的
组
进行编码,这将允许我
过滤
数据
帧
并对
数据
帧
的每个子集执行操作。执行的操作是
按</e
浏览 2
提问于2020-04-08
得票数 2
3
回答
根据特定列的值对3列
数据
帧
进行分组,以创建字典列表
python
、
pandas
、
dataframe
、
pandas-groupby
我是Python
Pandas
的新手,有一个关于使用
Pandas
、Dataframe、groupby和filters的问题。以下是我的示例
数据
帧
: data = { 'B': ['B1', 'B2', 'B3
浏览 11
提问于2020-12-07
得票数 2
3
回答
筛选出没有满足
条件
的行数足够的
组
。
python
、
pandas
bar某些值的
数据
。对于上面的例子:
组
bar = 001不会被
过滤
掉,因为对于bar = 001,
至少
有foo小于threshold = 0的n_below = 2条目和foo大于threshold = 0的n_above
组
bar = 002将被
过滤
掉,因为对于bar = 002,
至少
没有foo大于threshold = 0的n_above = 2条目。
组
bar = 003将被
过滤
掉,因为对于bar = 003,
至少</
浏览 4
提问于2017-02-15
得票数 4
回答已采纳
3
回答
Pandas
:在
组
中将值向下移动一行
python
、
pandas
、
dataframe
我有一个
Pandas
数据
帧
,我想创建一个新列,它的值是另一列的值,向下移位一行。最后一行应该显示NaN。我尝试的实现相当可耻地崩溃了,所以我显然误解了一些基本的东西。
浏览 1
提问于2014-10-09
得票数 44
回答已采纳
4
回答
在
pandas
中
过滤
GroupBy之后的
组
,同时保留这些
组
python
、
pandas
、
pandas-groupby
在
pandas
中
,我想要做的是:df.groupby('A').filter(lambda x: x.name > 0) - group by列A,然后
过滤
名称为non positive的
组
。我想
按
这个顺序来做,因为它应该对计算要求较低,因为filter后面跟着groupby会遍历DataFrame两次,不是吗(首先
过滤
,然后分组)?此外,克隆分组
中
的
组
(到字典或其他东西)将失去无缝返回到
数据
帧</e
浏览 3
提问于2018-04-14
得票数 12
1
回答
Pyspark / Spark:删除不包含特定值的
组
apache-spark
、
pyspark
、
group-by
我想
按
<code>D0</code>列对
数据
帧
进行分组。我怎样才能只保留那些
至少
包含一个<code>D1</code> 'X‘的
组
呢?<code>A2</code>有什么想法吗
浏览 12
提问于2020-03-25
得票数 0
1
回答
你能根据一个和或计数或多个变量来
过滤
一个熊猫
数据
框吗?
python
、
pandas
我试图根据一
组
or
条件
过滤
Pandas
数据
帧
,但它们都非常相似,我想知道是否有更有效的方法来编写它。具体地说,我希望包括来自dataframe (df)的行,其中一
组
变量
中
的任何一个都是1:df.query(&qu
浏览 0
提问于2020-09-16
得票数 0
2
回答
按
组
和
条件
对
Pandas
数据
帧
进行排序
pandas
、
pandas-groupby
我试图根据
组
满足
条件
对
数据
框架进行排序。这是我试图实现的排序顺序:-Test==0
组
,仅对最后一列进行排序。import
pandas
as pd df=pd.DataFrame({"First":[100,100,100,1
浏览 1
提问于2019-02-03
得票数 3
回答已采纳
1
回答
如何将扩展窗口应用于groupby结果的名称?
pandas
、
pandas-groupby
我想使用
pandas
将
数据
帧
按
一列分组,然后对这些
组
运行扩展窗口计算。想象一下下面的
数据
帧
: G ValA 1B 3C 5 C 7 我正在寻找的是一种
按
列G对
数据
进行分组的方法(结果是
组
['A', 'B', 'C']),然后将函数首先应用到
组
A
中
的项,然后应用到
组
浏览 14
提问于2021-11-15
得票数 0
回答已采纳
1
回答
在联接表中选择需要满足每个链接的多组
条件
的项。
php
、
mysql
、
sql
、
jointable
我正在寻找一种使SQL查询选择一个独立的condition_value_ids Item_Id的方法,在该查询
中
,所有
条件
都被链接到每个
组
中
的
至少
一个。9 3 22 将返回ID 1和3的ItemS (因为条目1/3在每个
条件
组
中
至少
匹配
了一个condition_value_id链接,
浏览 3
提问于2014-02-14
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Pandas与SQL的数据操作语句对照
pandas系列学习(五):数据连接
Python数据分析之pandas(六)
使用机器学习预测2018年世界杯足球赛
12种高效Numpy&Pandas使用技巧!
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券