首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >熊猫数据过滤的通用函数

样本过滤条件:-

数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
x  y  z 
1  2  1
1  3  2
1  2  5
1  3  1

现在,我希望从给定的数据中筛选上述指定的条件。为此,我需要一个泛型函数,也就是说,该函数应该适用于任何过滤器,而不仅仅是上面指定的过滤器。

我知道如何为不止一个条件手动过滤python中的数据。

我认为泛型函数可能需要两个参数,一个是数据,另一个是过滤条件。

但是我无法找到编写泛型函数来过滤数据的逻辑。

好心的任何人都能帮我解决。

提前谢谢。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2018-10-03 01:37:25

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def filter_function(df,filter_df):
  lvl_=list()
  lvl=list()
  vlv=list()
  df1=pd.DataFrame()
  n=filter_df.apply(lambda x: x.tolist(), axis=1)
  for i in range(0,len(n)):
      for j in range(0,len(n[i])):
          if i==0:
             lvl_.append(n[i][j].split('==')[0])
          lvl.append(n[i][j].split('==')[1])
          if len(lvl)==len(n[i]):
             vlv.append(lvl)
             lvl=list()
  final_df=df[lvl_]
  for k in range(0,len(vlv)):
      df1=df1.append(final_df[final_df.isin(vlv[k])].dropna())
  return(df1)

filter_function(df,filter_df)
票数 1
EN

Stack Overflow用户

发布于 2018-10-02 02:55:09

您可以创建conditions的列表,然后创建np.logical_and.reduce

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
x1 = df.x==1
y2 = df.y==2 
z1 = df.z==1
y3 = df.y==3

m1 = np.logical_and.reduce([x1, y2, z1])
m2 = np.logical_and.reduce([x1, y3, z1])

concat所有掩码,并通过DataFrame.all检查每一行的所有Trues。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
m1 = pd.concat([x1, y2, z1], axis=1).all(axis=1)
m2 = pd.concat([x1, y3, z1], axis=1).all(axis=1)

编辑:

如果可能的话,用字典中筛选的值来定义列名:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d1 = {'x':1, 'y':2, 'z':1}
d2 = {'x':1, 'y':3, 'z':1}

m1 = np.logical_and.reduce([df[k] == v for k, v in d1.items()])
m2 = np.logical_and.reduce([df[k] == v for k, v in d2.items()])

另一种使用merge从字典中创建的一行DataFrame方法:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df1 = pd.DataFrame([d1]).merge(df)

编辑:

对于通用解决方案,可以将文件的每个值解析为元组并使用operators

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
df1 = pd.DataFrame({0: ['x==1', 'x==1'], 1: ['y==2', 'y<=3'], 2: ['z!=1', 'z>1']})
print (df1)
      0     1     2
0  x==1  y==2  z!=1
1  x==1  y<=3   z>1


import operator, re

ops = {'>': operator.gt,
        '<': operator.lt,
       '>=': operator.ge,
       '<=': operator.le,
       '==': operator.eq,
        '!=': operator.ne}

#if numeric, parse to float, else not touch ()e.g. if string
def try_num(x):
    try:
        return float(x)
    except ValueError:
        return x

L = df1.to_dict('r')
#https://stackoverflow.com/q/52620865/2901002
rgx = re.compile(r'([<>=!]+)')
parsed = [[rgx.split(v) for v in d.values()] for d in L]
L = [[(x, op, try_num(y)) for x,op,y in ps] for ps in parsed]
print (L)
[[('x', '==', 1.0), ('y', '==', 2.0), ('z', '!=', 1.0)], 
 [('x', '==', 1.0), ('y', '<=', 3.0), ('z', '>', 1.0)]]

现在,通过列表的第一个值进行筛选--第一行文件:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
m = np.logical_and.reduce([ops[j](df[i], k) for i, j, k in L[0]])
print (m)
[False False  True False]
票数 2
EN

Stack Overflow用户

发布于 2018-10-02 04:53:42

由于只有一个数字dtype,所以可以使用基础NumPy数组:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
res = df[(df.values == [1, 2, 1]).all(1)]

print(res)

   x  y  z
0  1  2  1

对于具有list输入的泛型函数:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def filter_df(df, L):
    return df[(df.values == L).all(1)]

res = filter_df(df, [1, 2, 1])

如果您需要字典输入:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def filter_df(df, d):
    L = list(map(d.get, df))
    return df[(df.values == L).all(1)]

res = filter_df(df, {'x': 1, 'y': 2, 'z': 1})
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/52606908

复制
相关文章
Python 基于Python实现Ftp文件上传,下载
支持FTP文件上传、下载,可以上传目录(分区除外),也可以上传单个文件;可以下载整个目录(/根目录除外),也可以下载单个文件
授客
2019/09/11
5.4K0
Python 基于Python实现Ftp文件上传,下载
spring整合s3实现文件上传下载
pom依赖 <!-- https://mvnrepository.com/artifact/com.amazonaws/aws-java-sdk-s3 --> <dependency> <groupId>com.amazonaws</groupId> <artifactId>aws-java-sdk-s3</artifactId> <version>1.11.803</version> </
高大北
2022/10/31
1.9K0
JavaScript 下载文件并保持原文件名称
注:此代码只是个人根据当时的环境满足了当时的需求,记录下来用做后续参考!如有问题,请检查软硬件环境是否一致,由于时间精力有限,大部分未做详细环境描述。
全栈程序员站长
2022/09/06
7700
python日期和时间
python中常用的处理时间的模块有两个:time 模块、datetime 模块,time模块是比较基础的一个模块,可满足对时间类型数据的基本处理;而 datetime模块可以看做是 对time模块的一个高级封装,功能更加强大,例如在时间的加减上(获取指定时间的前(后)一天的时间,获取指定时间的前(后)一小时的时间),使用datetime模块,实现起来更为方便~
py3study
2020/01/03
2.3K0
python日期和时间
python文件下载
百度云源代码和几k,mm图片分享 下载简书交友的图片.网站 https://www.jianshu.com/c/bd38bd199ec6 import urllib.request import urllib.parse import re import os import random def get_road(url0): req=urllib.request.Request(url0) req.add_header('User-Agent', 'Mozilla/5.0 (Window
热心的社会主义接班人
2018/05/16
1.5K0
Python 日期和时间
Python 提供了一个 time 和 calendar 模块可以用于格式化日期和时间。
Python知识大全
2020/02/13
2K0
Spring Cloud gateway 文件下载 文件名称 乱码解决方案
=============================================
爱明依
2019/04/25
3.3K0
Spring Cloud  gateway  文件下载 文件名称 乱码解决方案
python+django 如何上传文件和下载文件
Models 中新建了一个模型,并且设置 path 为 FileFiled 格式的 这样就可设置为文件属性了,在django-web上上传文件时,path为文件的路径,相信这点官网已经写的非常详细了 下面记录下如何指定文件的存储路径、文件访问路径、文件下载
onety码生
2018/11/21
3.8K0
【android系统】使用s3来上传下载文件
我们的安卓容器需要使用 s3 来进行一些文件的上传和下载,因为 s3cmd 是 Python 写的,所以想运行 s3cmd,估计是不行的,如果需要使用静态编译的 s3 客户端程序,随手在 github 上搜了一个 s3-cli,这个项目是用 Go 写的,所以只要在本地编译的时候加上 static 就可以了。
runzhliu
2020/08/05
1.3K0
python实现文件下载
Python实现文件下载 # -*- coding:utf-8 -*- import struct from socket import * import time import os def main(): #0. 获取要下载的文件名字: downloadFileName = input("请输入要下载的文件名:") #1.创建socket udpSocket = socket(AF_INET, SOCK_DGRAM) requestFileData = struct.pack("!
AI拉呱
2021/01/14
9180
文件上传和下载
进行javaWeb项目的开发,文件上传和下载还是被比较普遍的使用到一种技术,之前都是使用专用的文件服务器进行文件的存储,今天要介绍的是基于mongodb数据库进行文件的存储。
码农王同学
2020/03/25
1.1K0
文件上传和下载
文件上传和下载是JAVA WEB中常见的一种操作,文件上传主要是将文件通过IO流传输到服务器的某一个特定的文件夹下;刚开始工作那会一个上传文件常常花费小半天的时间。自从有了springboot之后,简单到小学生都会的操作。废话不说,直接开始。
用户3467126
2019/07/03
1.1K0
文件上传和下载
​ encType=multipart/form-data 表示提交的数据,以多段(每一个表单项一个数据段)的形式进行拼 接,然后以二进制流的形式发送给服务器。
上分如喝水
2021/08/16
1.2K0
文件上传和下载
Python获取当前日期和日期差计算
关于python的日期和时间,用法很多,此处只记录自己比较常用的部分,后面有时间再学习一下时间戳。
py3study
2020/01/19
10.9K0
python-将文件按日期分类
小米云盘只有5G,不经意间存了一些乱七八糟的东西,我希望将他们全部下载后然后清空小米云盘,这样小米云就不会偷偷地把一些我已经删掉的资料再同步给我的手机。 导致删不敢删,留着也烦人。我不希望那些公司玩弄我的资料。 下载后的文件自动按照时间分类创建一系列的文件夹分别存入下载的内容。 数千个文件按时间以及格式归类创建文件夹
全栈程序员站长
2021/05/19
1.7K0
文件上传和下载
文件上传要求form表单的请求方式必须为post,并且添加属性enctype="multipart/form-data"
用户9615083
2022/12/25
1.1K0
文件上传和下载
使用python上传和下载文件到Fast
3. 新建测试文件test_fdfs.py,把下载解压后安装包的.../FastDFS/conf/client.conf文件复制到/etc/fdfs下:
py3study
2020/01/09
1.3K0
linux和windows文件名称长度限制
windows下全然限定文件名称必须少于260个字符,文件夹名必须小于248个字符。
全栈程序员站长
2021/11/18
6.8K0
图解python | 时间和日期处理
教程地址:http://www.showmeai.tech/tutorials/56
ShowMeAI
2022/02/23
1.3K0
图解python | 时间和日期处理
python 获取n天前的日期和日期列表
import datetime def get_nday_list(n): import datetime before_n_days = [] for i in range(1, n + 1)[::-1]: before_n_days.append(str(datetime.date.today() - datetime.timedelta(days=i))) return before_n_days
用户5760343
2022/05/13
3.2K0

相似问题

精细Uploader并发忠王S3

12

拒绝精细的Uploader访问

10

精细Uploader -通过HTTPS错误上传到S3

11

精细Uploader PHP端点-指定上传文件夹?

16

精细-Uploader FTP上传

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文