如何使用多个布尔掩码并行地从pandas DataFrame列中选择多个子集？_如何从pandas数据框中的多个datetime列中有条件地选择第一个非空日期？ - 腾讯云开发者社区

python、arrays、pandas、numpy、parallel-processing

假设我们有一个包含两列(colA和colB)和三行的DataFrame df_example，如以下代码所示： df_example = pd.DataFrame({'colA': [10, 20,50, 60]})0 10 402 30 60 我需要根据布尔掩码从colA中检索多个子

浏览 14提问于2021-10-11得票数 0

回答已采纳

2回答

定位多列中不存在的所有数字

python、pandas、csv

我很难从csv文件中的列中找到多个值。到目前为止，我已经尝试将要从中提取值的列定义为，这应该取csv文件中未命名为'A‘、'B’的'C‘的每一列。= 20)] 但是我遇到了错误消息：#如果我们有一个类似列表的密钥，_check_indexing_erro

浏览 3提问于2022-12-01得票数 0

回答已采纳

1回答

要切片DataFrame的布尔列表

python、pandas、boolean

我正在试图找到一种更少的手动，更方便的方式来分割基于多个布尔条件的Pandas DataFrame。,True,True,False,False]})df[(df['col1']==True) & (df['col2']==True)] 在这样一个小维度的例子中，这是可以管理的，但是真正的例子

浏览 3提问于2020-11-03得票数 1

1回答

基于Dict生成器的熊猫多极布尔索引/选择

python、pandas

让我们想象一下，您有一个包含大量列(比如50 )的DataFrame df，并且df没有任何索引(即index_col=None)。您希望选择由required_columns_list定义的列的子集，但只希望返回符合各种布尔索引定义的多个条件的行。是否有一种方法可以使用dict生成器自愿地生成选择语句？dict生成器来选择out来构造多个布尔索引： df.loc

浏览 3提问于2013-10-15得票数 0

回答已采纳

1回答

在两列的范围内查找样本

python、pandas、numpy

我是python编程的新手。我找不到任何方法来编写这部分代码。如果有人能帮助我，我将不胜感激。我有一个具有3个属性(4000条记录)的数据帧。属性x1、x2、类(二进制)。首先我做了一个散点图，发现x1的范围在3到13之间，x2的范围在3到8之间我想获取某些范围内的数据:例如： if 2.5< x1 < 3.5 and 3.5< x2 < 4.5 ---> df1 if ....

浏览 10提问于2019-04-09得票数 0

回答已采纳

2回答

如何将布尔索引应用于星火-Scala数据帧？

scala、apache-spark、apache-spark-sql

我有两个，我需要从一个dataframe中使用一个布尔列来过滤第二个dataframe。两个数据文件都有相同的行数。在熊猫里，我会这样做： df1 = pd.DataFrame({"col1": ["A", "B", "A", "C"], "boolean_column":({"col1":

浏览 4提问于2020-09-08得票数 0

回答已采纳

1回答

用Pandas解析excel文件

pandas

有没有办法强制Pandas将excel文件中的每一列/每行一个单元格地读取到Dataframe中？我有一些非常时髦的电子表格，有很多奇怪的格式-合并的单元格，遗漏的行，等等。是否可以强制pandas创建n行、m列的数据帧，哪些内容将直接对应于从"A1“单元格开始具有相同维度的excel表表子集的内容？一种选择是在excel中将其另存为.csv (编写一个vba脚本以执行

浏览 2提问于2014-01-11得票数 2

2回答

用numpy数组和DataFrame掩蔽熊猫DataFrame

python、pandas、numpy、dataframe

我想使用2D布尔掩码来选择性地改变pandas DataFrame中的一些单元格。我注意到我不能(成功地)使用numpy数组作为掩码，但我可以使用DataFrame。例如, 'B':[10,20,30,40]}) m

浏览 0提问于2018-08-31得票数 5

1回答

熊猫between_time相当于Dask DataFrame

python、pandas、dask

/*/file.csv")创建的dataframe，其中* glob是每个日期的一个文件夹。例如，在级联的数据帧中，我想过滤掉时间子集，比如我将如何使用pd.between_time("09:30", "16:00")。因为Dask对索引的内部表示没有Pandas的DateTimeIndex那样好的特性，所以我已经成功地过滤了我通常在Pandas中的表现。由于分区是

浏览 6提问于2020-06-18得票数 3

1回答

如何将样式应用于熊猫数据的任意子集？具体来说，我有一个包含一些NaNs的dataframe df，我想对它应用一个背景梯度，除了有NaNs的地方(所有单元格都使用相同的颜色映射)。我知道background_gradient (以及更一般的applymap )有一个subset参数，但是从文档中我不知道如何使用它来选择数据数据的任意子集。import numpy as np import pandas</em

浏览 1提问于2019-09-24得票数 2

回答已采纳

5回答

如何对熊猫数据栏的一个子集进行计算？

python、pandas、dataframe

使用数据集(如 )0 1 1 one 2.82 1two 3.85 1 3 two 2.9 ...where我们得到了变量ht的值，例如，age，我想在df['ht']中调整数据的子集可能是因为A value is trying to be set on a copy of a slice

浏览 31提问于2022-12-03得票数 0

2回答

从HDF5文件读取pandas.Dataframe列的子集

python、pandas、numpy、hdf5、h5py

我在HDF5文件中保存了一个pandas.DataFrame。DataFrame由多个列组成，大小非常大。HDF5文件中每个表的大小都大于2 2GB。对于分析，希望仅将表的列的子集加载到存储器中。使用SQLite3，这是一项微不足道的工作。只需使用"select column1，colum2，... from table1“查询即可。在Python中有没有一种简单的方法可以做到这一点？请注

浏览 2提问于2019-08-07得票数 0

1回答

使用具有布尔值的另一个数据框过滤数据框值

python、python-3.x、pandas、dataframe、numpy

我正在处理多个数据帧。每个数据帧包含尺寸为67行x 215列的数值数据。为了从每个数据框中选择数据，存在另一个具有相同维度并包含布尔值的数据框。我无法检索满足true条件的单元格值。import pandas as pd df = pd.DataFrame(78, 69.5],

浏览 13提问于2021-03-19得票数 1

回答已采纳

7回答

修改pandas数据帧中的行子集

python、pandas

假设我有一个包含两列的pandas DataFrame，A和B。我想修改这个DataFrame (或者创建一个副本)，这样每当A为0时，B总是NaN。我该如何做到这一点？

浏览 0提问于2012-09-07得票数 168

回答已采纳

2回答

pandas.DataFrame:根据df中的数据过滤df的行？

python、python-3.x、pandas、dataframe

我有两个pandas.DataFrame：请注意，一些朋友(如Alice)如果有多个电话号码，他们会被列出两次。这个DataFrame是一个常量，我不能(或者不想)修改它。注意，与CONTACTS不同的是，这里只列出了一次好友名称。问题：问题

浏览 2提问于2018-04-13得票数 2

回答已采纳

3回答

如何使用多个布尔条件在Pandas* DataFrame中选择特定列*

python、pandas、dataframe

df.A或df['A']选择列A，使用df[['A', 'B']]选择列A和B的基本术语。我可以包括多个条件，如df[(df.A > 0) & (df.Category == 'Cat1')]，以包含多个条件。不过，有一件事我没有看到，那就是如何选择具有上述两个布尔条件的dataframe列</em

浏览 0提问于2018-12-28得票数 1

回答已采纳

3回答

列中列表中的值的计数

python、pandas、dataframe、python-2.7

我有一个专栏 df['COL_1'] 和一个数字列表 num_range = list(range(200,281, 5)) 这些列要么包含诸如UNREADABLE NOT_PASSIVE之类的单词，要么包含上面列表中的一些值，因此200 205 210等，或者什么都不包含。我正在尝试获得该列中有多少行包含给定范围内的数字的总和。Python 2.7和pandas 0.24.2 编辑：我收到了错误，就像其他用户提到的那样，我的数据不是数字。使用.astype修复此问题，或者重新定义t

浏览 35提问于2021-09-05得票数 0

回答已采纳

2回答

读取大型csv作为Pandas* DataFrame的速度更快*

python、windows、pandas、dataframe、cudf

我有一个csv，我正在读到一个熊猫的DataFrame，但它需要大约35分钟阅读。csv大约为120 GB。我发现了一个名为cudf的模块，它允许图形处理器DataFrame，但它只适用于Linux。chunk_list = []for chunk in tqdm(pd.read_csv('\\large_array.csv', header

浏览 3提问于2019-11-13得票数 0

3回答

从多列索引中选择数据

python-3.x、pandas

您好，我有一个dataFrame，它看起来像下面：我只想选择男性的数据，所以我使用但是dataFrame data_Male是空的，为什么呢？那么如何选择呢？

浏览 7提问于2019-12-04得票数 0

1回答

如何将NaN行放到熊猫DataFrame的任何列中？

pandas、dataframe

我需要从熊猫DataFrame中选择并删除在任何列中具有NaN值的所有行。我知道如何使用布尔级数：df.loc[np.isnan(df['col1'])]对单个列进行过滤，但我不知道如何扩展它，以便从多个列进行筛选。基本上，我希望去掉所有具有NaN值的行。

浏览 4提问于2020-07-04得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云