文章/答案/技术大牛

发布

Pandas:使用np.where()删除值小于今天的行？

基础概念

pandas 是一个强大的数据处理和分析库，而 numpy 是一个用于科学计算的库。np.where() 是 numpy 中的一个函数，用于根据条件返回输入数组中的元素。

类型

np.where() 函数的基本语法如下：

numpy.where(condition, x, y)

condition：一个布尔数组，用于指定条件。
x：当条件为 True 时返回的值。
y：当条件为 False 时返回的值。

应用场景

在数据处理中，np.where() 常用于根据某些条件过滤或替换数据。

示例代码

假设我们有一个包含日期数据的 pandas DataFrame，并且我们希望删除日期小于今天的行。以下是一个示例代码：

import pandas as pd
import numpy as np
from datetime import datetime

# 创建示例 DataFrame
data = {
    'date': ['2023-01-01', '2023-02-01', '2023-03-01', '2023-04-01'],
    'value': [10, 20, 30, 40]
}
df = pd.DataFrame(data)

# 将日期列转换为 datetime 类型
df['date'] = pd.to_datetime(df['date'])

# 获取今天的日期
today = datetime.today()

# 使用 np.where() 删除日期小于今天的行
df = df[np.where(df['date'] >= today, True, False)]

print(df)

解释

创建示例 DataFrame：我们首先创建一个包含日期和值的 DataFrame。
转换日期类型：将日期列转换为 datetime 类型，以便进行日期比较。
获取今天的日期：使用 datetime.today() 获取当前日期。
使用 np.where() 过滤数据：np.where(df['date'] >= today, True, False) 生成一个布尔数组，表示哪些行的日期大于等于今天。然后我们使用这个布尔数组过滤 DataFrame。

参考链接

通过这种方式，你可以方便地删除日期小于今天的行，并且代码简洁高效。

Pandas:使用np.where()删除值小于今天的行？

、、、

在给定以下数据集和当前周作为2019/W37的情况下，如何使用np.where删除当前周之前的行 Year Week Value1 20192019 37 708 2019 39 90print(df)

浏览 40提问于2019-09-13得票数 1

回答已采纳

1回答

我在dataframe中有两列"First Response Time (HH:MM:SS)“和"Target”，其值分别为"00:08:40“和"00:25:00”，同时减去im面临的错误

、、

我想从目标中减去第一个响应，如果输出小于目标，它必须在数据帧的新列中添加"INSLA“。我收到一个错误，因为'int‘和'str’的实例之间不支持'<‘。如何将它们都转换为整数值？我尝试过使用代码 tickets‘OSLA’=np.where(tickets‘’First Time (HH:MM:SS)'< tickets‘’Target‘，"INSLA"，"OSLA") report\Local\Pro

浏览 20提问于2019-09-18得票数 0

回答已采纳

3回答

如何在pandas中用另一个值列值？

、、

我正在尝试使用numpy.where函数将numpy数组中的一些数字替换为1或0，但是我一次只能替换一个。例如，当我打印出‘1’时，它只会用1替换大于3.8845的值，但其他小于3.8845的值仍然保持不变，我希望将小于3.8845的值也更改为0，但我不知道如何做到这一点。import numpy as np happiness_2019 = pd.read

浏览 46提问于2020-06-17得票数 0

1回答

如何在使用熊猫和numpy的if else循环中迭代下一个值

、

我必须在我的数据集中创建一个列，并用1或-1填充它，我似乎无法使用Pandas/Numpy实现这一点。我尝试在这样的for循环中使用np.where。(Close[i+1] > Close[i])

浏览 0提问于2019-08-28得票数 0

回答已采纳

1回答

如何在两个np数组之间找到当一个数组包含nans时的均方误差

、、、

我正在尝试创建一个与MSE完全相同的自定义损失函数，只是它不会计算真值为0(或低于某个阈值)的预测。我的想法是使用np.nan来忽略和不计算这些预测，然而，我的两种寻找均方误差的方法都不适用于np.nan的方法。2mse = mean_squared_error(c,b) 有没有另一种方法可以获得MSE，而忽略所有真值为0的预测我这样做的原因是因为基

浏览 18提问于2021-08-09得票数 0

回答已采纳

1回答

内联if语句条件熊猫将值赋给新列

、

我尝试使用pandas将一个值有条件地赋值给一个列。我尝试使用pandas assign创建一个新列，如果sv_length列指定的长度值为>= 50，则标记为SV；如果长度小于50，则标记为InDel。其他示例使用np.where。为什么我必须使用numpy？这个简单的函数不应该是pandas的一部分吗？https://

浏览 28提问于2019-06-18得票数 0

回答已采纳

1回答

如何与调任后的前一行进行比较

、、

将A列的每一行与前一行进行比较，如果大于，则重新分配到上一行的值，如果小于，则值现在不变。问题是，每次用我想要的原始值进行比较时，都要与重新分配后的前一行进行比较import numpy as npdf = pd.DataFrame(d) df[

浏览 7提问于2022-06-30得票数 0

回答已采纳

2回答

从删除行时KeyError

、、、

我试图从Pandas数据中删除一些行，因为它们在数据中被认为是异常值。当我试图使用教授教我的方法删除一些行时，我得到了一个KeyError。gdp_2019_outliers = np.where(df_gdp['2019'] > 6)gdp_2019_outliers_neg = np.where(df_gdp['20

浏览 12提问于2022-02-05得票数 0

回答已采纳

1回答

基于大熊猫第三栏的两栏选择

、、、

我有一个Pandas数据集，包含三列，例如A、B、C。我想将D列添加到基于C中的值从A和B中取来的数据中，例如，如果C< 0.5，则D应该包含来自B的值，否则来自A的值如何实现？

浏览 1提问于2021-08-05得票数 1

回答已采纳

1回答

当一个值被重置时，我是否可以在pandas数据框中重新计算一个值，例如水表

、、

我希望在重置发生时向前填充我的水表读数数据，以便数据干净可供分析。重置是指下一行中的值小于前一行的值。我的python pandas数据帧如下所示：0 31031 2 31038 4 131有可能在我的熊猫数据框中有几次水数据的重置。研究表明，对于pandas<

浏览 1提问于2019-09-24得票数 1

3回答

np.where治疗np.nan (NaNs值< 0)

、、、

我使用np.where对浮点数进行逻辑测试，以确定值是>还是< 0。由于计算的原因，熊猫数据中有np.nan值，我希望np.where函数“忽略”np.nan行--换句话说，将该行保持为np.nan。import pandas as pdprices = [100, 99= np.where(s

浏览 4提问于2019-11-01得票数 1

回答已采纳

1回答

如何根据行索引数组删除pandas数据帧中的行

、、、、

我有一个带点的数据框。前两列是位置。我正在根据一个点与另一个点的接近程度来过滤数据。我使用cdist计算所有点的距离，然后对结果进行过滤，以找到彼此距离小于0.5的点的索引。我还必须对这些索引做两个小过滤器，首先删除比较相同点距离n的删除索引，n=距离n，n将始终等于零，我不想删除所有的点。我还删除了类似距离比较的指数距离n，m=距离m，n。基本上我需要删

浏览 1提问于2016-05-11得票数 0

1回答

不完全相同的熊猫数据与一个系列对象的比较

、、、

我有下面的pandas.core.series.SeriesRed 4以及下面的多索引数据文件。我的目标是在dataframe中创建Target列，方法是检查dataframe中的Value列是否小于pandas.core.series.Series中相应的颜色值，如果是这样的话，返回1。例如，在第一行中，dataframe中Value列中的值为12，这比熊猫系列对象中

浏览 1提问于2018-09-09得票数 1

回答已采纳

1回答

获取Pandas* Dataframe中的非空列*

、

在下面的pandas数据框中，每一行的不同列中都缺少值。import pandas as pd d = {'col1': [1, 2, None], 'col2': [None, 4, 5], 'col3': [3,np.where(df.iloc[0].notnull()) 但是，我如何使用这些值作为索引来返回第i行中未丢失

浏览 234提问于2020-08-23得票数 0

3回答

熊猫的价值低于给定值的行数。

、

我想删除只包含小于10和大于25的值的行。我的示例dataframe将如下所示：1 2 3 11 24 22 预期输出：4 5 16 因此，如果该行包含的值小于10或大于25，则该行将保留在dataframe中，否则需要删除</e

浏览 3提问于2017-06-14得票数 4

回答已采纳

1回答

如何根据条件将两个独立列的数据连接到另一个数据？

、、

如果日期大于01/01/2015，我想添加来自df2的数据，如果它小于01/01/2015，则添加df1。不确定如何做到这一点，因为列的长度不同。直到今天，day Value02/01/2000我想在DF1中添加一个值列，即日期小于</em

浏览 2提问于2022-01-12得票数 0

1回答

熊猫between_time布尔

、

我正在尝试创建一个列，如果行值介于09:00和17:00之间，该列将指定true。这个语句选择适当的行，但我不能为它们分配一个True-False我一直在尝试使用np.where。

浏览 1提问于2016-01-25得票数 3

回答已采纳

1回答

为什么np.where不返回'1'？只返回'0‘

、、

这段代码应该返回一个名为orc_4的新列，如果df['indictment_charges']中的行值包含2907.04或0，则该列的值为1。 s = '2907.04' df['orc_4'] = np.whereDf.in

浏览 0提问于2021-02-04得票数 0

回答已采纳

1回答

使用np.where() -ValueError清理数据:序列的真值不明确。使用a.empty、a.bool()、a.item()、a.any()或a.all()

、、、

我正在寻找清理一个熊猫数据框中的列('Price')。我想要将'Price‘列中大于24,000小于28,000的任何值设置为NaN。我尝试使用np.where()完成此操作，但收到一条错误消息。谢谢你的帮助！import pandas as pd cars = {'Brand': ['Honda Civic','Toyota C

浏览 13提问于2020-09-08得票数 2

回答已采纳

3回答

如何获得numpy数组的非零元素行数？

、

我希望找到所有条目都小于1e-6或非零值数小于3的行的索引。import numpy as np all_zero = np.where(prob.max(1) < 1e-6 | np.nonzero

浏览 1提问于2019-09-11得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas:使用np.where()删除值小于今天的行？

基础概念

相关优势

类型

应用场景

示例代码

解释

参考链接

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐