使用shift()比较Pandas Dataframe中的行_基于行比较删除python pandas DataFrame中的特定行_使用Pandas Dataframe执行比较 - 腾讯云开发者社区

python、pandas

这个问题是建立在前面一个问题的基础上：我想创建一个新列，检查下面n行中是否有任何行的差值大于X。例如，如果我们有一个dataframe，接下来的4行差超过1，那么新的值将是0。如果接下来的4行差小于或等于1，则新值为1。 >>> df = pandas.DataFrame({"A": [5,6,4,3,5]}) >>> df A 0 5 1 6 2 4 3 3 4 5 >>> desired_result = pandas.DataFrame({"A": [5,6,7,8,2], "

浏览 7提问于2016-02-29得票数 2

回答已采纳

2回答

熊猫-不同字符串之间的比较总是返回真

python、pandas

我正在尝试将Pandas dataframe的单元格中的值与其下面的单元格进行比较。要从当前行下的行获取值，我使用shift： df['shift_minus_1'] = df['company'].shift(-1) 然而，当我比较这些值时，Pandas返回True，尽管有些值显然不匹配。下面是我用于比较的代码： df['comparison'] = df['company'].shift(-1).values[0] == df['company'].values[0]

浏览 0提问于2018-05-18得票数 1

回答已采纳

1回答

在熊猫数据中检测错误的连续行

python、pandas、dataframe、error-handling、row

假设我有以下DataFrame： # Import pandas library import pandas as pd # initialize list of lists data = [['tom', 10], ['tom', 10], ['sam', 23], ['sam', 23], ['sam', 23], ['alice', 23], ['alice', 30], ['alice', 30]] # Create the pandas Data

浏览 2提问于2022-09-22得票数 0

回答已采纳

1回答

如何用匹配三行的条件迭代熊猫数据中选定的行？

python、pandas

如果我有这样的数据样本： >>> import pandas as pd >>> a = [100,300,200,100,700,600,400,600] >>> i = ["2000", "2001", "2002", "2003", "2004", "2005", "2006", "2007"] >>> df = pd.DataFrame(a, index = i, columns = {

浏览 3提问于2020-03-12得票数 2

回答已采纳

3回答

Python If语句检查真假布尔列

python、pandas

我有一个Pandas，其中列为True False值。我试图构造一个if语句来测试该列，但没有得到所需的结果。我认为我使用的.bool方法不正确。基本思想是检查当前行Col1is True的值，如果前三行Col1中的任何一行为False，则在Col2中返回True from pandas import DataFrame names = {'col1': [False, False, False, False, False, True, True, True, False, False]} df = DataFrame(names, columns =['

浏览 4提问于2022-08-15得票数 0

3回答

如何使用df.loc和是否允许巨蟒熊猫删除一行

python、pandas

我希望使用if条件和df.loc[..]来比较同一列中的两个值。如果上一个值高于下一个值，我希望删除完整的行。这就是我所尝试的和我的例子： import pandas as pd data = [('cycle',[1,1,2,2,3,3,4,4]), ('A',[0.1,0.5,0.2,0.6,0.15,0.43,0.13,0.59]), ('B',[ 500, 600, 510,580,512,575,499,598]), ('time',[0.0,0.2,0.5,0.

浏览 0提问于2019-03-22得票数 9

回答已采纳

1回答

改进比较熊猫数据行的for循环的性能

python、performance、pandas

我面临Python/Pandas的性能问题。我有一个for循环，比较Pandas DataFrame中的后续行： for i in range(1, N): if df.column_A.iloc[i] == df.column_A.iloc[i-1]: if df.column_B.iloc[i] == 'START' and df.column_B.iloc[i-1] == 'STOP': df.time.iloc[i] = df.time.iloc[i] - df.time.iloc[i-1] 工作正常，但速

浏览 0提问于2018-06-27得票数 2

回答已采纳

1回答

与使用字符串的Dataframe "diff“等效

python、pandas、string

pandas中的Dataframe有一些在不同行之间执行计算的函数，如diff (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.diff.html)。但是，这只适用于数值计算(或者至少是支持-操作的对象)。有没有办法在字符串之间执行不同的操作，并在字符串相等的情况下返回布尔值？例如： >>> s = pd.Series(list("ABCCDEF")) >>> s.str_diff() 0 NaN 1 False 2

浏览 17提问于2021-03-16得票数 0

回答已采纳

1回答

检查所有n行中的值是否大于当前行的值。

python、pandas、dataframe

我有这样一只熊猫： col_name 0 2 1 3 2 1 3 0 4 5 5 4 6 3 7 3 可以用以下代码创建： import pandas as pd dataframe = pd.DataFrame( { 'col_name': [2, 3, 1, 0, 5, 4, 3, 3] } ) 现在，我希望得到值小于中值的行--all-- n前面的行。因此，对于n=2，输出是行：2, 3, 6。此外，我不想在代码中使用任何for-循环。我想到的一个

浏览 4提问于2022-07-19得票数 3

回答已采纳

2回答

如何删除重复项，并仅在第一行相邻时保留第一行

python、pandas、dataframe

问题如何在某一列中删除重复值的行，并保留第一行，仅当它们彼此相邻时?熊猫方法pd.DataFrame.drop_duplicates不是一个答案，因为它删除所有重复行，即使它们不是相邻的。-- 代码示例 import pandas as pd example_df = pd.DataFrame({'name':['John','Mery','Sarah','Jay','Lala','Mike'], 'Day'

浏览 0提问于2021-01-07得票数 0

回答已采纳

2回答

用函数和计数器迭代或循环DataFrame

python、pandas、math

我如何迭代这些行，并检查一个值是否比他的邻居大一倍(或更多)或一半大小(或更小)，并计算变量count中每个行ind存储的这个数字？例如，这是我的数据。在第二行中，您可以说4是一半(或更少)或双倍或多6？答:不，所以count = 0. 然后你检查6是一半(或更少)还是双倍还是多于1？答:是的，所以count = 1。 A B C 1 0 1 4 6 1 3 3 3 5 0 0 这是代码 import math import pandas as pd data = {'A':[1,4,3,5],'B':[0,6,3,0],'C':[1,1,3,0

浏览 5提问于2019-10-24得票数 0

回答已采纳

2回答

基于多行修改python中的熊猫数据

python、python-3.x、pandas

我正在使用Pandas / Python中的DataFrame，每一行都有一个ID (这不是唯一的)，我想修改dataframe，为每一行添加一个具有多个匹配ID的列。 Starting with: ID Name Rate 0 1 A 65.5 1 2 B 67.3 2 2 C 78.8 3 3 D 65.0 4 4 E 45.3 5 5 F 52.0 6 5 G 66.0 7 6 H 34.0 8 7 I 2.0 Trying to get to: ID Nam

浏览 5提问于2016-02-13得票数 3

回答已采纳

1回答

大熊猫按匹配条件排列的行数

python、pandas、dataframe、mean

假设我有一个Pandas dataframe，如下所示： import pandas as pd import numpy as np df = pd.DataFrame({"time": [100,200,300,400,100,200,300,np.nan], "correct": [1,1,0,1,1,0,0,0]}) 印刷： correct time 0 1 100.0 1 1 200.0 2 0 300.0 3 1 400.0 4

浏览 3提问于2017-03-08得票数 2

回答已采纳

2回答

如何在pandas.dataframe中执行行间操作？

python-3.x、pandas、numpy、dataframe

如何编写嵌套的for pandas.dataframe**?**循环以访问与pandas.dataframe**？**中的一行相关的每一个其他行我试图在pandas.dataframe中的行之间执行一些操作，我的示例代码的操作是计算行与行之间的欧几里德距离。然后将结果保存到表单[(row_reference, name, dist)]中的某个列表中。我理解如何使用pandas.dataframe访问df.itterrows()中的每一行，但我不确定如何访问当前行的每一行，以便执行行间操作。 import pandas as pd import numpy import math df =

浏览 3提问于2019-10-04得票数 2

回答已采纳

1回答

数据格式与2列值的差异

python、pandas、dataframe、datetime

在Pandas上，我们可以计算给定列的不同行(或给定行的不同列)的值之间的差异：如何计算与连续行中两个不同列的值之差相对应的序列。例如，如果有开始日期和结束日期，如何计算行N的结束日期与行N+1的开始日期之间的时间？ >>> df = pd.DataFrame({"Start": pd.date_range("2020-01-01", "2020-01-07", freq="2D"), "End":pd.date_range("2020-01-02", "2020-01

浏览 2提问于2021-03-16得票数 0

回答已采纳

2回答

新行基于其他行的过去值到当前值

python、pandas、dataframe、conditional-statements、shift

我正在尝试创建一个名为move in df的新列，它给出了1的值(如果在x is higher中的值大于其先前的值)和0 (如果是value is lower )，因此move中的第一个值应该是NaN。 d = {'x': [1, 0, 2, 5, 4]} df = pandas.DataFrame(d) 该列应该如下所示： df['move'] = pandas.Series([NaN, 0, 1, 1, 0])

浏览 5提问于2016-06-27得票数 1

回答已采纳

4回答

熊猫数据:如何添加后续的数字数据行

python、pandas

我有一个只有数字的dataframe，我想添加随后的行。所以从这样的数据收集来看： A B 0 1 2 1 3 3 2 5 4 3 9 7 我想要一个像这样的新数据： A B 0 4 5 1 8 7 2 14 11 (新的dataframe的第一行包含原始dataframe的前两行的条目，加起来，等等) 我找到了以下方法： df = pandas.DataFrame({'A': [1,3,5,9], 'B': [2,3,4,7]}) new_rows = {} for i in range(df.shape

浏览 4提问于2015-07-14得票数 0

回答已采纳

2回答

比较一列与另外两列，并将结果分配回DataFrame

python、pandas、dataframe

在下面打印代码 import pandas as pd df = pd.DataFrame() df['A'] = (10,20,34,13,45,2,34,1,18,19,23,9,40,33,17,6,15) df['B'] = (14,26,23,41,12,24,31,1,9,53,4,22,16,19,16,28,13) print(df) 如果A列中的每个数字大于下面5行的数字，我想添加一个返回'TRUE‘或'FALSE’的列。很明显，最后的4个数字是无法比较的，因此它们可以被看作是“忽略”。我想添加第二列，如果

浏览 1提问于2019-06-16得票数 1

回答已采纳

1回答

通过变换实现熊猫群并行化/加速的有效方法

python、pandas、dataframe、parallel-processing、time-series

我试图加速一些用来计算熊猫时间延迟、索引数据格式的代码。dataframe包含由ID列标识的200 k时态序列。我试过达斯克，但没有得到任何改善(比熊猫本身花费的时间更长)。下面是一个可以生成具有可比较大小的虚拟数据的示例： import itertools as it import numpy as np import pandas as pd np.random.seed(1) #Series for ID ID_data = pd.Series(np.arange(0,200000), name='ID') #Array of data - create panda

浏览 2提问于2021-08-03得票数 0

回答已采纳

1回答

根据特定列中前一行的值删除重复行

python、pandas、dataframe、duplicates

我有一个类似于以下示例的dataframe： import pandas as pd data = pd.DataFrame(data={'col1': [1,2,3,4,5,6,7,8,9], 'col2': [1.55,1.55,1.55,1.8,1.9,1.9,1.9,2.1,2.1]}) 在第二列col2中，可以看到几个重复的值，3乘以1.55、3乘以1.9和2乘以2.1。我需要做的是删除与其上一行重复的所有行。所以，第一排是我想保留的。在本例中，这将是具有col2值1、4、5、8的行，提供以下数据帧作为我想要的输出： clean_data = pd.D

浏览 4提问于2022-11-16得票数 0

回答已采纳

1回答

创建新列，比较熊猫数据格式中的行。

python、pandas、apply

我希望根据在接下来的2行中看到的值在dataframe中创建一个新列。具体来说，如果下2行中的任何值都低于4，那么我希望当前行中的新值为0(如果接下来2行中的所有值都在4以上，那么我希望当前行中的新值为1)。 >>> df = pandas.DataFrame({"A": [5,6,7,3,2]}) >>> df A 0 5 1 6 2 7 3 8 4 2 >>> desired_result = pandas.DataFrame({"A": [5,6,7,8,2], "new"

浏览 2提问于2016-02-12得票数 2

回答已采纳

2回答

如何在Pandas中对当前行与前一行和后一行进行迭代比较？

python、for-loop、pandas

在Pandas中有没有一些聪明的或者Pythonic式的方法来做下面这样的事情呢？ for index, row in pd.DataFrame().iterrows(): if (row[previous_index]>=row and row[next_index]>=row): row=(row[previous_index]+row[next_index])/2

浏览 1提问于2014-09-05得票数 3

1回答

Dataframe通过查看前一行来更改值

python、dataframe

我有一个，如果上一行的实验室值有一个字符'E'，我想将' lab‘值更改为字符B，除了最后一行'lab’是E for i, row in df.iterrows(): if i == len(df) - 1: pass elif df['lab'].iloc[i] == 'E': df['lab'].iloc[i] = 'B' 我编写了以下代码，但运行需要很长时间，并得到以下错误： /usr/local/lib/python3.6/dist-packages/pandas/c

浏览 3提问于2020-06-16得票数 0

回答已采纳

1回答

如何根据条件在大熊猫内部进行数据操作

python、pandas、dataframe

我有这只熊猫的数据我要那个如果有一天，某一行condition_2在一行condition_1之前为“True”，则将condition_2行更改为NaN。 Dataframe结构:在列的同一行中不可能有True和True 因此，在前面的dataframe中，应该是这样的：这是示例代码： import pandas as pd from datetime import datetime tbl = {"date" :["2022-02-27", "2022-02-27", "2022-02-27", &#

浏览 2提问于2022-07-01得票数 0

回答已采纳

3回答

如何有效地检查pandas数据帧每行中连续的值范围？

python、pandas、dataframe

假设我们有像这样的pandas dataframe： df = pd.DataFrame( {'A': [0, 0, 1, 0], 'a': list('aaaa'), 'B': [1, 0 , 0, 1], 'b': list('bbbb'), 'C': [1, 1, 0, 1], 'c': list('cccc'), 'D'

浏览 2提问于2019-05-03得票数 2

2回答

来自其他列和行的DataFrame中的新列

python、pandas、dataframe

我想在现有的DataFrame，df中创建一个新的列V。我希望新列的值是该行中'x‘列中的值与它下面行中'x’列的值之间的差异。例如，在下图中，我希望新列的值为93.244598 - 93.093285 = 0.151313。我知道如何根据Pandas中现有的列创建一个新列，但我不知道如何使用此方法引用其他行。是否有一种方法可以避免迭代dataframe中的行？(因为我读到这通常是个坏主意)

浏览 4提问于2022-07-26得票数 1

回答已采纳

1回答

在Pandas dataframe中，如何使用布尔输出检测两个不同列(行)的交叉符？

python、pandas、dataframe

我仍然在学习python，并尝试实时扫描最新的股票价格。在我的工作流程中，我有两个不同的数据格式。 (1)基于最新的开放/高/低/关闭(OHLC)价格以及LineA和LineB，实时运行数据以检测某些条件。后一行基于OHLC值。它们显示在同名的6列中。索引就是时间。在本例中，每一行代表1分钟，新行在dataframe中每隔一分钟显示。这里用于根据最新行检查交叉的代码具有以下类型的写作风格： def check_crossover(df): cond1 = any([(candles.lineA[-1] < candles.lineB[-1] and candles.lineA[

浏览 0提问于2021-04-18得票数 3

回答已采纳

1回答

如何删除熊猫数据的最后一列中的第一个值，然后删除剩下的最后一行？

python、pandas

下面我用熊猫来阅读我的csv文件，格式如下： dataframe = pandas.read_csv("test.csv", header=None, usecols=range(2,62), skiprows=1) dataset = dataframe.values 如何删除dataframe中最后一列中的第一个值，然后删除dataframe中的最后一行？有什么想法吗？

浏览 6提问于2017-08-22得票数 0

回答已采纳

1回答

定义一个dataframe列，例如每一行都等于自己乘以上一列。

pandas、dataframe

我正在尝试完善最严格的pythonic方法来定义一个dataframe列，例如每一行都等于它自己乘以上一行值: rowi = rowi * row import pandas as pd list = [1,2,3] df = pd.DataFrame() df['a'] = list a 0 1 1 2 2 3 I am expecting the function to output: a 0 1 (stays identical) 1 2 (2*1) 2 6 (3*2) 如果不使用iterrow()，这是可能的吗？

浏览 1提问于2021-05-12得票数 0

回答已采纳

1回答

Python "<“操作符与"<=”错误

python、pandas

我的目标是在数据仓库中找到临时的最小值。要找到它们，我在dataframe中搜索的值低于前面3个值中的最小值。在Google和python3.9中进行了windows测试。也许还有其他更疯狂的方法来做这件事。问题是:当使用<=时，一切看起来都很好，但是当使用<时，什么都没有发现。即使提供的数据应该匹配。 import pandas as pd data_list = [55,66,77,88,99,88,77,66,55,54,65,67,68,70,73,78,83] # use any other values low = pd.Series(data_list)

浏览 5提问于2021-12-28得票数 0

回答已采纳

1回答

基于近似匹配或公式在pandas中查找重复行

python、pandas

我有一个熊猫数据框 import pandas as pd df = pd.DataFrame({"x" : [1.,1.,2.,3.,3.01,4.,5.],"y":[10.,11.,12.,12.95,13.0,11.,10.], "name":["0ndx","1ndx","2ndx","3ndx","4ndx","5ndx","6ndx"]}) print(df.duplicated(sub

浏览 17提问于2019-11-27得票数 0

3回答

Pandas/xarray -根据另一个数据帧动态地水平移动值

python、pandas、dataframe、python-xarray

我想水平移动我的数据帧test_1的每一行，跟随来自另一个数据帧df_x的相应行中的值。df_x的每一行中的值应该定义向左移动的步数。 test_1 = pd.DataFrame([[1,2,3,4], [10,12,13,14], [20, 22, 23,24]]) df_x = pd.DataFrame([[1],[3],[2]]) 我的预期输出将是： Out[157]: 0 1 2 3 0 2 3 4 NA 1 14 NA NA NA 2 23 24 NA NA 我试着从一个类似的问题(how to shift columns in

浏览 26提问于2021-08-10得票数 1

回答已采纳

3回答

最近的熊猫未来价值不等于当前行

python、pandas、vectorization

我有一个Pandas DataFrame，其中有一个列price和一个DateTimeIndex。我想创建一个新列，当price下次更改时增加1，如果减少则为0。多个连续行的值可能与price相同。示例： import pandas as pd df = pd.DataFrame({"price" : [10, 10, 20, 10, 30, 5]}, index=pd.date_range(start="2017-01-01", end="2017-01-06")) 然后，产出应是： 2017-01-01 1 2017-01-02

浏览 3提问于2017-09-28得票数 0

回答已采纳

4回答

比较Pandas DataFrame中的前一行值

python、pandas、numpy、boolean、shift

import pandas as pd data={'col1':[1,3,3,1,2,3,2,2]} df=pd.DataFrame(data,columns=['col1']) print df col1 0 1 1 3 2 3 3 1 4 2 5 3 6 2 7 2

浏览 1提问于2016-12-30得票数 55

回答已采纳

1回答

PySpark中等效的Pandas掩蔽和移位

apache-spark、pyspark、pyspark-sql

我一直在Python上构建我的应用程序，但出于某种原因，我需要将它放在分布式环境中，所以我尝试构建和应用程序。使用Spark，但无法像Pandas中的shift那样快速地编写代码。 mask = (df['name_x'].shift(0) == df['name_y'].shift(0)) & \ (df['age_x'].shift(0) == df['age_y'].shift(0)) df = df[~mask1] 哪里 mask.tolist()

浏览 0提问于2019-01-23得票数 0

回答已采纳

1回答

在pandas数据帧中更改时比较行和前一行

python、pandas、compare

我有以下形式的纵向数据 import pandas as pd df = pd.DataFrame({ 'a': ['apples', 'plums', 'pears', 'pears', 'pears'], 'b': ['grapes', 'grapes', 'grapes', 'grapes', 'bananas'], 'c': [0, 0, 1, 0, 1]

浏览 5提问于2017-01-17得票数 1

回答已采纳

1回答

如何修改比满足条件的值低一行的值？

python、pandas、dataframe、replace、where

每当在后续条目中满足条件时，是否有一种有效的方法来更改前一行的值？具体地说，我想知道是否有任何方法可以使pandas.where在条件测试之前或之后修改行中的条目。假设 Data={'Energy':[12,13,14,12,15,16],'Time':[2,3,4,2,5,6]} DF = pd.DataFrame(Data) DF Out[123]: Energy Time 0 12 2 1 13 3 2 14 4 3 12 2 4 15 5 5

浏览 12提问于2019-05-08得票数 2

回答已采纳

1回答

在熊猫身上寻找当地的复制品(互相跟随)

python、pandas

我想找到当地的复制品，并给他们一个独特的身份，直接在熊猫。现实生活示例：时间订购的购买数据，客户身份发生多次(因为他每周去一家商店多次)，但我想确定客户在同一时间清洗多个项目的场合。我现在的方法如下所示： def follow_ups(lst): lst2 = [None] + lst[:-1] i = 0 l = [] for e1, e2 in zip(lst, lst2): if e1 != e2: i += 1 l.append(i) return l follow_ups([

浏览 0提问于2021-05-19得票数 0

回答已采纳

1回答

删除大熊猫中的行直到第一次出现特定值

python、pandas

我想删除用户第一次发生的行以及DataFrame中每个唯一用户的前一行。例如，我有下面的Dataframe，我想获得另一个dataframe，它首先删除"val“列1中的行，并为每个用户删除其前面的行。 user val 0 1 0 1 1 1 2 1 0 3 1 1 4 2 0 5 2 0 6 2 1 7 2 0 8 3 1 9 3 0 10 3 0 11 3 0 12 3

浏览 0提问于2019-07-06得票数 0

1回答

熊猫群+如果其他+添加新列回到原来的df

python、pandas、numpy

我有一个数据文件，如下所示。最右边的列是我想要的列： Group Value1 Value2 TargetColumn 1 1 2 0 1 2 2 1 1 3 3 1 1 4 4 1 2 6 9 0 2 7 5 0 2 8 6 0 2 9

浏览 0提问于2018-08-19得票数 1

回答已采纳

2回答

如何将数据based的每一行与以下2行进行比较，并根据这3行和算法修改当前行？(熊猫)

python、pandas、dataframe、compare

如何将每一行的“”值与接下来的2行进行比较？我想为每一行运行一个函数:如果当前价格是较低的，那么接下来的两个小时中的任何一个，我都希望将"Low“分配给当前行的"Action”列。如果当前价格比接下来的2小时高出，那么指定"High“。如果目前的价格不是所有3小时中最高或最低的，就指定“持有”。那么，我如何从每一行中获取价格，并将其与Pandas进行比较？dataframe如下所示： data.head() Date Time Price Month Hour Action 0 2018-01-01 0

浏览 0提问于2019-03-31得票数 0

回答已采纳

1回答

标识具有相同值的下一行，并创建新的列pandas数据框

python、pandas、loops、dataframe、iterator

我有以下DataFrame： import pandas as pd # create simple dataset of people data_pandas = pd.DataFrame({'Order': [1, 1, 1,1,2,2,2], 'X': [30,44,30,44,44,30,44], 'Y': [46,46,35,45,90,60,60]}) 我想用以下逻辑创建一个新的列'Z‘：用相同的'X

浏览 22提问于2019-03-14得票数 1

回答已采纳

1回答

如何找出哪些行仅在DataFrame A中，而不是在B中(反之亦然)，哪些行在A中，哪些行在B中(反之亦然)？

python、pandas、dataframe

曾经想过只在DataFrame A中有哪些行，但B中没有行(反之亦然)，A中有哪些行，B中有哪些行(反之亦然)？虽然存在pandas.DataFrame.diff() (更像逐元素减法)、pandas.Index.intersection (只对索引工作)和pandas.DataFrame.merge() (更像SQL合并两个DataFrames)，但它们都不完全满足我们的需要.

浏览 14提问于2022-02-12得票数 0

1回答

如何在pandas中使用series.map()或series.apply()将函数正确应用于序列

python、pandas

我正在尝试使用pandas将一个预定义函数(myfunc)应用到我的DataFrame中的一个新系列。该函数将检查旧列(对于每行)中的每个索引中的值是否大于前一列中的值，如果是，则返回1，如果不是，则返回0。我还尝试过series.apply()函数，我得到的结果是:跨越新创建的列中的所有行。 def myfunc(x): for i in range(0,86): if x.iloc[i + 1] > x.iloc[i]: yield 1 else: yield 0 df2['Highe

浏览 8提问于2019-07-23得票数 0

1回答

熊猫-不同时间窗的移动平均线

python、pandas

我在Pandas Dataframe里有一些数据。我想从这些数据中计算移动平均值，包括最多N行和最多Q行： import pandas my_data = pandas.DataFrame({ 'values': [5.0, 4.0, 3.0, 5.0, 5.0, 6.0, 4.0, 6.0, 7.0, 4.0, 5.0, 5.0] }) my_data values 0 5.0 1 4.0 2 3.0 3 5.0 4 5.0 5 6.0 6 4.0 7 6.0 8 7

浏览 0提问于2018-07-24得票数 2

3回答

如何加快大熊猫前排计算的速度？

python、pandas、dataframe、numba

我正在尝试使用正在创建的列的移位值创建一个新的Pandas DataFrame列。我能够这样做的唯一方法是迭代数据，这太慢了，并在我的代码中造成瓶颈。 import pandas as pd df = pd.DataFrame([1,6,2,8], columns=['a']) df.at[0, 'b'] = 5 for i in range(1, len(df)): df.loc[i, ('b')] = (df.a[i-1] + df.b[i-1]) /2 我试过用轮班，但没起作用。它为第1行填充值，为其余的填充NaN。我假设这

浏览 4提问于2020-12-26得票数 3

回答已采纳

1回答

熊猫数据访问:将函数应用于上一行的行值和值

python、pandas、geopy

我正在尝试将以下功能应用于Pandas dataframe： def eukarney(lat1, lon1, alt1, lat2, lon2, alt2): p1 = (lat1, lon1) p2 = (lat2, lon2) karney = distance.distance(p1, p2).m return np.sqrt(karney**2 + (alt2 - alt1)**2) 如果我使用离散值，例如： distance = eukarney(49.907611, 5.890404, 339.15734, 49.907683, 5.890373,

浏览 2提问于2021-10-12得票数 1

回答已采纳

3回答

带有字符串的Pandas "diff()“

python、pandas

如何在每次列更改其字符串值时标记数据帧中的行？例如：输入 ColumnA ColumnB 1 Blue 2 Blue 3 Red 4 Red 5 Yellow # diff won't work here with strings.... only works in numerical values dataframe['changed'] = dataframe['ColumnB'].diff() Colum

浏览 0提问于2016-11-01得票数 36

回答已采纳

1回答

如何使用基于滚动自定义函数的Pandas向量法，涉及整行和先验数据

pandas

虽然使用pandas滚动方法来应用标准公式很容易，但如果它涉及多列和有限的过去行，我发现很难。使用以下代码来更好地阐述： import numpy as np import pandas as pd #create dummy pandas df=pd.DataFrame({'col1':np.arange(0,25),'col2':np.arange(100,125),'col3':np.nan}) def func1(shortdf): #dummy formula #use last row of col1 mult

浏览 10提问于2019-12-24得票数 1

回答已采纳

1回答

Pandas.Dataframe中的访问邻居行

python、pandas

我试图计算一系列数据的局部最大值和最小值:如果当前行值大于或低于后一行和前一行，则将其设置为当前值，否则设置为NaN。除了这个以外，还有什么更优雅的方法吗？ import pandas as pd import numpy as np rng = pd.date_range('1/1/2014', periods=10, freq='5min') s = pd.Series([1, 2, 3, 2, 1, 2, 3, 5, 7, 4], index=rng) df = pd.DataFrame(s, columns=['val']) df.in

浏览 1提问于2014-06-12得票数 2

回答已采纳