使用pandas在数据帧中跨行查找均值

在数据帧中跨行查找均值可以使用pandas库中的rolling函数结合mean函数来实现。具体步骤如下：

导入pandas库：import pandas as pd
创建数据帧：df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]})
使用rolling函数计算跨行均值：df['Mean'] = df['A'].rolling(window=2).mean()这里的window参数指定了计算均值的窗口大小，这里设置为2表示每两行计算一次均值。
打印结果：print(df)输出结果如下： A B Mean 0 1 6 NaN 1 2 7 1.5 2 3 8 2.5 3 4 9 3.5 4 5 10 4.5可以看到，新添加的'Mean'列中存储了每两行的均值，第一行的均值为NaN。

这种跨行查找均值的方法适用于需要在数据帧中进行滑动窗口计算的场景，例如时间序列数据的平滑处理、移动平均等。

腾讯云相关产品和产品介绍链接地址：

腾讯云数据库 TencentDB：https://cloud.tencent.com/product/cdb
腾讯云云服务器 CVM：https://cloud.tencent.com/product/cvm
腾讯云人工智能 AI Lab：https://cloud.tencent.com/product/ai-lab
腾讯云物联网平台 IoT Hub：https://cloud.tencent.com/product/iothub
腾讯云移动开发移动推送 TPNS：https://cloud.tencent.com/product/tpns
腾讯云对象存储 COS：https://cloud.tencent.com/product/cos
腾讯云区块链服务 TBC：https://cloud.tencent.com/product/tbc
腾讯云元宇宙服务：https://cloud.tencent.com/product/vr 请注意，以上链接仅供参考，具体产品选择需根据实际需求进行评估。

如何创建一个for循环来查找多个数据帧中列的平均值并添加新列？

、

我看了这个问题的变体，但没有找到worked...so在这里的答案。我有很多数据框，每个数据框代表一个心理指数(他们问几个问题，它们的平均值给你一个关于你正在测量的东西(愤怒，焦虑，等等)的分数)。在本例中，我将选择其中的三个: SA、SE、GT 我想创建一个for循环来自动计算每个数据帧中列的平均值，然后使用该平均值添加一个新列。我可以为一个数据帧创建一个for循环来做这件事，但是我该如何循环这个循环来为我所有的数据帧(比3多得多)做这件事呢？ #This is the for loop to do it for just one data frame (SA) avg <- c()

浏览 0提问于2019-09-10得票数 0

1回答

带步长的Pandas滑动窗口

、、

在Pandas中有没有什么快速的方法可以让重叠的滑动窗口具有步长呢？我正在尝试获取聚合指标(如均值、标准差、百分位数、ecc)。在60秒的窗口中沿着每列，步长为1(窗口可以重叠)。我将写一个最小的例子来解释我想要什么。假设我们使用tmp = pd.DataFrame([1,2,3,4,5])获得了以下数据帧 >>> tmp 0 0 1 1 2 2 3 3 4 4 5 在窗口为2，步长为1，均值为聚合的情况下，我希望得到以下结果 0 0 1.5 1 2.5 2 3.5 3 4.5 我的数据帧大约有200000行和870列，所以我想要一个快

浏览 143提问于2020-06-25得票数 0

2回答

大多数pandas-获取列表长度统计数据的方式(平均长度、最大长度等)在pandas df列中

、

我想在pandas df专栏中获得列表长度的统计数据，如平均长度、最低长度、最高长度、标准差等。示例： import pandas as pd dfp = pd.DataFrame( {'trial_num': [[1, 2, 3, 1, 2, 3], [3,4,6,7], [2,2]], 'subject': [[11, 2, 2, 2],[2,2,7],[4]] } ) dfp 输出： trial_num subject 0 [1, 2, 3, 1, 2, 3] [11, 2, 2, 2] 1 [3, 4,

浏览 25提问于2019-10-21得票数 1

回答已采纳

1回答

在C#数据帧中跨3列获取最大值

、、

我正在尝试将一些pandas代码转换为Deedle和C#。首先，数据帧是，因为它是按日期编制索引的。 Frame.FromRecords(fetchOhlcVsResults).IndexRows<DateTime>("datetime").SortRowsByKey() 接下来，我成功地在框架中添加了其他几个计算列。我被困在翻译的部分是来自pandas的这段代码： tr = df[['high-low', 'high-pc', 'low-pc']].max(axis=1) 它只取三列中的最大值。这是我尝试过的：

浏览 17提问于2021-11-15得票数 0

回答已采纳

1回答

Pandas:如何减去稀疏数据帧的平均值？

、、、

在pandas 0.25.3中，我不能减去稀疏数据帧的均值列。我试过了： df_norm= df.sub(df.mean(axis=1), axis=0) 但我得到了： AttributeError: module 'pandas._libs.sparse' has no attribute 'sparse_sub_float32'

浏览 14提问于2020-01-26得票数 0

回答已采纳

1回答

与每列的中位数进行比较

、、、

如何与pandas数据帧中每一列的中位数进行比较，如果值大于中位数，则结果为true；如果值小于中位数，则结果为false？现在我正在标准化，所以基本上比较每一列的0(平均值)。我想要一种方法来对median做同样的事情。

浏览 2提问于2019-06-28得票数 1

1回答

加快将函数应用于熊猫数据列表

、、

我有一些时间序列数据，其中每个数据点都是一个熊猫数据框架，即数据帧列表。我还有一个函数foo，它对每个数据点进行操作。其目的是将该函数应用于整个时间序列数据，并有效地实现。我将函数foo矢量化，使其在整个数据帧上运行，并实现了大约32倍的加速比。原代码如下： def bar(row, cols): return tuple([row[col] for col in cols]) def foo(df, cols): keys = set() for index, row in df.iterrows(): key = bar(row, cols)

浏览 0提问于2019-05-14得票数 0

1回答

计算Pandas Dataframe中多列的日平均值，然后插入一行

、、、、

我使用Pandas向数据帧输入了一个CSV文件，并希望计算其中列的日平均值。有两个列不会被平均化，时间和日期(日期是数据分组的日期)。然后，我希望在该日期的最后一行下面插入一行，在date列中插入“Average”( time列中没有任何内容)，然后在正确的列中插入相应的平均值。我只使用了Pandas一段时间，所以我不知道最简单的方法是什么。任何帮助都将不胜感激。

浏览 12提问于2022-06-17得票数 0

2回答

当存在NaN值时，获取pandas数据帧中的平均值

、、

我有一个pandas数据帧，我想在数据帧的末尾添加一行以显示每列的平均值；但是，由于Col2、Col3和Col4中的平均值，NaN函数无法返回列的正确平均值。如何解决此问题？ Col1 Col2 Col3 Col4 1 A 11 10 NaN 2 B 14 NaN 15 3 C 45 16 0 4 D NaN 16 NaN 5 E 12 23 5 附注:这是取平均值

浏览 23提问于2020-01-12得票数 1

回答已采纳

1回答

使用pandas计算指数移动平均

、

我想找出数据帧的指数移动平均值(12天)。正如pandas文档0.19.2中所给出的，我使用函数DataFrame.ewm来计算指数移动平均值。但它会导致如下AttributeError错误：'DataFrame‘对象没有'ewm’属性。下面是我用来计算指数移动平均的代码。 avg_gain=pd.gain.ewm(span=12,min_periods=12,adjust=False).mean() 另一方面，在以前的pandas文档中，有计算指数移动平均的函数ewma，但此函数导致了不希望的结果。找不到问题所在？

浏览 11提问于2017-02-16得票数 3

回答已采纳

2回答

为什么不能使用此SQL代码按特定组查找平均值？

、

假设我们有下表(称为numbers)： Name A B C Jon 1 3 0.33 Sue 4 4 1 Jon 5 5 1 我想修改这个表，使其包含一个新的列D，它是特定于每个人的列C的平均值。例如，Jon出现两次，因此它们的C平均值为0.33 + 1 / 2 = 0.665。因此，我希望将0.665添加到Jon中。同样的原则也适用于数据库中的其他名称，因此结果如下所示： Name A B C D Jon 1 3 0.33 0.665 Sue 4 4 1 1 Jon 5 5 1 0.665 你知道该怎么做吗？我尝试过ALTER TABLE numbers AD

浏览 3提问于2020-12-27得票数 1

2回答

如何用数值数组的列的方式填充n值？

、、

我将pandas数据帧的一部分转换为numpy数组，并希望用列的平均值填充它的值，类似于我在pandas中执行以下操作： df.fillna(df.mean(), inplace = True) 到目前为止，我唯一能做到的方法就是对列进行迭代。还有别的办法吗？谢谢!

浏览 11提问于2021-09-18得票数 2

回答已采纳

1回答

熊猫使用群比()和切特()

、

我有一个dataframe，对于每个组值，我想要标记值。如果值小于该组均值，则标签为1，如果组值大于组均值，则标签为2。输入数据帧 groups num1 0 a 2 1 a 5 2 a Nan 3 b 10 4 b 4 5 b 0 6 b 7 7 c 2 8 c 4 9 c

浏览 6提问于2022-08-01得票数 1

回答已采纳

2回答

如何在pandas dataframe中使用列表作为值？

、、、、

我有一个数据帧，它要求列的子集具有具有多个值的条目。下面是一个包含“runtime”列的dataframe，其中包含程序在各种条件下的运行时： df = [{"condition": "a", "runtimes": [1,1.5,2]}, {"condition": "b", "runtimes": [0.5,0.75,1]}] df = pandas.DataFrame(df) 这就形成了一个数据帧： condition runtimes 0 a [1,

浏览 0提问于2014-11-08得票数 8

回答已采纳

3回答

DataFrames -平均列数

、、、

我在pandas中有以下数据框架 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我希望创建一个数据帧，其中包含列1和列2，列3和列4的平均值，等等。 ColumnAvg(12) ColumnAvg(34) 2 3 1.5 1.5 我用的是这个，但它是所有东西的平均值。 df.mean(axis=1) 有没有办

浏览 40提问于2020-09-20得票数 3

回答已采纳

1回答

用python索引pandas dataframe中的pandas dataframe

、、、

我在一个数据帧中有一系列的数据帧。顶层数据帧的结构如下： 24hr 48hr 72hr D1 x x x D2 x x x D3 x x x 在每种情况下，x都是使用pandas.read_excel()创建的数据帧每个x数据帧中的一列具有标题‘平均血管长度’，并且在该列中有三个条目(即行、索引)。我想返回的是“平均血管长度”列的平均值。我还对如何返回该列中的特定单元格感兴趣。我知道有一个用于pandas数据帧的.mean方法，但我不知道使用它的索引语法。下面是一个例子 import pandas as

浏览 1提问于2015-03-30得票数 0

1回答

大熊猫按匹配条件排列的行数

、、、

假设我有一个Pandas dataframe，如下所示： import pandas as pd import numpy as np df = pd.DataFrame({"time": [100,200,300,400,100,200,300,np.nan], "correct": [1,1,0,1,1,0,0,0]}) 印刷： correct time 0 1 100.0 1 1 200.0 2 0 300.0 3 1 400.0 4

浏览 3提问于2017-03-08得票数 2

回答已采纳

1回答

同月python平均值

、

我有以下数据帧： Date Water Milk 2020-01-25 21 58 2020-01-21 25 54 2020-01-14 64 22 2020-02-25 54 58 2020-02-16 21 94 2020-03-28 45 95 2020-03-23 64 95 我想取具有相同月份的Water和Milk值的平均值，并将其存储在新的数据帧中，这样它看起来就像： Date Water Milk 1 36.666

浏览 16提问于2020-01-28得票数 1

回答已采纳

1回答

如何用层次指数计算大熊猫的平均数

、

我有一个具有1mi行和分层索引(国家、州、城市，按此顺序)的pandas数据帧，每行都有一个产品的价格观察。我如何计算每个国家、州和城市的均值和标准差(请记住，由于我的df很大，我正在避免循环)？对于每个级别的均值和标准差，我希望将值保存在此数据框中的新列中，以供将来访问。

浏览 16提问于2017-06-23得票数 1

回答已采纳

1回答

计算过去n天的滚动平均值，单位为Dask

、、、

我试图在一个大型数据集上计算过去n天(n= 30)的滚动平均值。在Pandas中，我将使用以下命令： temp = chunk.groupby('id_code').apply(lambda x: x.set_index('entry_time_flat').resample('1D').first()) dd = temp.groupby(level=0)['duration' ].apply(lambda x: x.shift().rolling(min

浏览 11提问于2020-05-04得票数 1

4回答

熊猫计算ewm是错误的吗？

、、

当试图从数据帧中的金融数据计算指数移动平均(EMA)时，Pandas的ewm方法似乎是不正确的。下面的链接很好地解释了基础知识：转到Pandas解释时，采取的方法如下(调整参数为False)： weighted_average[0] = arg[0]; weighted_average[i] = (1-alpha) * weighted_average[i-1] + alpha * arg[i] 在我看来这是不正确的。arg应该是(例如)收盘值，然而，arg是第一个平均值(即所选周期长度的第一系列数据的简单平均值)，而不是第一个收盘值。因此，arg和argi永远不能来自相同的数

浏览 16提问于2016-06-20得票数 15

2回答

在pandas中添加矢量化的列

、、、

我有一个保存为pandas数据帧的词频矩阵。 1000 Merkwürdig Mindestens Error ... Periode bildet 30 Button 0 0 0 0 0 ... 0 0 0 0 1 0 1 0 2 ... 0 0 0 0 2 0 0 0 0 ...

浏览 29提问于2021-11-17得票数 1

回答已采纳

1回答

pandas数据帧单元的numpy数组的元素平均值

、、、

我有一个2x1的pandas数据帧，其中2个单元格包含numpy数组： >>> import numpy as np >>> import pandas as pd >>> a0 = np.array([[1, 2], [2, 2]]) >>> a1 = np.array([[3, 2], [1, 1]]) >>> df = pd.DataFrame([[a0], [a1]]) 我可以计算两个数组的元素平均值，如下所示： >>> np.mean(df[0]) array([[ 2. ,

浏览 7提问于2018-01-24得票数 1

回答已采纳

2回答

对唯一列值进行分组，以获取pandas数据帧列中每个唯一值的平均值

、、、

我正在尝试获取一个pandas数据帧，并从另一列中的相应值中获取一列中每个唯一值的平均值。数据帧如下所示： Charge Code Days 1001-000 132 1001-000 48 1001-000 12 1001-000 22 1001-000 38 1001-000 22 1001-000 36 1001-000 931 1001-000 973 1001-000 53 1001-000 69 1001-000 69 1001-000 973 1001-000 69 1001-000

浏览 13提问于2020-04-04得票数 0

回答已采纳

2回答

如何将(月+年)分组转换为Pandas数据帧？

、、

我正在尝试从一个pandas数据帧中获取平均值，并将其转换为一个新的数据帧，该数据帧具有按月+年分组的列的平均值。所以我找到了这个答案：，但它并没有起到很好的作用。这就是我所拥有的： dt grade 2020-01-01 10 2020-01-02 20 2020-02-01 30 2020-02-01 40 2020-03-01 10 2020-03-04 20 这就是我想要的： dt grade_mean 2020-01 15 2020-02 35 2020-03 15 我还希望

浏览 0提问于2021-02-09得票数 0

3回答

如何找出熊猫数据框的特征？

、

我的问题是理论上的。假设我有一个python中的pandas数据框，我想检查一下可以对其执行哪些操作。例如，我们可以对熊猫数据帧执行重命名、求和、均值等操作。但是，有没有什么命令可以给我这些操作的完整列表呢？

浏览 8提问于2019-05-05得票数 1

回答已采纳

3回答

查找四行的均值、计数和标准差

、、

我正在计算pandas数据帧中4行的平均值、观察值和标准差。现在，我正在制作一个新的数据帧，但肯定有比使用四行更简单的方法？我想我可以使用groupby，然后使用agg，但是我一直无法使它工作。 stats = pd.DataFrame() stats["mean"] = df.mean(axis=1) stats["count"] = df.count(axis=1) stats["std"] = df.std(axis=1)

浏览 2提问于2019-10-22得票数 0

2回答

如何使用pandas或numpy处理(查找均值和标准差)复制数据？

、、

我是Python的新手，最近我一直在尝试使用pandas和NumPy找出数据的均值和标准差。我有代表三个重复的列(对于两个克隆，即C1和C2)，我需要对它们进行平均，然后用标准差作为误差条绘制这些平均值。下面是一个数据帧，第一列中有'time‘和复制(2:4，5:7)。谢谢你 ?

浏览 67提问于2021-02-11得票数 0

1回答

Pandas:创建新的数据帧，平均来自另一个数据帧的重复数据

、

假设我有一个包含列重复项的数据帧my_df，例如.. foo bar foo hello 0 1 1 5 1 1 2 5 2 1 3 5 我想创建另一个对重复项取平均值的数据帧： foo bar hello 0.5 1 5 1.5 1 5 2.5 1 5 我如何在Pandas中做到这一点？到目前为止，我已经成功地识别了重复项： my_columns = my_df.columns my_duplicates = print [x for x, y in collections.Counter(my_columns).items()

浏览 0提问于2013-05-22得票数 7

回答已采纳

1回答

Python中的Null独立列平均值计算

、

我正在尝试计算Python中三列的平均值。这里是捕捉-如果我的3列的所有3个行值都不是null，那么我的平均值将是(x+y+z)/3。如果我其中一个行值为空(假设z)，那么我的平均值应该是(x+y)/2。我将这些平均值存储在一个单独的列中，该列是pandas数据帧的一部分。我正在寻找最好的方法，因为我的数据集有200多万行。我的数据如下。提前谢谢。 A B C 0 1 2 3 # = (1+2+3)/3 = 2 1 4 NaN 6 # = (4+6)/2 = 5 2 NaN 8 9 # = (8+9)/2 = 8.5

浏览 22提问于2018-06-23得票数 -1

回答已采纳

1回答

python:从过滤后的数据帧的平均值创建新的数据帧

、

我想过滤一个数据帧，计算各行的平均值，然后用这些平均值创建一个新的数据帧。在下面的例子中，我得到了“蓝色”和“红色”类型的平均值，按月计算平均值，然后创建一个以蓝色和红色为列，每月平均值为行的数据帧。我的问题是:有没有一种方法可以用循环来做到这一点？因此，例如，如果我有一个列表(在本例中是' blue '，' red ')，我是否可以遍历该列表以获取平均值，创建蓝色和红色数据帧，然后将它们连接起来？ import pandas as pd #CREATE GENERIC DATAFRAME df = {'account': ['Alph

浏览 1提问于2018-11-21得票数 0

1回答

Python Pandas DataFrame数据标识

、、、

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

2回答

Pandas数据帧每第n行重新采样一次

我有一个脚本，可以将系统日志文件读取到pandas数据帧中，并从这些数据帧生成图表。图表适用于较小的数据集。但当我面对更大的数据集时，由于更长的数据收集时间框架，图表变得太拥挤而无法辨别。我计划对数据帧进行重采样，以便如果数据集超过一定大小，我将对其进行重采样，以便最终只有SIZE_LIMIT行数。这意味着我需要过滤数据帧，这样每个n= actual_size/SIZE_LIMIT行都会聚集到新数据帧中的一行。agregation可以是平均值，也可以是第n行。我对熊猫不是很熟悉，所以可能错过了一些明显的方法。

浏览 2提问于2013-01-30得票数 4

回答已采纳

1回答

Pandas timeseries将周末替换为从周末平均值生成的值

、、

我有一个多列的pandas数据帧，每天都有行。现在，我想将每个周末替换为一行中的平均值。即(Fr，Sa，Su).resample().mean() --> (周末) 甚至不知道从哪里开始。提前谢谢你。

浏览 9提问于2018-12-16得票数 1

回答已采纳

1回答

从pandas数据帧返回X大小的块

、、

我有一个PANDAS数据帧，其中我想返回时间序列中每X个项目的函数--例如，我的数据帧可能如下所示 date value 2017-01-01 1 2017-01-02 5 2017-01-03 2 2017-01-04 1 2017-01-05 6 2017-01-06 6 因此，例如，如果我希望能够拉取X为3的每个X值的滚动平均值，我会希望数据帧显示 date value 2017-01-03 2.666 2017-01-04 2.666 2017-01-05 3 2017-01-06 4.333

浏览 2提问于2017-12-11得票数 0

1回答

查找至少某个值的第一个值

、

我在这上面花了几个小时，所以任何帮助都将是令人惊讶的！我有一个熊猫数据帧df。然后我按其中一列(A)分组，关注另一列(B)，并获得每组的平均值： group_mean = df.groupby('A').B.agg('mean') group = df.groupby('A').B 按照上面的顺序，以下是python报告的类型： <class 'pandas.core.series.Series'> <class 'pandas.core.groupby.generic.SeriesGroupBy&#

浏览 2提问于2021-09-04得票数 0

1回答

如何按条件计算每列的平均值

、、

我想要计算数据帧中每一列的平均值。假设我有一个这样的数据帧： import pandas as pd df = pd.DataFrame({'A':[1,2,3], 'B':[4,4,4], 'C':[7,8,9], 'D':[3,3,3]}) print(df) A B C D 0 1 4 7 3 1 2 4 8 3 2 3 4 9 3 我想得到平均值为2，1，8，1

浏览 0提问于2018-09-16得票数 0

1回答

计算数据帧的平均值、标准差和R中的百分比

、

我有一个结构如下的数据框架，dput(scoreDF) scoreDF <- structure(list(ID = c(1, 2), Status = structure(c(2L, 1L), .Label = c("Fail", "Pass"), class = "factor"), Subject_1_Score = c(100, 25), Subject_2_Score = c(50, 76)), .Names = c("ID", "Status", "Subject_1_Score&

浏览 0提问于2012-10-12得票数 0

1回答

Pandas数据帧和字典的深度副本

、、、

我正在创建一个小的Pandas数据帧： df = pd.DataFrame(data={'colA': [["a", "b", "c"]]}) 我把那个df拷贝了一遍。我使用的不是Pandas方法，而是通用Python，对吧？ import copy df_copy = copy.deepcopy(df) 一个df_copy.head()提供以下内容： ? 然后我将这些值放入字典中： mydict = df_copy.to_dict() 字典看起来是这样的： ? 最后，我删除了列表中的一项： mydict['colA&#

浏览 42提问于2020-01-10得票数 3

回答已采纳

1回答

创建一个每个值只有1行的新数据帧

、

我正在尝试用原始数据帧(Dataframe 1)中的行填充pandas数据帧(Dataframe 2)。我在下面创建了一个模拟的Dataframe 1： Ref Number Name 1 Alpha 2 Alpha 3 Alpha 4 Alpha 5 Beta 6 Beta 7 Beta 8 Charlie 我想删除在以前的行中出现值名称的行。也就是说，Dataframe 2应该如下所示 Ref Number Name 1

浏览 20提问于2017-07-07得票数 1

回答已采纳

2回答

如何在Pandas中使用groupby包含缺少的项目？

、

假设我有一个包含以下列的数据帧:日期、时间、日、月、年、描述、价格、类型、制造商使用pandas和value_counts()，我可以获得列中每个唯一项的计数： df.manufacturer.value_counts() 此外，使用groupby，我可以获得数据中每天的平均价格： df.groupby("day").price.mean() 问题是总共有7天，但在我的数据中可能只有5到6天，所以我需要添加缺少的天数，平均值为零或没有。通常，如果我有一个特定的列表，当我执行value_counts或groupby操作时，如何包含缺少的项？

浏览 1提问于2018-04-04得票数 1

1回答

如何在pandas数据框中组合一列中具有相同值的行

、、

我有一个2019-2020赛季NBA球员数据的pandas数据框架。有些球员的名字不止一次出现，因为他们整个赛季都在多个不同的球队踢球。我想组织数据帧，使每个球员的名字只出现一次，对于名字出现多次的球员，我想取其所有统计数据的平均值，并将其放入一行中。例如，如果有一个球员在3个不同的球队中比赛，并且连续出现在3行中，我希望将这3行合并到一行中，新行是这三行所有统计数据的平均值。以下是玩家名字多次出现的示例： ? 有什么简单的方法可以做到这一点吗？我不知道一个球员会出现多少次，我也不知道有多少球员的名字会出现多次。我希望迭代数据帧，并取具有相同球员名称的行的所有统计数据的平均值。

浏览 35提问于2021-01-23得票数 0

1回答

忽略nans计算pandas数据帧列的一部分的平均值

、、、、

我在计算pandas数据帧中列的一部分的平均值时遇到问题。我需要将我的数据框分成子窗口，并且我需要每个较小窗口的平均值。目前，我的代码如下所示： array2 = np.array([[x[:,0].mean()] for x in np.array_split(array1, 10)]) 因此，目前我将array1划分为10个子数组。现在我的问题是:出于某种原因，我将"nan“作为某些方法的解决方案。这可能是由于array1中必须有一些NaN值的原因。我怎么能只计算非nan值的平均值，而根本不从array1中删除nan呢？这个是可能的吗？非常感谢！：

浏览 0提问于2020-01-20得票数 0

2回答

如何在数据框中存储字典列表中的特定键值

、、、、

我一直在尝试将特定键的值存储到pandas数据帧中，该数据帧来自具有字典列表的另一个数据帧。有人能教我怎么做吗？？ source data frame result data frame

浏览 11提问于2021-02-08得票数 0

1回答

pandas绘制时间跨度聚合列

、

我正在尝试使用时间跨度绘制数据。我使用的是pandas数据帧，时间跨度足够直接，但在所有示例中，它们生成的数据都符合时间跨度。如何生成聚合列中数据以匹配时间范围的timespan图？目前，我正在将索引转换为时间序列，并将值绘制为列值，如下所示 series = pd.Series(df['value'], index=df.index) series.resample('12T',how='sum') series.plot() plt.show() 但是，值为0和1的值似乎不会取平均值，而是在图形中从0到1或相反，而不是在指

浏览 0提问于2016-06-13得票数 0

1回答

将函数应用于pandas数据帧中的组

、、、

我正在尝试将简单的函数应用于pandas中的组。我有此数据帧，我可以按type分组 df = pandas.DataFrame({"id": ["a", "b", "c", "d"], "v": [1,2,3,4], "type": ["X", "Y", "Y", "Y"]}).set_index("id") df.groupby("type").mean() # gets the me

浏览 0提问于2013-08-09得票数 10

回答已采纳

1回答

使用多个变量对熊猫数据帧进行重采样

、、

我有一个长格式的数据帧，其中包含几个变量的15分钟间隔的数据。如果我应用重采样方法来获得日均值，我会得到给定时间间隔内所有变量的平均值(而不是速度、距离的平均值)。有谁知道如何对数据帧进行重采样并保留两个变量？注意:下面的代码包含一个长格式的示例数据帧，我的真实示例从csv加载数据，并且变量具有不同的时间间隔和频率，因此我不能简单地以宽格式重新采样数据帧。 import pandas as pd import numpy as np dti = pd.date_range('2015-01-01', '2015-12-31', freq='15m

浏览 19提问于2021-11-08得票数 1

1回答

对pandas数据帧列表进行平均，其中哪些行应根据条件进行平均

、

假设dfList = [df0, df1, df2, df3, df4]是具有相同列和索引的pandas数据帧列表。我想要取它们的平均值，但是一些数据帧对于某些行来说是异常值。我有一个非异常值列表：myList = [ [0,1] , [1,2,3], [0,2,4] ]，显示应该为每行平均哪些数据帧。所以, result.iloc[0,:] = average( df0.iloc[0,:] , df1[0,:] ) result.iloc[1,:] = average( df1.iloc[1,:] , df2.iloc[1,:] , df3.iloc[1,:] ) result.ilo

浏览 11提问于2020-05-17得票数 0

回答已采纳

1回答

用分数秒计算平均时间

、、

我在一个pandas数据帧中有3列不同的时间戳，其中两列记录了几分之一秒，而第三列没有记录几分之一秒。我想计算这3列的平均值。我已经尝试使用列上的mean函数计算平均值，并始终收到nan作为结果 import pandas as pd data = [{'time1': '2018-07-22 04:34:10.8966', 'time2': '2017-07-22 04:34:10.8966', 'time3': '2018-07-27 00:10:04'}] df = pd.DataFram

浏览 15提问于2019-11-01得票数 1

5回答

TypeError:输入类型不支持ufunc 'isnan‘，请对NaN值使用输入器

、

我是python和pandas的新手。我正在尝试预处理一个包含数字和分类特征的大数据帧，并且在某些列中有NaN值。首先，我尝试获得特征矩阵，然后使用计算器将NAN值的平均值或中位数放入。这是数据帧 MSSubClass MSZoning LotFrontage LotArea Street LotShape LandContour \ 0 60 RL 65.0 8450 Pave Reg Lvl 1 20 RL 80.0 9

浏览 0提问于2018-02-27得票数 2