pandas多指数平均和分组_使用pandas计算指数移动平均_用pandas计算指数移动平均 - 腾讯云开发者社区

python、pandas

我对DataFrames和Pandas完全陌生。我有这样的数据： {"_kaats"：{“中位数”：15.783333333333333，“平均数”：613.08480293921173}，"ryanleslie"：{“中位数”：3921.4666666666667，“平均数”：7279.5321839080461} 我正试图将其转换为DataFrame，这样平均和中间值是行，名称是列。我目前的尝试如下： import pandas as pd df = pd.DataFrame(result_dict) print df 但它产生了不同的输出。有人能

浏览 0提问于2019-08-13得票数 0

回答已采纳

1回答

得到潘达斯的平均年份(数年的日数)

python、datetime、numpy、pandas、time-series

我对Pandas的timeseries和dataframes很陌生，并且很难完成这个简单的任务。我有一个数据集“数据”(一维浮动32-Numpy数组)，每天从1/1/2004 - 12/31/2008。日期存储为日期时间对象“日期”的列表。基本上，我想计算一个完整的“标准年”--所有年份(1-365)每天的平均值。我从类似的(?)问题()，但不能达到预期的结果--365个“平均”日的时间序列，例如1月1日和1月2日的平均时间序列。一个小示例脚本： import numpy as np import pandas as pd import datetime startdate = datet

浏览 2提问于2015-02-03得票数 8

回答已采纳

1回答

列中的重复行- python/pandas

python、pandas、dataframe、compare、rows

我最近开始使用python和现在的pandas来读取excel文件。我有点纠结于一个问题，我没有找到任何类似的例子。假设我有来自不同机器的不同分钟的数据。发生的情况是，一台机器有多个信息。例如，在下图中，如果考虑机器13.5，则在5 5分钟内有5个关于成本和温度的信息。我需要成本、温度和分钟信息的平均值，也就是说，每个machine.Considering只有一行。例如，我只需要一个输出来表示成本，即34，4(34+35+35+35+33/机器13.5)。下面是我的代码。 import pandas df = pandas.read_excel(

浏览 14提问于2021-11-03得票数 0

2回答

在groupby子句中，错误的含义是什么不能处理非唯一的多个索引？

python、pandas、unique、pandas-groupby、multi-index

我有一个数据，它有三个级别的索引，我希望计算一个值偏离平均值有多大。但根据我的指数，对于不同的群体，我有不同的平均值。这就是我试过的： In [4]: df['count'].groupby(level=[0,1,2]).apply(lambda x: x-np.mean(x)) 但是，我得到了一个错误，我在下面插入了堆栈跟踪。我不知道为何会有这样的问题。 Exception Traceback (most recent call last) <ipython-input-4-678992689ff2>

浏览 2提问于2016-03-17得票数 8

1回答

符合平均指数表

classical-cipher、index-of-coincidence

我正在寻找一个全面的名单，国际奥委会的价值，任何或所有古典密码。我找不到单子，只有碎片。每个密码都有一个平均的IOC值，我想知道是否有关于每个可用的经典密码的这些值的综合列表。有人能分享这些IOC值的列表吗？

浏览 0提问于2020-10-10得票数 0

2回答

计算MultiIndex DataFrame的平均值

python、pandas、dataframe

我必须根据该级别的行数来计算MultiIndex DataFrame的平均值。基本上，我必须对最后一列中的值求和，然后除以每个SKU_ID索引的每月行数，从而求出这些值的平均值。我如何在Pandas中继续？谢谢

浏览 0提问于2019-04-04得票数 0

3回答

DataFrames -平均列数

python、pandas、numpy、dataframe

我在pandas中有以下数据框架 Column 1 Column 2 Column3 Column 4 2 2 2 4 1 2 2 3 我希望创建一个数据帧，其中包含列1和列2，列3和列4的平均值，等等。 ColumnAvg(12) ColumnAvg(34) 2 3 1.5 1.5 我用的是这个，但它是所有东西的平均值。 df.mean(axis=1) 有没有办

浏览 40提问于2020-09-20得票数 3

回答已采纳

2回答

如何计算每个名称/位置的每月平均降雪量，然后将结果保存到Python的.CSV文件中？

python、pandas、csv、average

对于每个名称/位置，计算每月的平均降雪量。将结果保存在两个单独的.csv文件中(一个用于2016年，另一个用于2017年)，将文件命名为average2016.csv和verage2017.csv。 ? 我正在使用Python 3.8和pandas。我已经尝试过以下代码： import numpy as np import pandas as pd df = pd.read_csv('filteredData.csv') df['DATE'] = pd.to_datetime(df['DATE']) df['yea

浏览 26提问于2020-04-10得票数 0

1回答

利用.groupby和.resample对大熊猫数据进行操作

python-2.7、pandas

我在Pandas DataFrame中有一个时间序列，我的一列包含模型预测的每日残差。我想找出每个月的平均值，并从每一天的模型预测中减去这个月的平均值。有什么.groupby和.resample的组合，我可以用它来编码吗？ monthly_res = sve_DOC['sRes'].resample('M', how='mean') sve_DOC['RIMsDOC2'] = sve_DOC['RIMsDOC'] - monthly_res 我可以得到每月平均，但我不知道如何确保正确的每月平均使用在每一天的模型预测

浏览 8提问于2014-06-11得票数 1

回答已采纳

1回答

按行列的多指标分组

python、pandas、groupby

我使用Pandas创建了一个表，下面是这里提供的材料。创建的表使用了列和行的多个索引。 📷 我试图计算每一年和每一个主题的描述性统计数据，意思是，例如，显示Bob的2013年平均数，Guido的2013年平均数，以及Sue、所有科目和所有年份的平均值。鲍勃的手段将考虑人力资源和临时工的手段。注意:这些类型与巧合是相同的，因为对于实现的表来说并非如此。不包括在截图中的其他主题有不同的类型。我最近接触到的解决方案是通过下面的代码df.groupby(level = 0, axis = 0).describe()。然而，按年份分组的数据也没有按主题分组。

浏览 0提问于2022-01-29得票数 1

2回答

计算特定类别中高于或低于平均值的每行的百分比

python、pandas

我想知道如何通过Python计算每个类别的每一行是高于平均值还是低于平均值？我有一个名为test.csv的csv文件。例如，类别2，我有两个值。首先，我需要计算该类别的平均值，然后每个值是高于还是低于平均百分比。我不知道后者该怎么做。 import pandas as pd import numpy as np #loading the data into data frame X = pd.read_csv('test.csv') 感兴趣的两列是Category和Totals列： Category Totals estimates 2 2777 043

浏览 52提问于2021-09-12得票数 3

1回答

如何用groupby方法表示数据的平均值

python、pandas、dataframe、mean

我想在一个DataFrame中对我的变量做一个平均值，其中我已经将元素按列'A‘分组了。问题是，当我打印结果时，输出只是第一个变量列的平均值，为什么要这样做呢？ (B)编码； import pandas as pd file = open('C:/Users/Andre/Desktop/Python/introduction-datascience-python-book-master/files/ch03/adult.data', 'r') def chr_int(a): if a.isdigit(): return int(a)

浏览 0提问于2020-05-07得票数 1

回答已采纳

1回答

如何计算多索引熊猫数据中的平均值和扫描电镜？

python、pandas、multi-index

我在熊猫的数据中有一些数据，它有一个三重指数： Antibody Time Repeats Customer_Col1A2 0 1 0.657532 2 0.639933 3 0.975302 5 1 0.628196 2 0.663301 3 0.921025

浏览 3提问于2016-11-20得票数 0

回答已采纳

1回答

等值序列中奇异值的修正

python、pandas

我有一个包含月份和日数以及相应周期(温暖/寒冷/过渡)的df示例： import pandas as pd df = pd.DataFrame({'cycle':['transition'] * 10 + ['warm'] * 1 + ['transition'] * 3 + ['warm'] * 10}) 我想找单数值。在相等的连续10行之后(即。并为它们分配前一个字符串的值(即。如果它们后面跟着相同的序列(即。过渡)。谢谢!

浏览 1提问于2022-03-15得票数 0

4回答

用熊猫蟒蛇计算每日气候学

python、pandas、time-series

我试着用熊猫来计算每天的气候学。我的代码是： import pandas as pd dates = pd.date_range('1950-01-01', '1953-12-31', freq='D') rand_data = [int(1000*random.random()) for i in xrange(len(dates))] cum_data = pd.Series(rand_data, index=dates) cum_data.to_csv('test.csv', sep="\t"

浏览 4提问于2014-01-07得票数 7

回答已采纳

1回答

熊猫:按分位数分组并计算统计数据

python、pandas、grouping、quantile

我有99个人的年收入数据： import pandas, random incomes = pandas.DataFrame({'income':[round(random.triangular(20,80,200),0) for i in range(99)]}) 如何：将他们分成3个分位数，“贫穷”、“中等”、“富有”，每个分位数为的平均收入。抱歉，听起来像个新手的问题。我在学习。谢谢!

浏览 2提问于2020-06-09得票数 1

1回答

使用Pandas对整个数据集分组数据的问题计算平均值

python-2.7、pandas、group-by、mean

我有一组数据，每天的温度，我想计算20年的平均值。数据如下所示： 1974 1 1 5.3 4.6 7.3 3.4 1974 1 2 3.3 7.2 4.5 6.5 ... 2005 12 364 4.2 5.2 3.3 4.6 2005 12 365 3.1 5.5 2.6 6.8 文件中没有标题，但第一列包含年份，第二列包含月份，第三列包含年度的日期。其余的列是温度数据。我想计算20年内每天的平均温度。我认为最好的方法是将数据按日分组，并计算特定年份内每一天的平均值。这是我的代码： import pandas as pd hist

浏览 2提问于2017-04-10得票数 0

回答已采纳

1回答

将任意函数应用于熊猫DataFrameGroupBy对象的有效方法？

python、pandas

我有一个“id”列和许多其他列的dataframe。对于每个id，我需要使用来自相应行的数据来计算许多特性。这些特性可以是复杂的函数，而不是简单的聚合。优选地，应相对有效地计算特征，并以透明的方式，即如何从数据中计算特征，应在一个地方定义。我会在下面这样做--例如，在字典中定义如何计算特征，然后使用该字典和groupby (可能会并行化groupby循环)。这是一个合理的方法，还是可以提高效率？ import pandas as pd example_data = pd.DataFrame({ "id": [1, 2, 2, 3], "a"

浏览 1提问于2022-03-08得票数 0

回答已采纳

3回答

有效保存加权移动平均的数据结构/算法

algorithm、data-structures、moving-average、weighted-average

在存储日志记录时，我想总结一些不同类别的移动平均值。想象一下，一次保存web服务器日志一个条目的服务。让我们进一步想象一下，我们无法访问记录在案的记录。所以我们见过他们一次，但以后没有机会接触到他们。对于不同的页面，我想知道总点击次数(轻松)a“最近”平均(大约一个月左右)a“长期”平均(超过一年) 是否有任何聪明的算法/数据模型允许保存这样的移动平均值，而不必通过总结大量的数据来重新计算它们？我不需要确切的平均值(确切的30天左右)，而只需要趋势指标。所以有些模糊性根本就不是问题。它应该确保较新的条目比较旧的条目更高。一个解决方案可能是自动创建每个月的统计记录。然而，我甚至不需要过去

浏览 3提问于2011-11-21得票数 3

回答已采纳

1回答

使用熊猫计算最大/最小变化

python、pandas

假设我有一个包含过去三年的职称和薪水的数据集，我想要计算第一年到最后一年平均工资的差额。使用Pandas，我会怎么做呢？我已经成功地创建了一个df，其中包含了每年的平均薪资，但我想我想要做的是：“对于数据科学家，用2020年的平均工资减去2022年的平均工资”，然后遍历所有做同样事情的job_titles。 work_year job_title salary_in_usd 0 2020 AI Scientist 45896.000000 1 2020 BI D

浏览 1提问于2022-09-20得票数 0

回答已采纳

1回答

按月分组Pandas DataFrame以获取分发服务器名称

python、dataframe、pandas-groupby

我有一个数据文件，看起来如下: 1：本质上，有一个分发服务器名称列、一个sales列和一个MM/DD/YYYY日期列。对于每个经销商，按月计算，我要销售总额。我尝试了什么: df =df.groupby(df‘’Distributor Name'，df.Date.dt.month)‘Sales’..sum() 这会引发一个错误。“无与伦比的类型:系列”。当我删除经销商名称时，这是可行的，但我不只是想要每月的整体销售。我要按经销商每月的销售额。提前谢谢！！乔尔

浏览 1提问于2022-04-27得票数 0

回答已采纳

4回答

AdvancedDatagrid和DataGrid之间的Flex区别？是否支持脚注行？

apache-flex、advanceddatagrid

普通DataGrid和AdvancedDatagrid有什么区别？即使在普通的数据网格中，也支持排序、拖动列、调整列大小。我想添加页脚细节，如夏季，平均等每一列。AdvancedDataGrid是否支持这些功能？

浏览 10提问于2010-05-19得票数 4

1回答

如何使用Ta-lib或Pandas正确计算股票的EMA？

python、pandas、ta-lib

编辑！对于任何想知道同样的事情的人，我都想通了。下面的实现没有任何问题。事实是，EMA需要超过21个数据点来计算20个数据点的指数移动平均值。这样做的原因是，较早的数据点会影响您试图计算的数据点。简单地说，我测试了一下，您需要大约40-50个数据点才能获得与100+数据点相同的20天EMA。我试图计算股票的指数移动平均线( EMA )，但我的计算有问题。我已经为AAPL导出了最近22+天的股票数据，当我尝试计算该数据的均线均值时，每次都会出现错误。以下是我的示例中的数据： https://pastebin.com/raw/2MsgCeQx 以下是我试图计算20天均线的解决方案。 #Im

浏览 303提问于2019-04-30得票数 10

1回答

在滚动函数熊猫中使用时间的错误

python、pandas

我正在计算平均值，即每10秒的移动平均值，比如1到10秒，11秒到20秒等等。在这个下面吗？在滚动函数中使用“60秒”时会出现错误，我认为这可能是由于字符串类型的"ltt“列造成的，我正在将其转换为datetime，但仍然会出现错误。如何解决此错误？以及如何对每10秒采集的样本进行平均处理。这是即将到来的流数据，但是为了测试目的，我在record1中使用静态数据。 import pandas as pd import numpy as np records1 = [ {'ltt': 'Mon Nov 7 12:12:05 2022', '

浏览 1提问于2022-11-08得票数 -1

回答已采纳

1回答

带15%上限的熊猫指数移动平均点对点

python、python-3.x、pandas、moving-average、exponential

我可以使用这段代码在Pandas中计算指数移动平均值： df['ewm_40'] = df['response'].ewm(span=40, adjust=True).mean() 当存在一些不稳定的数据点时，指数移动平均值可能会急剧增加，这是不可取的。，我如何限制指数移动平均，使任何点移动超过15%，从前一点？，我想平衡的稳定性，同时仍然反映新的数据。

浏览 9提问于2022-09-15得票数 0

1回答

查找多个字段的平均值

python、pandas、pandas-groupby

我正在试着找出一种用python对特定的东西进行编码的方法。我正在使用csv数据集，该数据集与以下列一起运行:年龄、性别、bmi、费用、吸烟者、儿童数量。我的问题是，有没有一种方法可以找到BMI的平均值，其中性别等于男性或女性？我知道使用pandas将会给出所有列的平均值： mean_age = df["age"].mean() 我已经尝试过了(我认为这不会起作用)： mean_age = df["age"].mean(on "sex" = "male") 以及 mean_age = df["age"].mea

浏览 14提问于2019-06-26得票数 0

1回答

每组中n个最大值的平均值

python、pandas、pandas-groupby

假设我有一个名为df的数据框架，如下所示： id x y 1 10 A 2 12 B 3 10 B 4 4 C 5 9 A 6 15 A 7 6 B 现在我想将数据按y列分组，并得到每个组的2个最大值(x)的平均值，其结果如下 y A (10+15)/2 = 12.5 B (12 + 10)/2 = 11 C 4 如果我试着用df.groupby('y')['x'].nlar

浏览 0提问于2018-02-04得票数 3

回答已采纳

1回答

如何实现我自己的describe()函数，以便在resample()中使用

python、pandas

我正在处理表示向量(幅度和方向)的时序数据。我想要我的数据，并使用describe函数作为how参数。但是，describe方法使用标准平均值，我想使用一个特殊的函数来平均方向。因此，我在pandas.Series.describe()实现的基础上实现了我自己的describe方法 def directionAverage(x): result = np.arctan2(np.mean(np.sin(x)), np.mean(np.cos(x))) if result < 0: result += 2*np.pi return result d

浏览 1提问于2013-02-13得票数 5

回答已采纳

2回答

如何为每个外键获取SQL AVG()

mysql

我有一张桌子，上面有一堆收视率。每个评级都有一个名为"i_id“的外键，将其链接到特定的机构。当然，有很多评级，而且其中很多评级都是相同的i_id。我想知道是否有任何方法可以使用AVG() SQL函数来获得每个i_id的所有评分的平均值。这个查询是我尝试过的： SELECT AVG(rating), i_id FROM `health_rating` WHERE 1 但我得到的结果是表中所有评级的单一平均值，而不考虑i_id。 ? and this is the single result i am getting.

浏览 22提问于2019-06-28得票数 0

2回答

每小时15分钟间隔csv数据的平均值

python、pandas、pandas-resample

我在csv文件中的数据是15分钟平均，我希望每小时平均。当我使用下面的代码时，它会显示错误。“怎么”不被认可的论点。 import pandas as pd df = pd.read_csv("sirifort_with_data.csv",parse_dates=['Time_Stamp']) data.resample('H', how='mean')

浏览 1提问于2022-03-04得票数 1

2回答

按列名分组

python、pandas

在根据列名对列进行分组之后，我尝试对它们进行平均化。下面生成了一个示例dataframe。在_之前具有相同字符串的所有列名都需要在一起进行平均。输出将是一个10x3列。 from pandas import DataFrame import numpy as np df = DataFrame(np.random.randint(0,100,size=(10, 7))) df.columns = ['9_0', '9_1', '99_0', '99_1', '99_2', '999_0', &#

浏览 0提问于2018-02-27得票数 1

回答已采纳

2回答

对MultiIndex Pandas系列执行聚合

python、pandas、pandas-groupby

我想对一个多索引的pandas序列执行聚合，如下所示： revenue = date person shift 2017-10-19 Adams A 298.70 Smith B 593.46 B_Overtime 77.71 2017-10-20 Conner A 473.08 Adams B 441.35

浏览 0提问于2018-02-01得票数 0

4回答

熊猫计算ewm是错误的吗？

pandas、exponential、moving-average

当试图从数据帧中的金融数据计算指数移动平均(EMA)时，Pandas的ewm方法似乎是不正确的。下面的链接很好地解释了基础知识：转到Pandas解释时，采取的方法如下(调整参数为False)： weighted_average[0] = arg[0]; weighted_average[i] = (1-alpha) * weighted_average[i-1] + alpha * arg[i] 在我看来这是不正确的。arg应该是(例如)收盘值，然而，arg是第一个平均值(即所选周期长度的第一系列数据的简单平均值)，而不是第一个收盘值。因此，arg和argi永远不能来自相同的数

浏览 16提问于2016-06-20得票数 15

1回答

熊猫:计算时间框架内的平均值

python、python-3.x、pandas

我正在开发一个大型数据集，如下所示： Time, Value 01.01.2018 00:00:00.000, 5.1398 01.01.2018 00:01:00.000, 5.1298 01.01.2018 00:02:00.000, 5.1438 01.01.2018 00:03:00.000, 5.1228 01.01.2018 00:04:00.000, 5.1168 .... , ,,,, 31.12.2018 23:59:59.000, 6.3498 数据是从一年中的minute日到一年中的last日的一个last数据。我想使用Pandas来找出每个5日的平均值

浏览 1提问于2019-06-27得票数 3

回答已采纳

1回答

如何为列的每个桶找到平均值

python、dataframe、mean

我有一个数据框架如下： import pandas as pd df = {'A':[1.06, 1.01, 0.99, 0.98, 1.05, 0.96], 'B':[2, 7, 22, 7, 15, 16]} df = pd.DataFrame(df) 我想找出A栏中每个垃圾桶B栏的平均值。例如，如果我想在A列中创建最小值为0.02的回收箱，那么回收箱将如下(包括)： 1) 0.96-0.98 2) 0.99-1.01 3) 1.02-1.04 4) 1.05-1.07 每个垃圾箱的平均数将是 1) (16+7)/2 = 11.5 2) (7+22)/2

浏览 2提问于2022-08-09得票数 0

2回答

按地点和日期/月分列的Python Pandas平均数

python、python-3.x、pandas

使用:Python3.6，Pandas 0.22 我有一个.csv文件，我需要根据这个月和位置得到一个平均值。这是数据中的一行，有更多的多个位置和日期： NAME DATE SNOW GRAND RAPIDS GERALD R FORD INTERNATIONAL AIRPORT, MI US 1/1/2016, 0.7 到目前为止，我已经成功地根据月和平均每月对信息进行了排序： df2 = pd.read_csv("Data.csv") gname = df2.groupby('NAME') for NAME, NAME_df2 in gnam

浏览 0提问于2018-02-24得票数 2

回答已采纳

1回答

如何使用pandas中的公共列查找多个列的平均值

pandas、pandas-groupby、mean

如何使用'count‘列计算所有列的平均值。我在下面的代码中使用随机生成的值创建了一个数据帧。 import pandas as pd import numpy as np df = pd.DataFrame(np.random.rand(10,10)*100/10).astype(int) df output: A B C D E F G H I J 0 4 3 2 8 5 0 9 9 0 5 1 1 5 8 0 5 9 8 3 9 1 2 9

浏览 10提问于2020-06-05得票数 1

回答已采纳

1回答

如何找出由Python Pandas赢得比赛的平均时间

python-3.x、pandas、statistics

所以，正如在dataframe中所看到的，有3场比赛。我想找出每一场比赛第一名和第二名之间的时差，然后输出的是每一场比赛的平均成绩。 import pandas as pd # initialise data of lists. data = {'Name':['A', 'B', 'B', 'C', 'A', 'C'], 'RaceNumber': [1, 1, 2, 2, 3, 3], 'PlaceWon':['First', &

浏览 4提问于2022-01-05得票数 0

回答已采纳

1回答

使用MultiIndex实现数据帧中两个字段的分组和求和

python、python-3.x、pandas、header、pandas-groupby

我正在尝试做一个GroupBy和Sum，但这有点棘手，因为我认为我需要基于数据框中的两个头来做这件事。我需要在一个特定的数据帧中有两个头，所以我会相应地设置它。 df = pd.read_csv(f, delimiter='\t', skiprows=0, header=[0,1]) 当我列出我的数据框中的所有字段时，我看到了以下内容。 my_list = list(df_append) my_list 然后..。 [('IDRSSD', 'Unnamed: 0_level_1'), ('RCFD3531',

浏览 23提问于2021-01-16得票数 0

回答已采纳

3回答

基于Max的MySQL查询优化组

database、database-design、group-by、query-optimization、groupwise-maximum

尝试优化MySQL查询，该查询使用Group和Max。试图获得最新更新的框架，这些框架在任何过去的日期之前都是活动的。审计框架表结构： id bigint pk AI frame_id bigint fk name VARCHAR(50) active int createdOn DATETIME updatedOn DATETIME deletedOn DATETIME id、frame_id和updatedOn有单独的索引。当前查询： SELECT MAX(id) as id1 FROM audit_frame_master WHERE updatedOn <='

浏览 3提问于2019-03-25得票数 0

回答已采纳

1回答

将MultiIndex列与Pandas/Python中类似的根名组合起来

python、pandas、grouping、multi-index

我有一个包含顶级列的MultiIndex数据文件名为： Col1_1，Col1_2，Col，2_1，Col，2_2，2_2，. 我希望将Col1_1和Col1_2合并为Col1。在创建MultiIndex之前，我也可以这样做，但是原始数据更像是： Col1_1.aspect1，Col1_1.aspect 2，Col1_2.aspect1，Col1_2.aspect1，Col1_2.aspect2，. 其中'aspect1‘和'aspect2’成为MultiIndex中的子列。如果我能澄清任何事情，请告诉我，并提前表示感谢。预期的结果将两者合并为Sa

浏览 0提问于2017-01-26得票数 1

1回答

如何在Python中使用pandas请求多个变量时对数据框进行排序

python、pandas、dataframe、csv、group-by

我正在尝试使用已经使用Python与Pandas和Numpy组织的数据帧(.csv)文件来查找在IA的每个县销售的火球肉桂威士忌的平均加仑数量。我是Python的新手，还在学习中。我已经试过了 IALiquor.groupby(["Item Description"])["Volume Sold (Gallons)"].mean()["Fireball Cinnamon Whisky"] 但这只给出了"Fireball Cinnamon Whisky“售出的平均值，而不是按输出单个数字的县进行排序。我也试过这个 IALiquor.g

浏览 17提问于2020-12-06得票数 0

回答已采纳

1回答

按行列的多指标分组

python、pandas、aggregate

我使用Pandas创建了一个表，下面是提供的材料。创建的表使用了列和行的多个索引。我试图计算每一年和每一个主题的描述性统计数据，意思是，例如，显示Bob的2013年平均数，Guido的2013年平均数，以及Sue、所有科目和所有年份的平均值。鲍勃的手段将考虑人力资源和临时工的手段。注意:这些类型与巧合是相同的，因为对于实现的表来说并非如此。不包括在截图中的其他主题有不同的类型。我最接近的解决方案是通过下面的代码df.groupby(level = 0, axis = 0).describe() (按年将数据分组)，但是，也没有按主题分组。

浏览 4提问于2022-01-28得票数 2

回答已采纳

1回答

几何平均的安全计算

floating-point、average、precision、numerical-methods

我正在寻找一个理由来选择以下方法之一来计算长系列浮点x的几何平均值取每个x的第n根，然后将它们相乘。把它们全部乘以，然后取第n根。我听说，对于浮点数，乘法和除法损失的信息比加法和减法少。因此，我不考虑和指数技巧。我应该通过1或2计算几何平均值，为什么？更新1，回应评论意见：所有x均小于1，且精度为双精度。它们的数量级在10^-1到10^-6之间。请假定最常用的计算n根的方法，因为我使用的是编程语言的内置函数。我担心的不是溢流，而是溢流。因为所有的值都小于1，所以您可以假定x序列的长度是10^8。

浏览 1提问于2016-06-09得票数 2

回答已采纳

4回答

使用xarray进行一年的操作

grouping、python-xarray

我想在xarray上计算年份的平均值(和分位数)。如果时间采样是天的倍数，我可以很容易地做这样的事情： arr.groupby('time.dayofyear').mean('time') 但是，如果我还有几个小时的时间，我找不到一种简单的方法来做同样的事情。(现在我使用了一个可怕的技巧)。例如，在本例中： import numpy as np import pandas as pd import xarray as xr time = pd.date_range('2000-01-01', '2010-01-01', fr

浏览 3提问于2018-05-24得票数 0

1回答

尝试用python绘制引人注目的分类结果图

python、classification、visualization

我一直在研究一个分类问题，并取得了一些好的结果，但是现在我很难想出一个很好的方法来说明每个预测的概率。以下是我目前的数据： import numpy as np import pandas as pd import matplotlib.pyplot as plt df_voting_output.head(n=5) prob actual pred correct 0 0.460200 0 0 1 1 0.548478 1 1 1 2 0.270609 0 0 1 3 0.686557 0 1 0

浏览 0提问于2017-05-28得票数 4

回答已采纳

2回答

Pandas数据帧:按两列分组，然后在另一列上求平均值

python、pandas、group-by、average

假设我有一个具有下列值的dataframe： df: col1 col2 value 1 2 3 1 2 1 2 3 1 我想首先根据前两列(col1和col2)对我的数据帧进行分组，然后对第三列(value)的值进行平均。因此，所需的输出将如下所示： col1 col2 avg-value 1 2 2 2 3 1 我使用了以下代码： columns = ['col1','col2','avg'] df

浏览 0提问于2016-02-24得票数 14

回答已采纳

1回答

使用Pandas/Python获取每年大于日平均值的平均天数

python、pandas

假设我创建了以下Pandas系列，其中包含三个不同站点10年来的一些每日测量数据 import numpy as np import pandas as pd stations = ['a', 'b', 'c'] dates = pd.date_range(start = '2000-01-01', end = '2009-12-31') index = [(stations[i], dates[j]) for i in range(len(stations)) for j in range(len(

浏览 0提问于2021-09-24得票数 0

1回答

Python Pandas -使用来自两列的条件计算平均值

python、pandas

我正在尝试使用其他两个列的选择标准来计算Pandas数据框列的平均值。在下面的代码中，"Trace“和"Sample”列将用于选择条件，而"Value“列中的数字将用于计算。我想按"Trace“编号分组，只取"Sample”编号3、4和5的平均值。然后，我想在原始数据帧"df“中创建一个新列，并将计算出的平均值放在与正确的"Trace”编号相对应的所有行中。 d = {"Trace": [1,1,1,1,1,2,2,2,2,2], "Sample": [1,2,3,4,5,1,2,3,4,5], "

浏览 10提问于2018-08-01得票数 2

回答已采纳

1回答

创建包含旧dataframe中某些列的平均值的新dataframe。

python、pandas、dataframe、data-processing

我有一个从csv文件中提取的数据。我想迭代一个数据进程，其中只有一些列的数据是n行的平均值，而其余的列是每个迭代的第一行。例如，从csv提取的数据由100行6列组成。我有一个变量n_AVE = 6，它告诉代码将数据平均为每6行。 rawDf = pd.read_csv(outputFilePath / 'Raw_data.csv', encoding='CP932') OUT: TIME A B C D E 0 2021/3/4 148 0 142

浏览 7提问于2022-03-11得票数 1

回答已采纳