在pandas df中查找timedelta对象的平均值和标准差

文章/答案/技术大牛

发布

4回答

、、、、

我想从一个包含以下两列的dataframe中计算timedelta by bank的mean和standard deviation。当我运行代码(如下所示)时，我得到以下错误： pandas.core.base.DataError: No numeric types to aggregate 我的数据帧： bankFederal Reserve 8 days 13:27:11.387000 我的代码： means = dropped.groupb

浏览 84提问于2017-06-18得票数 27

回答已采纳

1回答

使用seaborn绘制来自外部数据源的标准差

、、、

我正在尝试通过seaborn可视化线条图，在其中我想要绘制一列的平均值和标准差。因为我使用的是大文件(有数百万行)，所以绘图需要一段时间才能加载。为了减少计算时间，我预先计算了列的平均值和相应的标准差。随后，我使用这些预先计算的数据作为线图的输入，而不是提供完整的Pandas数据帧。这是我目前使用的代码： df

浏览 11提问于2019-11-30得票数 2

回答已采纳

1回答

获取Pandas中多个列的加权平均值和标准差

、、、、

我正在尝试在我的pandas数据帧上的加权平均值上做加权标准差。我有一个pandas数据框架，如下所示：import pandas as pd "V3"

浏览 19提问于2018-01-18得票数 1

回答已采纳

1回答

添加一个新的pandas数据框列，用条件计算填充它(均值if，标准差if)

、、、、

我需要向Pandas数据框添加2列，其中填充了条件平均值和标准差。df 在本例中，我只需要在名称和颜色中添加两列：df['mean']和df['std'] conditional。我查看了.mean()和.std()文档，但没有找到添加一组条件的方法。我认为我可能需要两个函数，对于每一行，将名称和

浏览 50提问于2019-07-04得票数 1

1回答

Python:回顾n天滚动标准差

、

关于轧制标准差的处理，我有一个问题：2010-01-20 05:00:00 -0.0112010-01-20 05:分钟数据(索引‘yyyy:mm:ss’的格式是日期标记) 我想计算一下8天后的标准差。我的直觉是将数据框架分解成日常数据集，然后计算滚动标准差，但我不知道如何处理这些指标，我想我的方法可能需要很长时间来计算。非常感谢你的帮助！@unut

浏览 1提问于2015-03-17得票数 2

回答已采纳

1回答

去除python数据帧中的离群值

、

我想使用Python语言中的均值和标准差来去除DataFrame的异常值。但我想让它成为na，而不是简单地删除离群值。然后我想以Dataframe的形式再次保存它。这是我的问题。我不关心我是否能以任何方式解决我的问题，如果不是以下方式的话。df_group = df.groupby('count')df</

浏览 25提问于2020-12-14得票数 0

2回答

使用Pandas求和TimeField小时/分钟

、、

我正在尝试使用Pandas对一系列的时间(小时、分钟)求和。数据来自TimeField class PhoneRecord ( models.Model ): df.et = df.et.filln

浏览 23提问于2019-03-02得票数 1

回答已采纳

1回答

解释正态分布的Y值

、、、

我编写了这段代码来生成一组值1、2、3的正态分布：import randomprint(df)df.plot(kind='hist', normed=True, ax=ax) X值是可能值的范围，但Y值是如何解释

浏览 2提问于2017-03-22得票数 0

回答已采纳

1回答

如何为Pandas* Dataframe创建更多的随机行？*

、、、

假设我有一个只有一行的Pandas Dataframe，它看起来像这样： Column1 Column2 ......但是，我希望它在数学上和逻辑上是连贯的，例如，生成的10多行遵循正态分布(尽管问题是只有1行)，但不希望所有行都相同。有没有什么合适的方法可以基于这一行生成更多的随机行，这样这些行就不仅仅是普通的重复行了？

浏览 16提问于2019-06-06得票数 0

1回答

与工作日和周末的偏差表示数据帧中的每日数据

、

我有一些每日数据，我希望计算每个数据点与其月平均值的偏差，但我希望区分工作日和周末之间的月平均值。以下是一些示例数据：import numpy as npdate_today= datetime.now() days = pd.date_range(date_today, date_today + timedelta(100),

浏览 18提问于2020-05-29得票数 0

1回答

Pandas的时间加权平均值

、、

在Pandas0.8中计算TimeSeries的时间加权平均值最有效的方法是什么？例如，假设我想要df.y - df.x的时间加权平均值，如下所示：import numpy as np times = np.datetime64('2012-05-3114:00') + np.timedelta64(1, 'ms'

浏览 6提问于2012-06-01得票数 10

1回答

Pandas数据帧分组和标准差

、

给定以下格式的pandas数据帧：1 | 0.02|1.12 | 1.88 | 3.23 | 3.02|1.12 | 1.98 | 2.2我如何才能找到每组的平均标准差例如，group by groupNo，查找该组号中属性的</em

浏览 0提问于2016-12-07得票数 2

回答已采纳

4回答

仅使用pandas中的某些列计算行的平均值

、、

我有一个pandas数据帧，每行包含5个分数，然后是这5个分数的标准差。使用df['std'] = df.std(axis=1, ddof=0)可以很容易地计算出这一点。但是，当我还想添加这5个分数的平均值时，我不知道如何在计算中排除std列？使用df['mean'] = df.mean(axis=1)会导致pandas在计算平均值时使用5分

浏览 255提问于2021-10-27得票数 0

回答已采纳

1回答

分组数据并按组计算标准化标准差？

、

0.42591622504 0101010I0AA 0.633082df'0101010I0AA'], 'cost_per_quantity': [160.788357, 179.493956, 0.425916, 0.603650, 0.633082]}) 现在我想找到在cost_per_quantity中变化最大的产品。例如，我想检查产品0101010I0AA，

浏览 0提问于2016-04-04得票数 2

回答已采纳

3回答

查找四行的均值、计数和标准差

、、

我正在计算pandas数据帧中4行的平均值、观察值和标准差。现在，我正在制作一个新的数据帧，但肯定有比使用四行更简单的方法？我想我可以使用groupby，然后使用agg，但是我一直无法使它工作。stats = pd.DataFrame()stats["count"] = df.count(axis=1) stat

浏览 2提问于2019-10-22得票数 0

1回答

python: pd.rolling_std函数结果与标准差计算器不同

、、

这里有如下数据框架，我想要计算关闭列:波动率，例如window=2，即两行的波动率。：stdDeviation.head(4) Date2010-06-11 24.748737Name: Close, dtype: float64 但是当用计算器计算标准差时我找到了前两个数字: 3160

浏览 40提问于2017-07-04得票数 0

回答已采纳

1回答

类型推断: df.append()对df.loc[]

、

让我们创建一个空的DataFrame：如果我们将数据添加到df和df.append()中 df = df.append({'member': 'some_string', 'total': pd.<e

浏览 2提问于2016-01-12得票数 1

回答已采纳

1回答

Pandas:在[25%和75%]范围内计算平均值和标准差

我有以下代码，它为我的数据帧计算一些聚合： def percentile_(x): return percentile_ df_type = df[['myType', 'required_time']].groupby然而，现在我只想使用25%和75%之间的数据

浏览 2提问于2018-09-27得票数 0

2回答

Python : TypeError:不支持的操作数类型为+：'datetime.time‘和'Timedelta’

、、、、

我试图在熊猫的数据中添加两个系列，第一个系列是从excel文件导出的24小时时间值(例如17:30)，第二个系列是用“pd.Timedelta”命令从浮点数转换而来的长度相同的Timedelta格式的系列我创造了这样的三角洲系列： for j in range(0, len(

浏览 5提问于2017-04-19得票数 16

回答已采纳

1回答

Pandas -跨多列扩展Z-Score

、、

我想要为DataFrame中的一些时间序列数据计算扩展的z得分，但我想使用多列的平均值和标准差来标准化数据，而不是使用每列中单独的平均值和标准差。以下是一些示例数据：import numpy as np df = pd.DataFrame(np.random.ran

浏览 2提问于2017-07-12得票数 0

点击加载更多