文章/答案/技术大牛

发布

社区首页 >问答首页 >Python:计算需要从数据帧中分组的值的5年滚动CAGR

问Python:计算需要从数据帧中分组的值的5年滚动CAGR
EN

Stack Overflow用户

提问于 2019-09-28 02:08:52

回答 2查看 1.6K关注 0票数 1

我有一个包含历史市值的数据框架，我需要计算它们的5年复合年增长率(CAGR)。但是，dataframe有数百家公司，每家公司的价值都是20年，所以我需要能够隔离每个公司的数据来计算它们的CAGR。我该怎么做呢？

计算复合增长率的函数是：(end/start)^(1/# years)-1。我从未使用过.groupby()或.apply()，因此我不知道如何实现滚动值的复合增长率方程。

下面是部分数据帧的屏幕截图，这样您就可以直观地表示我正在尝试使用的内容：Screeshot of dataframe.

任何指导都将不胜感激！

pandas

pandas-groupby

apply

rolling-computation

python

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-09-28 02:50:32

假设每个公司每年有1个价值。您可以将日期减少为年份。这要简单得多。不需要groupby或apply。

假设您的数据帧名为df。首先，将日期减少到年份：

df['year'] = df['Date'].dt.year

第二，添加year+5

df['year+5'] = df['year'] + 5

第三，将'df‘与自身合并：

df_new = pandas.merge(df, df, how='inner', left_on=['Instrument', 'year'], right_on=['Instrument','year+5'], suffixes=['_start', '_end'])

最后，计算滚动CAGR

df_new['CAGR'] = (df_new['Company Market Cap_end']/df_new['Company Market Cap_start'])**(0.2)-1

票数 1

Stack Overflow用户

发布于 2020-07-02 19:12:50

设置一个玩具示例：

import numpy as np
import pandas as pd

idx_level_0 = np.repeat(["company1", "company2", "company3"], 5)
idx_level_1 = np.tile([2015, 2016, 2017, 2018, 2019], 3)
values = np.random.randint(low=1, high=100, size=15)

df = pd.DataFrame({"values": values}, index=[idx_level_0, idx_level_1])
df.index.names = ["company", "year"]
print(df)

               values
company  year        
company1 2015      19
         2016      61
         2017      87
         2018      55
         2019      46
company2 2015       1
         2016      68
         2017      50
         2018      93
         2019      84
company3 2015      11
         2016      84
         2017      54
         2018      21
         2019      55

我建议使用groupby对单个公司进行分组。然后，您可以通过lambda函数应用您的计算。结果基本上是一行代码。

# actual computation for a two-year period
cagr_period = 2
df["cagr"] = df.groupby("company").apply(lambda x, period: ((x.pct_change(period) + 1) ** (1/period)) - 1, cagr_period)
print(df)


               values      cagr
company  year                  
company1 2015      19       NaN
         2016      61       NaN
         2017      87  1.139848
         2018      55 -0.050453
         2019      46 -0.272858
company2 2015       1       NaN
         2016      68       NaN
         2017      50  6.071068
         2018      93  0.169464
         2019      84  0.296148
company3 2015      11       NaN
         2016      84       NaN
         2017      54  1.215647
         2018      21 -0.500000
         2019      55  0.009217

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/58139544

复制

相似问题

问Python:计算需要从数据帧中分组的值的5年滚动CAGR
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:计算需要从数据帧中分组的值的5年滚动CAGREN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Python:计算需要从数据帧中分组的值的5年滚动CAGR
EN