我需要计算每组的百分比(从A到G),并使用六个不同的列除以相同的一列(如G表示总数)。然后我需要计算一个叫做HHI的东西。我的等式在sigma符号前面有一个"1-“。因此,我需要将这些列平方,然后将它们相加,然后使用1减去加法。我需要将这些百分比列保留在我的数据框中。请帮我简化一下以下代码:
df = pd.DataFrame(np.random.randn(20, 7), columns=list("ABCDEFG"))
#percentage
df["pct_A"] = df_race.A / df_race.G
df["pct_B"] = df_race.B / df_race.G
df["pct_C"] = df_race.C / df_race.G
df["pct_D"] = df_race.D / df_race.G
df["pct_E"] = df_race.E / df_race.G
df["pct_F"] = df_race.F / df_race.G
#HHI Index
df["hhi"] = 1-(df.pct_A**2 + df.pct_B**2 + df.pct_C**2 +
df.pct_D**2 + df.pct_E**2 + df.pct_F**2)
发布于 2018-06-11 08:24:56
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(20, 7), columns=list("ABCDEFG"))
我通常使用的是(我的数据集包含缺少的值):
df.iloc[:, 0:6] = df.iloc[:, 0:6].apply(lambda x: x/df.G)
df["hhi"] = 1 - df.iloc[:, 0:6].apply(lambda x: x**2).sum(skipna=False, axis=1)
https://stackoverflow.com/questions/50743855
复制相似问题