我有一个数据框架与名称,类型,和营业额每个游戏。下面给出了该df的一个示例。
Name Type Turnover per game
kevin A 5
duke B 10
jonas A 12
angly A 2
anjelo B 10
wily A 4
nick A 8我想做的是实现一个假设检验来验证,A型球员的平均失误比B型球员少。。
我试过的是:
第一,按类别分组:
df.groupby('Type').mean()但我不知道如何实施假设检验来检验上述情况。
发布于 2021-01-07 09:24:40
import pandas as pd
from scipy import stats
data = {'Name': ['kevin', 'duke', 'jonas', 'angly', 'anjelo', 'wily', 'nick'],
'Type': ['A', 'B', 'A', 'A', 'B', 'A', 'A'],
'Turnover': [5, 10, 12, 2, 10, 4, 8]}
df = pd.DataFrame(data)
t,p = stats.ttest_ind(df.Turnover[df.Type.eq('A')], df.Turnover[df.Type.eq('B')],
equal_var=False, alternative='less')
if p < 0.05:
print('Type A players have average less turnovers than Type B players')
else:
print('Null hypothesis (equal means) cannot be rejected.')在您的示例中,类型A和B球员具有相同的失误的空假设将被拒绝,而A类型球员的平均失误少于B球员的替代假设将被接受。有关详细信息,请参阅上述链接Wikepedia文章中的解释部分。
发布于 2021-01-07 09:36:31
你提到的假设检验,如果我理解正确的话,看上去是向前的。
按“类型”分组,获得周转率
df_group_by_type = df.groupby('Type')['Turnover per game'].apply(np.mean)
df_group_by_type
Type
A 6.2
B 10.0然后检查所需的条件
df_group_by_type['A'] < df_group_by_type['B']
Truehttps://stackoverflow.com/questions/65608183
复制相似问题