文章/答案/技术大牛

发布

社区首页 >问答首页 >stats.f_oneway Scipy返回2个数组，4个值

问stats.f_oneway Scipy返回2个数组，4个值
EN

Stack Overflow用户

提问于 2019-07-18 02:47:47

回答 1查看 1.6K关注 0票数 2

尝试对数据运行单向Anova，它看起来类似于以下内容：

Year   | Diversity  |
2010   |   6        |
2010   |   8        |
...    |   ...      |
2011   |   10       |
...    |   ...      |
2019   |   7        |

每年有1827行，各点的多样性值。我在比较年年的变化。当我这么做

F, p = stats.f_oneway(df.loc[df["Year"] == 2010],
               df.loc[df["Year"] == 2011],
               df.loc[df["Year"] == 2012])

(在这里，我省略了其余的组，因为这很难看，但我想不出如何通过不同组的Anova测试)。我得到一个数组，每个数组的F值和p值各为2：

F: type float64, size (2,),
-2.588805281700000000e+11, 4.908743340532151223e+00
p: type float64, size (2,),
nan, 0.00774507

据我所读，我找不到任何人得到2个数组，它应该只是一个F值和一个P值，我做了什么严重的错误？(df中没有零或NANs )。

当我这么做时：

mod = ols('Diversity ~ (Year)', data = df).fit()
mod.summary()

我得到一个普通摘要表，F= 1.462，p= 0.227 (与上面的尝试不同)。

任何关于我的烂摊子的想法都会非常感谢.

pandas

scipy

statistics

anova

python

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-07-18 03:09:48

您的DataFrame有2列，即使在切片之后，也会返回2 p值和2 F值，其中一列用于对每个列进行跨样本的比较。应该将每个选择更改为只包含'Diversity'列，例如：

df.loc[df['Year'] == 2010, 'Diversity']

如果您只想在样本中对所有年份的多样性进行一次方差分析，您可以使用以下简单的方法来完成：

stats.f_oneway(*[s for idx, s in df.groupby('Year').Diversity])

MCVE

import pandas as pd
import numpy as np
from scipy import stats

l = [pd.DataFrame(np.random.randint(1, 10, (50, 4))) for i in range(7)]
                                              # |
                                              # 4 cols, should get 4 p-vals/F-vals

stats.f_oneway(*l)
#F_onewayResult(statistic=array([0.70527759, 0.2291319 , 0.03545031, 0.02568242]), 
#                  pvalue=array([0.49563511, 0.79550711, 0.96517894, 0.97464894]))
                               #    col1         col2        col3       col4

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/57086446

复制

相似问题

问stats.f_oneway Scipy返回2个数组，4个值
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问stats.f_oneway Scipy返回2个数组，4个值EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问stats.f_oneway Scipy返回2个数组，4个值
EN