通常是为了表明我们的结果不是偶然的,我们使用显着性检验,就像t-检验。但是当我们使用10倍交叉验证时,我们会在数据集块上学习和测试我们的模型。我在想,当我们使用了10倍交叉验证时,是否需要进行t检验?更准确地说,我的意思是什么时候我们应该使用10倍交叉验证?
发布于 2015-06-06 05:10:34
T检验是对你的数据进行的一种统计测试.假设您正在比较两个数据集,您想知道这两个数据集之间是否存在显著差异。那你就做个t检验。
交叉验证更像是一种评估模型的技术。通常用于确保您的模型不是overfitting.You,同时构建模型以确保您有一个能够推广到未来数据的模型。这里没有使用任何统计测试。我希望这能帮助你的怀疑。
发布于 2015-06-05 14:37:27
T检验,当应用于两个正态分布变量的差异时,是一种参数检验,它估计我们对这两个变量具有不同期望这一事实的可信度。
10倍交叉验证是一种重采样技术,当我们事先不知道统计量的分布(非参数设置)时,可以用来估计我们对统计数据的置信度(例如,但不仅仅是两个随机变量之间的差异)。
通过交叉验证,你不会得到很好的‘这是显着的’结果,你简单的有一个统计估计的分布,其中的方差是我们可以有信心的指标。
交叉验证在模型选择建立非参数回归或分类模型时经常使用.
https://stackoverflow.com/questions/30667253
复制相似问题