我对如何处理这件事有疑问。是Stats和Python世界的新鲜事。一名学生正试图在两个处理单元之间作出决定。他想利用处理单元来运行高性能的算法,所以他唯一关心的就是速度。他在一个大型数据集上选择一个高性能的算法,并在两个处理单元上运行10次,每次运行时间为几个小时。结果在以下列表TestSample1和TestSample2中给出。
from scipy import stats
import numpy as nupy
TestSample1 = nupy.array([11,9,10,11,10,12,9,11,12,9])
TestSample2 = nupy.array([11,13,10,13,12,9,11,12,12,11])假设:上述两个数据集样本都是随机、独立、参数和正态分布的。
提示:您可以从can导入ttest函数来执行t测试。
第一次T检验一个样本t检验检查TestSample1的平均值是否等于.
零假设是指均值等于zero.
问题2,给出,1.零假设:数据集之间没有显着性差异2.交替假设:做两次样本检验和检验是否拒绝零假设有显着性差异。
问题3 -做两个样本测试并检查两个样本的速度是否存在显著差异:- TestSample1和TestSample3
他正在尝试第三个处理单元-- TestSample3。
TestSample3 =nupy.array(9,10,9,11,10,13,12,9,12,12,12)
假设:两个数据集(TestSample1和TestSample3)都是随机的、独立的、参数的和正态分布的
发布于 2020-03-14 15:21:10
问题1
使用SciPy进行此操作的方法如下:
stats.ttest_1samp(TestSample1, popmean=0)然而,在这种情况下执行并不是一个有用的测试,因为我们已经知道,空假设必须是假的。负时间是不可能的,因此,人口平均为零的唯一方法是,如果每次测量的时间总是为零,这显然不是这样的。
问题2
下面是如何使用SciPy对独立样本进行双样本t检验:
stats.ttest_ind(TestSample1, TestSample2)输出:
Ttest_indResult(statistic=-1.8325416653445783, pvalue=0.08346710398411555)T-统计量为-1.8,但与零的偏差形式上不显著(p = 0.08)。这个结果是不确定的。当然,最好是有更精确的测量,而不是四舍五入到小时。
在任何情况下,我都会争辩说,考虑到您所声明的设置,您也不需要这个测试。两个不同的CPU执行完全相同的操作是非常不可能的,您只想决定使用哪一个CPU。无论显着性测试结果如何,只要选择平均时间较低的一个,显然是正确的选择。
问题3
这类似于问题2。
https://stackoverflow.com/questions/60665307
复制相似问题