开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

我应该使用t检验还是z检验？

在统计学中，t检验和z检验都是用于比较两个样本均值是否有显著差异的假设检验方法。它们的选择取决于以下几个因素：

样本容量：当样本容量较大（通常大于30）时，可以使用z检验。因为根据中心极限定理，当样本容量足够大时，样本均值的分布将近似于正态分布，而z检验是基于正态分布的。
总体标准差已知与否：如果总体标准差已知，可以使用z检验。但通常情况下，总体标准差是未知的，需要通过样本标准差来估计。如果总体标准差未知，应该使用t检验。
数据分布的假设：t检验是基于学生t分布的，而z检验是基于正态分布的。如果样本来自一个近似正态分布的总体，可以使用z检验。但如果样本来自一个未知分布或非正态分布的总体，应该使用t检验。

综上所述，当样本容量较大且总体标准差已知时，可以使用z检验；当样本容量较小或总体标准差未知时，应该使用t检验。

腾讯云相关产品和产品介绍链接地址：

腾讯云统计分析（https://cloud.tencent.com/product/da）
腾讯云人工智能（https://cloud.tencent.com/product/ai）
腾讯云物联网（https://cloud.tencent.com/product/iot）
腾讯云移动开发（https://cloud.tencent.com/product/mobdev）
腾讯云存储（https://cloud.tencent.com/product/cos）
腾讯云区块链（https://cloud.tencent.com/product/bc）
腾讯云元宇宙（https://cloud.tencent.com/product/mu）

相关搜索:多组比较:方差后检验还是pairwise.t.test？使用统计模型评估回归系数的t检验使用r中的bin进行单侧t检验 R中使用检验统计量的独立样本t检验(均值，标准差。dev，count)使用perm.t.test的多重配对置换t-检验对于库，我应该使用ILogger、ILogger<T>、ILoggerFactory还是ILoggerProvider？我应该使用Phobos还是Tango？我应该使用DataInputStream还是BufferedInputStream 我应该使用RSpec还是黄瓜？我应该使用OAuth还是JWT？我应该使用扫描还是查询？我应该使用CharacterSet还是URLQueryItem？我应该使用.loc还是.index 我应该使用#define,enum还是const？我应该使用`!IsGood`还是`IsGood == false`？我应该使用elseif还是多个if子句为此，我应该使用Xpath还是regexp？我应该使用更新还是批量更新？我应该使用什么: strcpy还是指针？如何使用两个样本t检验计算R中每个特征的p值

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

使用python中的Numpy进行t检验

本系列将帮助你了解不同的统计测试，以及如何在python中只使用Numpy执行它们。 t检验是统计学中最常用的程序之一。...但是，即使是经常使用t检验的人，也往往不清楚当他们的数据转移到后台使用像Python和R的来操作时会发生什么。...为了验证这一点，研究人员将使用t检验来确定整这样的情况会不会一直发生。什么是t分数 t分数是两个组之间的差值与组内差的比值。t分数越大，组间的差异越大。t分数越小，组间的相似度就越大。...3.单一样本t检验：检验单个组的平均值对照一个已知的平均值。如何执行2个样本的t检验假设，我们必须检验人口中男性的身高与女性的身高是否不同。我们从人口中抽取样本，并使用t检验来判断结果是否有效。...因此，我们使用一个表来计算临界t值： ? 在python中，我们将使用sciPy包中的函数计算而不是在表中查找。（我保证，这是我们唯一一次需要用它！）

4.6K5 0

使用student’s T检验的未必是学生

T检验全称为student’s T检验，是由19世纪末的一位酿酒师戈塞特推导出的小样本统计方法，因其发表研究成果时用的笔名为“学生”，这一方法被称作是student’s T检验，虽有其名，但使用者却未必是学生...T检验的优势除了他自身的统计属性外，还在于他的稳定性，这一方法对数据的正态性有一定的耐受能力，当数据不满足正态时，可以采用一定的数据变换方式，将数据转换成正态，进而使用这一方法进行计算。...在页面设计中，按钮是设计在页面顶部还是在页面底部？在问卷调查中，题目是设计7个还是设计10个？这些实验性的、选择性的方案中，往往都会有T检验的身影。...总结可知，T检验的应用场景是在方案选择中，而使用的范围则可以总结为： 1）样本来自的总体应服从或近似服从正态分布； 2）两样本相互独立，样本数可以不等；两独立样本T检验目的是：利用来自两个总体的独立样本...T检验在统计学中是与Z检验、卡方检验齐名的三大统计方法之一，在网站分析中得到广泛的应用，T检验以假设检验为分析基础，在假设成立的基础上查看样本数据对各种分布的满足程度。

9011 0

t 检验的 3 种常用方法及在 Python 中使用样例

有许多有用的文章会告诉你什么是 t 检验以及它是如何工作的，但没有太多材料讨论 t 检验的不同变体以及何时使用它们。...本文将介绍 t 检验的 3 种变体以及何时使用它们以及如何在 Python 中运行它们。单样本 t 检验单样本 t 检验将数据样本的平均值与一个特定值进行比较。...下面的代码演示了使用该函数为上述示例运行一个示例 t 检验。...还是上面的例子，如果想要比较 A 工厂和 B 工厂的罐装液体的平均量，就可以使用此方法。它是如何工作的？ 1、与单样本 t 检验类似，我们陈述原假设和备择假设。...然后我使用“apply_training”函数模拟培训，该函数可以将生产率降低 1 瓶/分钟，或者提高最多 4 瓶/分钟。

3K2 0

没有最好，只有AB测试！

照着我的这个公示敲！于是我得到了 z 值的计算公式：其中，分别为转换 A/B 测试的转换数和样本总数。...比如我们常说 z 检验适用大样本而 t 检验适用于小样本。实验组的样本容量 > 30，所以我们这里采用 z 检验。...我可能还会有一些疑问，比如说：什么是双侧检验？为什么 z 检验适用大样本，而 t 检验适用小样本？四格表不是应该用卡方检验的吗？ 2.2 检验方式检验方式分为两种：双侧检验和单侧检验。...t 检验在使用前需要注意三点：分析的数据对象需要满足正态分布或近似正态分布；得知样本均值和样本标准差；已知总体均值（由原假设可知总体均值为 0）； t 检验统计量较 z 检验统计量多了一个自由度的变量...这也是为什么 z 检验和 t 检验以样本量为 30 做个分界。

1.6K3 0

独家｜使用Python进行机器学习的假设检验（附链接&代码）

我将简要介绍一下这个当我学习时给我带来了麻烦的主题。我把所有这些概念放在一起，并使用python进行示例。在我寻求更广泛的事情之前要考虑一些问题 —— 什么是假设检验？我们为什么用它？...现在让我们看一些广泛使用的假设检验类型： —— T校验（学生T校验） Z校验 ANOVA校验卡方检验 T—检验：t检验是一种推论统计量，用于确定在某些特征中可能与两组的均值之间是否存在显着差异。...在下列情况下，您将使用Z测试：您的样本量大于30。...再举一个例子，我们使用z-test进行血压测量，如156个单样本Z检验。...—— 在两个样本z检验中，类似于t检验，我们检查两个独立的数据组并确定两个组的样本均值是否相等。

1K3 0

数据科学基础(七) 假设检验

例子: 设菜厂生产一种灯管，其寿命X \sim \mathrm{N}(\mu, 40000), 从过去较长一段时间的生产情况看，灯管的平均寿命为 1500 小时，现在使用了新工艺后，在所生产的灯管中抽取...注意:一般情况下,将希望成立的假设设为 H_1 ,将其否定形式设为 H_0 假设检验问题的处理方法作出参数或者分布的假设. 根据样本值选择接受还是拒绝所作假设的结论. 7.1.2....根据样本值做出接受还是拒绝所作假设的结论. 分类只提出一个假设,显著性检验问题....(2)建立检验统计量乙,满足Z \sim \mathrm{N}(0,1), 根据样本数据计算检验统计量数值Z。 (3)根据检验统计量数值 Z 和显著性水平\alpha,计算拒绝域。...PS: 这道题中样本总体方差是未知的, 本来应该用 t 检验, 但是在样本容量大于 30 的时候可以用 Z 检验代替 t 检验, 所以此处直接用样本方差代替了总体方差. 7.2.2.

1.5K1 0

是的，股价不遵循随机游走！

尽管如此，读者应该注意到这个检验对于大多数形式的非条件异方差都是稳健的。换句话说，我们将检验随机游走假设的第二个变体RW2。...估算器考虑到了这一点，所以无论你是用q=1，q=2或者甚至q=16对σ_0^2进行估计，你都应该得到类似的估计。该观测是方差比检验的核心。...首先，我们知道，如果资产价格是使用具有漂移和随机波动率的布朗运动明显生成的，那么它们很可能会使用此检验标记为随机游走（95%或99%肯定取决于置信区间）。其次，我们对我的代码更有信心。...使用我们的估计器，不管我们使用每个观测值来估计方差，还是用每隔一秒的观测值来估计方差，并不重要，因为它们都会随着观测值的增长而收敛到相同的估计值。 β....对于这两个观测值，我提出了以下两个未经检验的假设： 1、股票市场指数的自相关通常为正，而个别股票的自相关通常为负。这也许可以解释z^*-分数分布的偏差。

2.1K2 1

EViews、Stata、回归分析……10月论坛答疑精选！

提问者：wangwenjin0829 精彩回答：关于第一个问题，大概应该是这样吧：如果y_t和x_t都取决于观测不到的变量z_t，regress y x里x就有内生性的问题。...但是如果z_t和z_{t-1}不相关，那么x_{t-1}就不是内生的了。所以才有regress y l.x这样的做法。在这个假定下，应该取哪些变量的滞后值就很明确了。...追问：您的意思是，想要用这种做法解决遗漏变量问题必须满足z_t与z_t-1不相关才可以，那么现实中这种情况可能比较少见，所以说即使这么做了，顶多是缓解一下遗漏变量的内生性，而不能够完全解决，是这样子吗？...2 对定性数据的分析，都知道列联表是用来分析定性数据（可以检验比例是否相同，构成比是否相同等等）的，使用的方法就是卡方检验，虽然现在的GLM（广义线性模型）可以替代列联表方法，但这种方法在实际的使用中还是非常广泛的...（样本量大的话）可以做t检验样本小的话如果符合正态分布或t分布也可作T检验问题4：相关关系与因果关系的比较提问者：带我回家精彩回答：两个完全不同的关系相关关系一般做线性相关分析，取值为[

3.5K8 0

【概率论与数理统计(研究生课程)】知识点总结8(假设检验)

_{\alpha} &\quad \text{accept } H_0 \end{aligned} $$ 注意：无论是双边检验还是单边检验，原假设H_0中一定要包含等于。...单边检验和双边检验使用情况总结：右边检验：是否提高、是否偏高、是否增加、是否超过，原假设就是没有提高，用小于等于......关于原假设的提法，我也是搞了很久，一直不明白，我们再回顾一下假设检验的逻辑：小概率事件在一次试验中居然发生了，那我们就有很大把握否定原假设，因此原假设必然是大概率的，你没有足够的证据就不能说明原假设是错的...我认为应该把通常情况，或者说过去一直发生的情况，或者说某种标准，再或者原先就有的结论作为原假设，因为这些事件都是大概率的；把我们需要去证明的结论作为备择假设（这种主要用于前面所说的几种情况题目中都没给）...以下双边检验仅提供统计量和拒绝域以及单边检验的原假设和拒绝域：单正态总体均值假设检验，方差未知双边选取统计量： T=\frac{\bar{X}-\mu}{S/\sqrt{n}}\sim t(n-1

5913 0

当数据遇上代码：程序员的假设检验

z统计量和t统计量。...在正态分布中，我可以通过概率累积分布函数来得到z分数对应的概率。...z统计量的95%置信区间为用z统计量来推断假设叫做z检验。 t 统计量由于我们无法得知总体方差，所以使用t统计量来分析。...这个计算量应该接近z分数，但其分布比正态分布更分散一些，因为已知总体方差时，随机性只来源于一个数即样本均值，现在随机性来源于样本均值和估计量s。...t统计量的95%双边置信区间为用t统计量来推断假设叫做t检验。当知道总体方差时，使用z检验；如果不知道总体方差，则使用t检验。

1161 0

Python配对交易策略统计套利量化交易分析股票市场|附代码数据

# 设置参数和数据点数 T = 100 Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B[t] = genedata...协整检验程序的步骤：检验每个分量系列的单位根单独使用单变量单位根检验，例如 ADF、PP 检验。...import fix_yaance as yf yf.pdrde 交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。

4141 0

Python配对交易策略统计套利量化交易分析股票市场|附代码数据

# 设置参数和数据点数 T = 100 Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B[t] = genedata...协整检验程序的步骤：检验每个分量系列的单位根单独使用单变量单位根检验，例如 ADF、PP 检验。...import fix_yaance as yf yf.pdrde 交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。

5842 0

python数据分析——数据分析的统计推断

假设检验假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。...显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。...在实践中，常用的假设检验方法有基于正态分布的Z检验，t分布的t检验，卡方分布的卡方检验,F分布的F检验。 4.4. 假设检验的假设由定义可知,我们需要对结果进行假设,然后拿样本数据去验证这个假设。...z检验首先比较根据样本计算所得z值与理论z值之间关系,推断发生的概率,依据z值与差异显著性关系表作出判断。...解:使用寿命小于1000小时即为不合格,我们可以使用左单侧检验,这时我们有: 原假设HO：μ>1000；备选假设：H1<1000 计算统计量：而在显著性水平a=0.05下的真值为Z=-1.65

2661 0

【V课堂】R语言十八讲(十四)—几大检验

在统计分析中,我们会听到很多检验,有T检验,卡方检验,秩和检验,F检验,费舍尔检验等等,这么多检验,光听就要晕了,还怎么用啊?...在统计学中检验这个词,说难也难,那么多检验,用公式推导还是相当复杂,说简单也简单,比方说:有一个人声称自己是射击高手,我们表示怀疑,或者说想证明,那好,你说你是高手,来我们检验一下,你打几枪,打几枪看看你中的环数...,要是环数还都挺高,那我就相信了,如果很低,甚至落把了,我肯定是不信的,对吧?...(这里说法有点不严密,具体解释可以参看R语言十八讲之九) 2.不同的检验方法 Z检验:就是指构造的统计量服从正态分布,那么算出来的具体的统计量值便可以通过正态分布表查出其概率也就是其P值.用来决定是否拒绝原假设...其他的,T检验,F检验,都是同一个道理.那么为什么没有说秩和检验(wilcoxon)了? 首先,秩和检验还是相对前面几个比较特殊的, 首先,什么叫秩?

6237 0

配对交易策略统计套利量化交易分析股票市场

# 设置参数和数据点数 T = 100 Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B\[t\] = genedata...协整检验程序的步骤：检验每个分量系列的单位根单独使用单变量单位根检验，例如 ADF、PP 检验。...import fix_yaance as yf yf.pdrde 交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。 2.

1.2K3 0

Python配对交易策略统计套利量化交易分析股票市场|附代码数据

# 设置参数和数据点数T = 100Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B[t] = genedata ...import fix_yaance as yfyf.pdrde交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...为此，我们需要使用 z 分数。z 分数是数据点与平均值的标准差数。更重要的是，高于或低于总体平均值的标准差的数量来自原始分数。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。

3804 0

Python配对交易策略统计套利量化交易分析股票市场|附代码数据

# 设置参数和数据点数T = 100Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B[t] = genedata ...import fix_yaance as yfyf.pdrde交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...为此，我们需要使用 z 分数。z 分数是数据点与平均值的标准差数。更重要的是，高于或低于总体平均值的标准差的数量来自原始分数。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。

1K0 0

Python配对交易策略统计套利量化交易分析股票市场|附代码数据

# 设置参数和数据点数T = 100Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B[t] = genedata ...import fix_yaance as yfyf.pdrde交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...为此，我们需要使用 z 分数。z 分数是数据点与平均值的标准差数。更重要的是，高于或低于总体平均值的标准差的数量来自原始分数。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。

9960 1

Python配对交易策略统计套利量化交易分析股票市场|附代码数据

# 设置参数和数据点数T = 100Series(index=range(T)) # 现在参数依赖于时间 # 具体来说，序列的均值随时间变化 B[t] = genedata ...import fix_yaance as yfyf.pdrde交易中的数据科学在开始之前，我将首先定义一个函数，该函数可以使用我们已经涵盖的概念轻松找到协整对。...为此，我们需要使用 z 分数。z 分数是数据点与平均值的标准差数。更重要的是，高于或低于总体平均值的标准差的数量来自原始分数。...例如，我需要买卖特定股票的最佳指标是什么？设置规则我们将使用我们创建的比率时间序列来查看它是否告诉我们是在特定时间买入还是卖出。我们将首先创建一个预测变量 ....使用更多的证券和更多样化的时间范围对于配对交易策略的协整测试，我只使用了少数股票。自然地（并且在实践中）在行业内使用集群会更有效。我只用了只有5年的时间范围，这可能不能代表股市的波动。

1.5K2 0

「原理」AB测试-详细过程和原理解读

选取实验单位大家应该都使用用户粒度来作为实验单位，但是总体说来，实验单位一般有3种。我们不用掌握，但是很多情况下面试官会问到，大家可以作为了解。...数据检验数据检验，大家可能都听过。比如Z检验，T检验，单尾检验，双尾检验，算P值，算置信区间等等。我们这里先说说哪种情况用Z检验，哪种情况用T检验。...按照上文我们说的指标分类，一般情况下，绝对值指标用T检验，相对值指标用Z检验。因为绝对指标的的总体方差，需要知道每一个用户的值，这个在AB实验中肯定不可能。...当然，我们也可以直接算出Z值或者T值，查表对比。但是这种不是很常用，还是以P值及置信区间为主流。还有些公司，会将所有指标计算到为不同流量区间内的自然波动。...3、指标可以分为绝对值指标和相对值指标，相应的，绝对值指标推荐用T检验，相对值指标推荐用Z检验。

2.9K4 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭