「R」t 检验

方案

样本数据

```sleep
#>    extra group ID
#> 1    0.7     1  1
#> 2   -1.6     1  2
#> 3   -0.2     1  3
#> 4   -1.2     1  4
#> 5   -0.1     1  5
#> 6    3.4     1  6
#> 7    3.7     1  7
#> 8    0.8     1  8
#> 9    0.0     1  9
#> 10   2.0     1 10
#> 11   1.9     2  1
#> 12   0.8     2  2
#> 13   1.1     2  3
#> 14   0.1     2  4
#> 15  -0.1     2  5
#> 16   4.4     2  6
#> 17   5.5     2  7
#> 18   1.6     2  8
#> 19   4.6     2  9
#> 20   3.4     2 10```

```sleep_wide <- data.frame(
ID=1:10,
group1=sleep\$extra[1:10],
group2=sleep\$extra[11:20]
)
sleep_wide
#>    ID group1 group2
#> 1   1    0.7    1.9
#> 2   2   -1.6    0.8
#> 3   3   -0.2    1.1
#> 4   4   -1.2    0.1
#> 5   5   -0.1   -0.1
#> 6   6    3.4    4.4
#> 7   7    3.7    5.5
#> 8   8    0.8    1.6
#> 9   9    0.0    4.6
#> 10 10    2.0    3.4```

比较两组：独立双样本t检验

`t.test`函数能够操作像`sleep`这样的长格式数据——一列记录测量值，一列指定组别；或者操作两个单独的向量。

```# Welch t-test
t.test(extra ~ group, sleep)
#>
#> 	Welch Two Sample t-test
#>
#> data:  extra by group
#> t = -1.8608, df = 17.776, p-value = 0.07939
#> alternative hypothesis: true difference in means is not equal to 0
#> 95 percent confidence interval:
#>  -3.3654832  0.2054832
#> sample estimates:
#> mean in group 1 mean in group 2
#>            0.75            2.33

# Same for wide data (two separate vectors)
# t.test(sleep_wide\$group1, sleep_wide\$group2)```

```# Student t-test
t.test(extra ~ group, sleep, var.equal=TRUE)
#>
#> 	Two Sample t-test
#>
#> data:  extra by group
#> t = -1.8608, df = 18, p-value = 0.07919
#> alternative hypothesis: true difference in means is not equal to 0
#> 95 percent confidence interval:
#>  -3.363874  0.203874
#> sample estimates:
#> mean in group 1 mean in group 2
#>            0.75            2.33

# Same for wide data (two separate vectors)
# t.test(sleep_wide\$group1, sleep_wide\$group2, var.equal=TRUE)```

配对样本t检验

```# Sort by group then ID
sleep <- sleep[order(sleep\$group, sleep\$ID), ]

# Paired t-test
t.test(extra ~ group, sleep, paired=TRUE)
#>
#> 	Paired t-test
#>
#> data:  extra by group
#> t = -4.0621, df = 9, p-value = 0.002833
#> alternative hypothesis: true difference in means is not equal to 0
#> 95 percent confidence interval:
#>  -2.4598858 -0.7001142
#> sample estimates:
#> mean of the differences
#>                   -1.58

# Same for wide data (two separate vectors)
# t.test(sleep.wide\$group1, sleep.wide\$group2, paired=TRUE)```

```t.test(sleep.wide\$group1 - sleep.wide\$group2, mu=0, var.equal=TRUE)
#> Error in t.test(sleep.wide\$group1 - sleep.wide\$group2, mu = 0, var.equal = TRUE): object 'sleep.wide' not found```

与期望的总体均值进行比较：单样本t检验

```t.test(sleep\$extra, mu=0)
#>
#> 	One Sample t-test
#>
#> data:  sleep\$extra
#> t = 3.413, df = 19, p-value = 0.002918
#> alternative hypothesis: true mean is not equal to 0
#> 95 percent confidence interval:
#>  0.5955845 2.4844155
#> sample estimates:
#> mean of x
#>      1.54```

0 条评论

• 「R」R 语言中的功效分析

功效分析是统计检验中很重要的一部分，但实际上在科学文献中，特别是生命科学研究中极少有人使用。一方面是实验条件有限，另一方面是分析水平有限。希望有条件的实验人员在...

• 「R」数据可视化12 : 生存曲线

我们经常用随机森林等机器学习又或者是其他数据挖掘的方法寻找某些疾病的biomarker或者候选基因。但是来自临床的数据包括了生存事件等信息，数据的内容有所不同，...

• 用 :key 管理可复用元素

我们会发现，在点击按钮切换登录方式后，输入框中已有的内容没有被清除，这是为什么呢？

• 易日升金融总裁史建伟：对我们而言，大数据时代下的消费金融没有舒适区

数据猿导读 易日升模式下的消费金融没有舒适区。我们做的是银行不愿做的累活苦活；我们做的是支付宝、京东金融没法做的个性细分场景的分期服务；我们做的是一般消费金融不...

• NTP网络时钟同步的重要性

NTP网络时间同步技术必定将是整个大数据处理系统的重要支撑和保障。时间同步技术使数据产生与处理系统的所有节点具有全局的、统一的标准时间，从而使系统中的所有各种消...

• 疫情期间面试 - 饿了么前端面试题 （p6）

面试过程中会遇到很多重复的基础问题，所以这些重复的问题不要挂，要表达的越来越好，越来越明确。