大话脑影像系列之三：趣谈散点图与相关系数

用户1279583

发布于 2018-04-08 15:19:52

1.6K0

发布于 2018-04-08 15:19:52

文章被收录于专栏：思影科技

爱因斯坦喊你点击右上角蓝色“思影科技”关注我们

最近不少读者对高大上的机器学习，动态脑网络，曲面形态指标共变网络感到爱不起，针对于此，我们特别推出一些基本的做脑功能的概念讲解，希望大家一步一步来，年轻人，不要动不动想一步登天，识得唔识得啊？

那今天我们就谈谈这个相关系数…….

说起相关系数，从字面上的含义就可看出，就是两个信号之间的相关性。但是你真正理解内在的机理吗？

结论放在最前面：相关系数，其实就是通过散点图来的。

学会散点图，此生无憾！

所有的一切，由这个图说起：

图1：Ref: JamesAH, BMJ, 1995, 311: 1668.

有一个人，他测量了一组人的“量表”。其中这个“量表”包含着年龄和耳朵长度。这样子他就得到一个二维小表格如下图示：

图2：萌萌哒的二维量表小表格

然后他在坐标纸上面进行打点，X轴坐标设置为年龄，y轴坐标设置为耳朵长度。然后每一行就是一个点，也就是说：每一个点对应着一个被试信息。

紧接着，他就拿手来比划，画出一根能最好拟合这个散点趋势的线（拟合或最小二乘法）。这样他就发现：年龄越大，耳朵越长。Ps：怪不得如来佛耳朵如此长，连起来可以绕地球一圈。

图3：散点图与拟合线（橙色），左：正相关；中：不相关；右：负相关

其实我告诉你，现在这根橙色拟合线的趋势就是相关性。如果这根线是朝着右上角走，就是正相关；如果这根线是朝着右下角走，就是负相关；如果这根线水平，就代表着不相关。

但是理想很美好，现实很残酷。真正拿到数据进行计算相关系数，多多少少会存在一定的相关性，真正不相关的例子太少太少，（比如你和思影科技，你来参加培训，于是我们就相关了，培训信息还是老规矩翻看历史信息或简单粗暴的点击阅读原文，你没看错，此处还是广告，惊喜不惊喜？意外不意外？）。前一阵子有一篇文章说：中国三峡大坝是影响日本地震的原因。该文说这个相关性还是非常非常显著的。

那么问题来了：相关系数的计算怎么会有显著性呢？

多图警示！