均值描述的是样本集合的中间点,它告诉我们的信息是有限的;而方差给我们描述的是样本集合的各个样本点到均值之间的平均距离。
方差对平均距离计算了平方,为了还原回原来的数量级,就有了标准差,标准差是对方差开根号
当出现多维集合时,各个维度间的数据有无关联,可以参照一维的方法,首先将每个维度样本集合中每一个点的数据值减去该维度的平均值,再乘以另外一个维度的同样的差值,最后除以 n-1 就是协方差(n 就是每个维度样本个数,各维度一样),这个协方差就可以反映两个维度间各数据的相关性。
协方差只是说明了线性相关的方向问题,即从正无穷到负无穷,不能说明相关的程度
其值始终再-1到1之间变化