皮尔逊相关系数(Pearson correlation coefficient)是一种用于衡量两个变量之间线性相关程度的统计指标。它的值介于-1和1之间,其中1表示完全正相关,-1表示完全负相关,0表示没有线性相关。
皮尔逊相关系数的计算公式为: [ r = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum (x_i - \bar{x})^2 \sum (y_i - \bar{y})^2}} ] 其中,( x_i ) 和 ( y_i ) 是两个变量的观测值,( \bar{x} ) 和 ( \bar{y} ) 分别是这两个变量的均值。
假设我们有两个数组 x
和 y
,我们想要计算它们之间的皮尔逊相关系数。
import numpy as np
def pearson_correlation(x, y):
# 计算均值
mean_x = np.mean(x)
mean_y = np.mean(y)
# 计算分子和分母
numerator = np.sum((x - mean_x) * (y - mean_y))
denominator = np.sqrt(np.sum((x - mean_x)**2) * np.sum((y - mean_y)**2))
# 计算相关系数
r = numerator / denominator
return r
# 示例数据
x = np.array([1, 2, 3, 4, 5])
y = np.array([5, 4, 3, 2, 1])
# 计算皮尔逊相关系数
correlation = pearson_correlation(x, y)
print(f"Pearson correlation coefficient: {correlation}")
通过上述方法和注意事项,可以高效且准确地计算数组间的皮尔逊相关系数。
领取专属 10元无门槛券
手把手带您无忧上云