理论部分
给出样本数据
计算相应指标
可视化
理论部分
问题
考察两个变量
与
之间是否存在线性相关关系,其中
是一般 ( 可控) 变量,
是随机变量,其线性相关关系可表示如下...( 可用散点图显示) :
其中
为截距,
为斜率
为随机误差,常假设
这里
是三个待估参数....在
与
之间存在线性关系的假设下,有如下统计模型:
利用成对数据可获得
与
的估计,设估计分别为
与
则称
为 回归方程,其图形称为回归直线....检验 如下的平方和分解式是非常重要的,它在许多统计领域得到应用 :
其中
是总平方和
其自由度
是回归平方和,其自由度
是残差平方和,其自由度
而
是在
的回归值...)**2/n
Lxy = np.sum(x*y) - np.sum(x)*np.sum(y)/n
mean_x = np.mean(x)
mean_y = np.mean(y)
# 斜率和截距的最小二乘估计和