首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

线性回归分析浅谈

在分析化学中,分析员通常会遇到如何来求解两组数据的关系,如样品浓度与吸收值,反应物浓度与产量,时间点与温度值的变化关系。由于事先并不知道这两组数据是否存在关联,此时可以暂时把它们称为“不相关(independent)”数据。

既然两组数据不相关,也就无法用明确的函数关系式来描绘。但要在这些数据基础上去预测或评估结果的优劣时则必须要依赖于一定的数学模型,这时候可以采取一个折中办法,即寻找一个趋近真实结果的函数关系式来描绘当前两组“不相关”数据的关联性。

在数学分析中,最简单的数学函数关系莫过于线性方程,用于求解这个函数关系式的方法大多采用最小平方差(least square,LS,有的也称最小二乘法)方法。这种方法常用于校准(calibration),常见的例子如制备一系列已知不同浓度的标准品溶液并测试其响应值(如吸光度),然后用线性回归分析求得校准曲线方程(等一等,有童鞋可能会说,分析化学书上早就讲了分子吸收光度与浓度成线性关系,还有必要再啰嗦嘛。很抱歉,理想很丰满,但现实很骨感,真实情况有时会偏离理想很远)。

假设有如下一组荧光光度法分析某样品中目标组分的测试数据(表1):

表1 吸光度测试数据

既然是采用线性回归分析过程,首先需要判断这两组数据之间是否存在线性关系。可以采用相关系数(correlation coefficient)来判断两组数据的关系。假设两组数据分别命名为X和Y,其中X为自变量,Y为因变量,则相关系数(r)的计算公式如下:

相关系数结果范围为-1~1。当r=1时,则两组数据呈正相关,而r=-1时,两组数据呈负相关。当两组数据无相关性,则r=0。

将上述两组实验数据先用图形描绘出来,可以直观地观察两组数据是否存在线性相关性(Excel绘图):

从图中可以看出两组数据之间存在明显的线性相关性,但我们还想知道这二者之间的相关程度有多大,则可通过前面的相关系数来阐述。

先将两组数据按照相关系数定义计算出如下表结果(表2):

表2 数据处理

按照相关系数的定义,可以计算出结果:

结果显示相关系数接近1,则说明X和Y存在良好线性关系。

接下来则利用最小平方差法来求解线性回归方程。在线性分析中,假设X和Y服从下述线性关系式:

Y=aX+b (1)

其中a为方程的斜率,b为Y轴上的截距。

通过最小平方差法求解出a和b分别为如下公式:

将表2中的计算结果分别代入上述的定义式中求得a和b:

a=216.2/112=1.93

b=13.1-(1.93×6)= 1.52

则线性回归方程为:y=1.93x+1.52

在接下来的预测或评估过程中,一定要注意仅能在当前的范围内进行预测结果,如可以利用上述回归方程进行评估吸光度为16时对应的样品浓度。当测试结果超出当前范围时,禁止采用曲线外推(extrapolation)来评估样品。例如某未知样品测得吸光度为26时,则无法使用上述回归方程来校准其浓度。

当然上述的复杂计算过程完全可以交由计算机完成。如在Excel中就可以利用函数slope, intercept与correl计算出斜率、截距和相关系数(如下图):

----------------------------------------------------------------------------------------------------------------------

* 本文为原创,若有转载请注明出处。

** 本文部分图片来源于网络,若有侵权请立即告知删除。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180928G22YY400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券