前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析

R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析

作者头像
拓端
发布2023-08-31 08:03:35
2410
发布2023-08-31 08:03:35
举报
文章被收录于专栏:拓端tecdat

全文链接:http://tecdat.cn/?p=32372

对于影响北京市GDP 因素分析常用的方法是最小二乘回归。【1】但最小二乘有自身的缺陷,该方法要求较高,例如许多观测数据很难满足全部假设条件点击文末“阅读原文”获取完整代码数据)。

相比普通最小二乘法只能描述协变量对因变量条件均值变化的影响,分位数回归能精确地描述协变量对于因变量的变化范围和分布形状的影响。【2】随着计算机技术的不断突破,分位数回归软件包现已是主流统计软件R、SAS等中的座上客了,分位数回归也就自然而然地成为经济、医学、教育等领域的常用分析工具。【3】

客户主要研究是先利用分位数回归研究收敛性,然后和最小二乘做个比较。

研究意义

作为一种精确地描述自变量对于因变量的变化范围以及条件分布影响的统计方法,分位数回归的概念最早由Koenker和Basset(t1978)【4】提出。借助Laplace(1818)提出的最小绝对残差估计思想,他们针对最小二乘回归的某些缺陷,创建了线性分位数回归理论。Bassett(1986)【5】、Powell(1986)【6】和Chernozhuko(2002)【7】等人在此基础上进行了深入的研究,陆续解决了分位数回归的线性假设检验、异方差的稳健性检验、估计量的一致性和线性规划解法等应用方面的难题,使其成为了近几十年来发展较快、应用广泛的回归模型方法。分位数回归可以提供不同分位点处的估计结果,因此可以对因变量的整个分配情况作出更为清楚的阐释。【8】不同分位数下的参数估计量往往也不同,这就表明同样的影响因素对处在不同水平的研究对象的作用大小是不同的。特别是在研究对象的分布呈现异质性,如不对称,截断性等特征时,这一方法往往能够提供更为详尽的信息,具有明显的优势。【9】

文献综述

分位数回归是对以古典条件均值模型为基础的最小二乘法的延伸,它用几个分位函数来估计整体模型。分位数回归更能精确地描述自变量X对于因变量Y的变化范围以及条件分布形状的影响。分位数回归能够捕捉分布的尾部特征,当自变量对不同部分的因变量的分布产生不同的影响时。【10】

对于分位数回归模型,则可采取线性规划法(LP)估计其最小加权绝对偏差,从而得到解释变量的回归系数,可表示如下:

求解得:

研究的基本内容,拟解决的主要问题

研究的主要内容:

1. 对北京市的GDP、投资、消费等增长率进行统计;

2. 建立分位数回归模型;

3. 讨论模型的稳健性、处理数据异质性、各种收敛性;

4. 针对不同的收敛性进行分析和比较;

5. 通过与最小二乘法的对比研究其优势。

研究步骤

1. 搜集北京市近二十年经济增长等数据;

2. 学习并了解分位数回归分析问题的研究背景及应用;

3. 建立分位数回归模型;

4. 利用模型与统计软件进行计算,观察其特性;

5. 与最小二乘法进行比较,得出结论。

查看数据

读取数据

代码语言:javascript
复制
head(data)

σ收敛的检验

从变异系数的变化趋势来看,在06年以后,波动趋势变小,因此参数逐渐收敛。

β-收敛的分位数回归分析

代码语言:javascript
复制
ggplot(dat, aes(x,y)) + geom_point() + geom_smooth(method="lm")

建立分位数回归模型

代码语言:javascript
复制
qr1 <- rq
代码语言:javascript
复制
qr1$coefficients

与ols回归线段作比较

代码语言:javascript
复制
summary(OLS)

OLS(普通二乘回归)

上图是普通二乘回归的拟合图,从结果来看大部分点被回归预测的置信区间所覆盖。然后有少量点在置信区间之外。

分位数回归拟合直线


点击标题查阅往期内容

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

01

02

03

04

分位数回归图

从分位数回归的结果来看,所有数据均被分位数回归模型的预测区间所覆盖。因此模型比普通二乘更好。

上面的图为分位数回归的回归系数变化趋势图,从结果来看居民消费水平的相关影响逐渐变化且从负相关变为正相关,说明有正向的影响, 社会投资从正相关逐渐变成负相关,说明有负向的影响,进出口总额从负相关逐渐变成正相关,说明有正向的影响。

参考文献

[1]刘丽华,刘尧. 基于回归分析的人均GDP 影响因素研究[J] .经济研究导刊. 2013 ( 7) .

[2]沈冰. 基于面板数据的分位数回归分析——浙江省GDP的影响因素[J]. 财经纵览_财政金融 (2015年10期).

[3]李育安. 分位数回归及应用简介[J]. 统计与信息论坛 第21卷第3期 (006年5月).

[4]Koenker, Bassett. Regression Quantiles[J]. Econometrica, 1978, (46).

[5]Bassett , Koenker. Strong Consistency of Regression Quantiles and Related Empirical Processes[J]. Econometric Theory , 1986, (2).

[6]Powell , James L. Censored Regression Quantiles[J].Journal of Econo-metrics, 1986, (32).

[7]Hong H , Chernozhukov V. Three-Step Censored Quantile Regression and Extramarital Affairs[J ] . Journal of the American Statistical Asso-ciation, 2002, (97).

[8]李群峰. 基于分位数回归的面板数据模型估计方法[J]. 统计与决策. 2011(17)

[9]黄蓓、范悍彪,宋峰. 中国地区经济增长收敛性分位数回归分析[J]. 安徽财经大学

[10]姜成飞. 分位数回归方法综述[J]. 科技信息(2013年25期)


本文选自《R语言分位数回归、最小二乘回归OLS北京市GDP影响因素可视化分析》。

点击标题查阅往期内容

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

R语言非参数PDF和CDF估计、非参数分位数回归分析间歇泉、GDP增长数据

matlab使用分位数随机森林(QRF)回归树检测异常值

分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

R语言分位数回归Quantile Regression分析租房价格

R语言分位数回归预测筛选有上升潜力的股票

matlab使用分位数随机森林(QRF)回归树检测异常值

贝叶斯分位数回归、lasso和自适应lasso贝叶斯分位数回归分析免疫球蛋白、前列腺癌数据

分位数自回归QAR分析痛苦指数:失业率与通货膨胀率时间序列|数据分享

分位数回归、GAM样条曲线、指数平滑和SARIMA对电力负荷时间序列预测

用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模

结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析

Fama French (FF) 三因子模型和CAPM模型分析股票市场投资组合风险/收益可视化

配对交易策略统计套利量化交易分析股票市场

Copula 算法建模相依性分析股票收益率时间序列案例

用COPULA模型进行蒙特卡洛(MONTE CARLO)模拟和拟合股票收益数据分析

R使用LASSO回归预测股票收益

金融时间序列模型ARIMA 和GARCH 在股票市场预测应用

时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格

自然语言处理NLP:主题LDA、情感分析疫情下的新闻文本数据

在R语言中使用航空公司复杂网络对疫情进行建模

matlab用高斯曲线拟合模型分析疫情数据

R语言ARIMA-GARCH波动率模型预测股票市场苹果公司日收益率时间序列

R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格

R语言用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模

R语言回测交易:根据历史信号/交易创建股票收益曲线

Python中TensorFlow的长短期记忆神经网络(LSTM)、指数移动平均法预测股票市场和可视化

R语言k-Shape时间序列聚类方法对股票价格时间序列聚类

R语言逻辑回归Logistic回归分析预测股票涨跌

R语言时变波动率和ARCH,GARCH,GARCH-in-mean模型分析股市收益率时间序列

R语言中的copula GARCH模型拟合时间序列并模拟分析

R语言乘法GARCH模型对高频交易数据进行波动性预测

R语言GARCH-DCC模型和DCC(MVT)建模估计

Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模拟进行股价预测

R语言时间序列GARCH模型分析股市波动率

R语言ARMA-EGARCH模型、集成预测算法对SPX实际波动率进行预测

matlab实现MCMC的马尔可夫转换ARMA - GARCH模型估计

Python使用GARCH,EGARCH,GJR-GARCH模型和蒙特卡洛模拟进行股价预测

使用R语言对S&P500股票指数进行ARIMA + GARCH交易策略

R语言用多元ARMA,GARCH ,EWMA, ETS,随机波动率SV模型对金融时间序列数据建模

R语言股票市场指数:ARMA-GARCH模型和对数收益率数据探索性分析

R语言多元Copula GARCH 模型时间序列预测

R语言使用多元AR-GARCH模型衡量市场风险

R语言中的时间序列分析模型:ARIMA-ARCH / GARCH模型分析股票价格

R语言用Garch模型和回归模型对股票价格分析

GARCH(1,1),MA以及历史模拟法的VaR比较

matlab估计arma garch 条件均值和方差模型

R语言ARMA-GARCH-COPULA模型和金融时间序列案例

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-05-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 拓端数据部落 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 全文链接:http://tecdat.cn/?p=32372
  • 研究意义
  • 文献综述
  • 研究的基本内容,拟解决的主要问题
    • 研究步骤
    • 查看数据
    • 读取数据
    • σ收敛的检验
    • β-收敛的分位数回归分析
    • 建立分位数回归模型
    • 与ols回归线段作比较
    • OLS(普通二乘回归)
    • 分位数回归图
    • 参考文献
    相关产品与服务
    NLP 服务
    NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档