用R语言作上海房价预测模型

考虑到商品房经济始于1998年,且可供查找的数据截止到2011年,故本文的数据来源于1998-2011年的《上海统计年鉴》和国家统计局。在本文中主要讨论影响上海商品房房价的因素及各个因素对于房价的影响作用,考虑到房地产不同于一般的消费品,它不仅提供居住的功能,带来收租收益,发生价值增值,而且对人的行为有重要的影响,因此,在进行预测自由贸易下的房价时,本文主要从人均生产总值、人均可支配收入、商品零售价格指数、常住人口、住房竣工面积、住宅投资总额、居民居住消费价格指数7个方面来考虑对于商品房房价的影响。

本文在建模型时,先通过R软件拟合商品房房价与时间的非线性回归模型,再利用7个自变量与因变量商品房价多元线性关系,并进行逐步回归,得到最优回归模型。最后将时间的非线性回归模型与影响因素的多元线性模型预测值进行比较,给出2012、2013、2014年的房屋价格,其中2012年与2013年可与实际进行对比,进而评价模型的好坏。

数据准备

本文从研究影响房地产价格的因素入手,鉴于国家在1998年出台停止福利分房,进而促进了的商品房的自由贸易,故数据始于1998年,且上海统计年鉴可查的到2011年年鉴,故通过综合国家统计局及上海市年鉴1998年——2011年的房地产相关数据,最后筛选出如下可能影响未来房地产价格走势的变量,本文取定七个因素:

x1:人均生产总值;

x2:人均可支配收入;

x3:商品零售价格指数;

x4:常住人口;

x5:住房竣工面积;

x6:住宅投资总额;

x7:居民居住消费价格指数;

xm: 上海商品房房产均价

数据如下:

建立非线性模型

首先对y画出关于时间t的散点图,对应的R语言程序为:

X=read.csv("D:\\shanghaifangjia.csv")

attach(X)

plot(t,y)

得到图一:

R语言程序为:

y1=log(ym)

a1=log(a)

reg=lm(y1~t)

summary(reg)

得到结果如下:

R语言程序为:

a1= -3.281e+02

a=exp(a1)

b= 1.681e-01

yy=a*exp(b*t)

plot(t,ym)

lines(t,yy)

得到如图:

回归方程的检验

模型的建立

模型的求解

得到散点图如下:

利用程序cor(X)得到相关矩阵并整理得:

y

t 0.9195056

y 1.0000000

x1 0.9533447

x2 0.9792964

x3 0.6385694

x4 0.9490735

x5 -0.3246709

x6 0.9005302

x7 -0.1598100

得到如下的七个结果:

首先对七个变量建立多元回归方程的R语言程序为:

reg1=lm(ym~x1+x2+x3+x4+x5+x6+x7)

summary(reg1)

得到如下结果:

将结果整理得:

估计值

标准差

t值

P值

β0

-4.725e+04

1.975e+04

-2.393

0.05384

β1

-4.246e-01

2.239e-01

-1.897

0.10665

β2

1.259e+00

3.204e-01

3.928

0.00773 **

β3

5.876e+00

2.104e+00

2.792

0.03148 *

β4

9.312e+00

1.086e+01

0.857

0.42413

β5

1.630e-01

6.739e-01

0.242

0.81691

β6

3.758e+00

1.788e+00

2.102

0.08031

β7

8.121e+01

8.101e+01

1.003

0.35479

得到如下结果:

得到如下结果:

得到如下结果:

对结果整理得:

估计值

标准差

T值

P值

β0

-3.136e+04

3.535e+03

-8.873

9.59e-06 ***

β1

-2.538e-01

5.395e-02

-4.705

0.00111 **

β2

1.126e+00

1.287e-01

8.750

1.07e-05 ***

β3

6.916e+00

8.896e-01

7.774

2.78e-05 ***

β6

4.538e+00

9.577e-01

4.738

0.00106 **

模型的总结

指数方程预测房价

三年的预测值为:

2012

2013

2014

24765.33

29298.75

34662.03

多元线性回归预测房价

自变量

增长率

2012年

2013年

2014年

人均生产总值

10%

90816

99897.6

109887.4

人均可支配收入

10%

39853

43838.3

48222.1

商品零售价格指数

2%

4369.7

4457.1

4546.2

住宅投资总额

7%

1501.35

1606.44

1718,89

带入回归方程,则可得多元线性方程预测的三年房价的值为:

2012

2013

2014

27499.35

30763.24

34245.12

预测模型的对比评价

通过收集实际数据,与两个预测模型进行对比,可对预测的结果进行评价得到结果如下:

两个模型预测房价与实际房价的对比:

2012

2013

2014

实际房价

25691

29537(截止到5月)

时间指数模型预测值

24765.33

29298.75

34662.03

与实际的偏差比例

3.6%

6.6%

多因素回归模型预测值

27499.35

30763.24

34245.12

与实际的偏差比例

6.5%

4.2%

则可知,指数模型和多因素线性回归模型均得到较好的预测值,预测偏差均非常小。根据房价时间模型,房价将随着时间呈指数增长之势,因此必须出台相关政策,有效抑制房价增长。根据多元线性模型,房价与各个自变量的正负相关性就是各个变量前系数的正负。要抑制房价的增长,可以通过使系数为正的自变量增长率减少,系数为负的自变量增长率增加来达到目的。比如可以通过中央人民银行对于贷款利率的增加,减少投资者的过度投机行为,使土地拍卖价格降低,直接降低房屋成本,同时贷款利率的增加减少了房地产商的贷款,使房地产商资金面收紧,迫使其降价卖出现有房屋,已达到回笼资金偿还原来贷款的目的。

由于某些数据的缺少,有些数据从网上搜索得到,可能会存在不准确的情况,与现实数据可能有所差异,预测模型仅供参考。


原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-08-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

金融大鳄索罗斯再度唱空中国经济,深度学习能预测金融危机?

【新智元导读】金融大鳄索罗斯日前发表评论,他看空中国经济,目前正在做空亚洲货币。今天,《人民日报》海外版刊文斥责索罗斯的“唱空论”。那么,中国情况究竟怎样?芬兰...

4068
来自专栏腾讯云安全的专栏

极棒 CAAD 登陆 DEF CON:腾讯安全云鼎实验室揭秘病毒免杀“新武器”

1482
来自专栏FreeBuf

深度学习:能击败欧洲围棋冠军,还能防恶意软件

上月底,权威科学杂志Nature发表了一篇关于谷歌人工智能程序AlphaGo击败欧洲围棋冠军的文章,其中介绍了AlphaGo程序的细节,它实际上是一个结合了深度...

1897
来自专栏安恒信息

安恒信息两篇核心AI异常检测论文入选IEEE DSC国际会议

6月18日-21日,“第三届IEEE网络空间数据科学国际会议”在广州召开。业界代表及专家齐聚一堂,并就网络空间数据科学的科研和前沿发展方向进行交流。而安恒信息的...

1574
来自专栏钱塘大数据

揭秘微信身份证背后的高科技——人脸识别技术

在日常生活中,相信很多人都会遇到需要证明“我就是我”的尴尬处境,如果碰巧未带身份证,就只好陷入有苦难言的无奈之中。最近,全国首张微信身份证发行,从此只要带着手机...

44011
来自专栏钱塘大数据

麦肯锡用数据说明,关于深度学习有120个商业机会

麦肯锡研究发布了深度学习将影响的12个领域,每个领域又分为10个方面。换言之,这就是深度学习的120个商业机会。 有理由相信,深度学习将彻底改变以下提及的这1...

34810
来自专栏IT派

厉害!超越微软、Google、Facebook ! 旷视科技包揽 COCO、Places 三项世界冠军

如果你觉得好的话,不妨分享到朋友圈。 当地时间10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 International Conference o...

3585
来自专栏大数据文摘

Deep Learning:from AI to True-AI(34PPT)

20911
来自专栏数说工作室

量化投资之资本资产定价模型(CAPM)

量化投资之资本资产定价模型 (CAPM) 目录 一、前言 二、CAPM模型 1. 切点组合、分离定理与市场组合 2. 资本市场线 ...

44912
来自专栏大数据

做全球最大的司法信息资源库——中国司法大数据服务网上线记

11月30日上午,最高人民法院召开中国司法大数据研究院专题研究暨中国司法大数据服务网上线新闻发布会,最高人民法院信息中心主任许建峰介绍了中国司法大数据研究院专题...

2140

扫码关注云+社区