用R语言作上海房价预测模型

考虑到商品房经济始于1998年,且可供查找的数据截止到2011年,故本文的数据来源于1998-2011年的《上海统计年鉴》和国家统计局。在本文中主要讨论影响上海商品房房价的因素及各个因素对于房价的影响作用,考虑到房地产不同于一般的消费品,它不仅提供居住的功能,带来收租收益,发生价值增值,而且对人的行为有重要的影响,因此,在进行预测自由贸易下的房价时,本文主要从人均生产总值、人均可支配收入、商品零售价格指数、常住人口、住房竣工面积、住宅投资总额、居民居住消费价格指数7个方面来考虑对于商品房房价的影响。

本文在建模型时,先通过R软件拟合商品房房价与时间的非线性回归模型,再利用7个自变量与因变量商品房价多元线性关系,并进行逐步回归,得到最优回归模型。最后将时间的非线性回归模型与影响因素的多元线性模型预测值进行比较,给出2012、2013、2014年的房屋价格,其中2012年与2013年可与实际进行对比,进而评价模型的好坏。

数据准备

本文从研究影响房地产价格的因素入手,鉴于国家在1998年出台停止福利分房,进而促进了的商品房的自由贸易,故数据始于1998年,且上海统计年鉴可查的到2011年年鉴,故通过综合国家统计局及上海市年鉴1998年——2011年的房地产相关数据,最后筛选出如下可能影响未来房地产价格走势的变量,本文取定七个因素:

x1:人均生产总值;

x2:人均可支配收入;

x3:商品零售价格指数;

x4:常住人口;

x5:住房竣工面积;

x6:住宅投资总额;

x7:居民居住消费价格指数;

xm: 上海商品房房产均价

数据如下:

建立非线性模型

首先对y画出关于时间t的散点图,对应的R语言程序为:

X=read.csv("D:\\shanghaifangjia.csv")

attach(X)

plot(t,y)

得到图一:

R语言程序为:

y1=log(ym)

a1=log(a)

reg=lm(y1~t)

summary(reg)

得到结果如下:

R语言程序为:

a1= -3.281e+02

a=exp(a1)

b= 1.681e-01

yy=a*exp(b*t)

plot(t,ym)

lines(t,yy)

得到如图:

回归方程的检验

模型的建立

模型的求解

得到散点图如下:

利用程序cor(X)得到相关矩阵并整理得:

y

t 0.9195056

y 1.0000000

x1 0.9533447

x2 0.9792964

x3 0.6385694

x4 0.9490735

x5 -0.3246709

x6 0.9005302

x7 -0.1598100

得到如下的七个结果:

首先对七个变量建立多元回归方程的R语言程序为:

reg1=lm(ym~x1+x2+x3+x4+x5+x6+x7)

summary(reg1)

得到如下结果:

将结果整理得:

估计值

标准差

t值

P值

β0

-4.725e+04

1.975e+04

-2.393

0.05384

β1

-4.246e-01

2.239e-01

-1.897

0.10665

β2

1.259e+00

3.204e-01

3.928

0.00773 **

β3

5.876e+00

2.104e+00

2.792

0.03148 *

β4

9.312e+00

1.086e+01

0.857

0.42413

β5

1.630e-01

6.739e-01

0.242

0.81691

β6

3.758e+00

1.788e+00

2.102

0.08031

β7

8.121e+01

8.101e+01

1.003

0.35479

得到如下结果:

得到如下结果:

得到如下结果:

对结果整理得:

估计值

标准差

T值

P值

β0

-3.136e+04

3.535e+03

-8.873

9.59e-06 ***

β1

-2.538e-01

5.395e-02

-4.705

0.00111 **

β2

1.126e+00

1.287e-01

8.750

1.07e-05 ***

β3

6.916e+00

8.896e-01

7.774

2.78e-05 ***

β6

4.538e+00

9.577e-01

4.738

0.00106 **

模型的总结

指数方程预测房价

三年的预测值为:

2012

2013

2014

24765.33

29298.75

34662.03

多元线性回归预测房价

自变量

增长率

2012年

2013年

2014年

人均生产总值

10%

90816

99897.6

109887.4

人均可支配收入

10%

39853

43838.3

48222.1

商品零售价格指数

2%

4369.7

4457.1

4546.2

住宅投资总额

7%

1501.35

1606.44

1718,89

带入回归方程,则可得多元线性方程预测的三年房价的值为:

2012

2013

2014

27499.35

30763.24

34245.12

预测模型的对比评价

通过收集实际数据,与两个预测模型进行对比,可对预测的结果进行评价得到结果如下:

两个模型预测房价与实际房价的对比:

2012

2013

2014

实际房价

25691

29537(截止到5月)

时间指数模型预测值

24765.33

29298.75

34662.03

与实际的偏差比例

3.6%

6.6%

多因素回归模型预测值

27499.35

30763.24

34245.12

与实际的偏差比例

6.5%

4.2%

则可知,指数模型和多因素线性回归模型均得到较好的预测值,预测偏差均非常小。根据房价时间模型,房价将随着时间呈指数增长之势,因此必须出台相关政策,有效抑制房价增长。根据多元线性模型,房价与各个自变量的正负相关性就是各个变量前系数的正负。要抑制房价的增长,可以通过使系数为正的自变量增长率减少,系数为负的自变量增长率增加来达到目的。比如可以通过中央人民银行对于贷款利率的增加,减少投资者的过度投机行为,使土地拍卖价格降低,直接降低房屋成本,同时贷款利率的增加减少了房地产商的贷款,使房地产商资金面收紧,迫使其降价卖出现有房屋,已达到回笼资金偿还原来贷款的目的。

由于某些数据的缺少,有些数据从网上搜索得到,可能会存在不准确的情况,与现实数据可能有所差异,预测模型仅供参考。


原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-08-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏钱塘大数据

麦肯锡用数据说明,关于深度学习有120个商业机会

麦肯锡研究发布了深度学习将影响的12个领域,每个领域又分为10个方面。换言之,这就是深度学习的120个商业机会。 有理由相信,深度学习将彻底改变以下提及的这1...

34410
来自专栏腾讯云安全的专栏

极棒 CAAD 登陆 DEF CON:腾讯安全云鼎实验室揭秘病毒免杀“新武器”

1412
来自专栏华章科技

麦肯锡报告:关于深度学习有120个商业机会

有理由相信,深度学习将彻底改变以下提及的这12个领域。 这些行业的大多数领导者都在关注机器学习,不过他们却认为深度学习带来的改变在遥远的未来才会发生。他们错了。...

732
来自专栏量子位

从没见过干净图片,英伟达AI就学会了去噪大法 | ICML论文

761
来自专栏新智元

【CVPR最强参会指南】深度学习走下神坛,中国AI独角兽强势抢镜

1443
来自专栏IT派

厉害!超越微软、Google、Facebook ! 旷视科技包揽 COCO、Places 三项世界冠军

如果你觉得好的话,不妨分享到朋友圈。 当地时间10月29日上午,在意大利威尼斯召开的计算机视觉国际顶级会议 International Conference o...

3485
来自专栏机器学习算法与理论

智慧医疗终端应用模型与仿真系统设计

摘要:为进一步整合开放医疗数据和社会其他资源,本文提出了一套数据利用方案。以无锡市局部路网为原型,构建了一基于互联网+医疗的用户终端应用模型。该模型包括路径寻优...

38610
来自专栏ATYUN订阅号

【学术】国外技术大神用机器学习来预测ICO的收益

加密货币是一种数字资产,它是一种交换媒介,使用密码学来保护其交易,控制额外单位的创建,并验证资产的转移。 关于加密货币,你还知道更多其他的吗?事实上,每天都有新...

2707
来自专栏新智元

【一张图看疯狂的NIPS 2017】十年数据盘点今年NIPS多项“历史之最”

【新智元导读】要说今年的NIPS有多火?Facebook的Alex LeBurn做了一张图,展示了从2012年到今年NIPS售票情况,今年的门票抢购速度惊人,距...

3218
来自专栏钱塘大数据

揭秘微信身份证背后的高科技——人脸识别技术

在日常生活中,相信很多人都会遇到需要证明“我就是我”的尴尬处境,如果碰巧未带身份证,就只好陷入有苦难言的无奈之中。最近,全国首张微信身份证发行,从此只要带着手机...

40511

扫码关注云+社区