前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用R语言作上海房价预测模型

用R语言作上海房价预测模型

作者头像
机器学习AI算法工程
发布2018-03-14 14:00:21
3.6K0
发布2018-03-14 14:00:21
举报
文章被收录于专栏:机器学习AI算法工程

考虑到商品房经济始于1998年,且可供查找的数据截止到2011年,故本文的数据来源于1998-2011年的《上海统计年鉴》和国家统计局。在本文中主要讨论影响上海商品房房价的因素及各个因素对于房价的影响作用,考虑到房地产不同于一般的消费品,它不仅提供居住的功能,带来收租收益,发生价值增值,而且对人的行为有重要的影响,因此,在进行预测自由贸易下的房价时,本文主要从人均生产总值、人均可支配收入、商品零售价格指数、常住人口、住房竣工面积、住宅投资总额、居民居住消费价格指数7个方面来考虑对于商品房房价的影响。

本文在建模型时,先通过R软件拟合商品房房价与时间的非线性回归模型,再利用7个自变量与因变量商品房价多元线性关系,并进行逐步回归,得到最优回归模型。最后将时间的非线性回归模型与影响因素的多元线性模型预测值进行比较,给出2012、2013、2014年的房屋价格,其中2012年与2013年可与实际进行对比,进而评价模型的好坏。

数据准备

本文从研究影响房地产价格的因素入手,鉴于国家在1998年出台停止福利分房,进而促进了的商品房的自由贸易,故数据始于1998年,且上海统计年鉴可查的到2011年年鉴,故通过综合国家统计局及上海市年鉴1998年——2011年的房地产相关数据,最后筛选出如下可能影响未来房地产价格走势的变量,本文取定七个因素:

x1:人均生产总值;

x2:人均可支配收入;

x3:商品零售价格指数;

x4:常住人口;

x5:住房竣工面积;

x6:住宅投资总额;

x7:居民居住消费价格指数;

xm: 上海商品房房产均价

数据如下:

建立非线性模型

首先对y画出关于时间t的散点图,对应的R语言程序为:

X=read.csv("D:\\shanghaifangjia.csv")

attach(X)

plot(t,y)

得到图一:

R语言程序为:

y1=log(ym)

a1=log(a)

reg=lm(y1~t)

summary(reg)

得到结果如下:

R语言程序为:

a1= -3.281e+02

a=exp(a1)

b= 1.681e-01

yy=a*exp(b*t)

plot(t,ym)

lines(t,yy)

得到如图:

回归方程的检验

模型的建立

模型的求解

得到散点图如下:

利用程序cor(X)得到相关矩阵并整理得:

y

t 0.9195056

y 1.0000000

x1 0.9533447

x2 0.9792964

x3 0.6385694

x4 0.9490735

x5 -0.3246709

x6 0.9005302

x7 -0.1598100

得到如下的七个结果:

首先对七个变量建立多元回归方程的R语言程序为:

reg1=lm(ym~x1+x2+x3+x4+x5+x6+x7)

summary(reg1)

得到如下结果:

将结果整理得:

估计值

标准差

t值

P值

β0

-4.725e+04

1.975e+04

-2.393

0.05384

β1

-4.246e-01

2.239e-01

-1.897

0.10665

β2

1.259e+00

3.204e-01

3.928

0.00773 **

β3

5.876e+00

2.104e+00

2.792

0.03148 *

β4

9.312e+00

1.086e+01

0.857

0.42413

β5

1.630e-01

6.739e-01

0.242

0.81691

β6

3.758e+00

1.788e+00

2.102

0.08031

β7

8.121e+01

8.101e+01

1.003

0.35479

得到如下结果:

得到如下结果:

得到如下结果:

对结果整理得:

估计值

标准差

T值

P值

β0

-3.136e+04

3.535e+03

-8.873

9.59e-06 ***

β1

-2.538e-01

5.395e-02

-4.705

0.00111 **

β2

1.126e+00

1.287e-01

8.750

1.07e-05 ***

β3

6.916e+00

8.896e-01

7.774

2.78e-05 ***

β6

4.538e+00

9.577e-01

4.738

0.00106 **

模型的总结

指数方程预测房价

三年的预测值为:

2012

2013

2014

24765.33

29298.75

34662.03

多元线性回归预测房价

自变量

增长率

2012年

2013年

2014年

人均生产总值

10%

90816

99897.6

109887.4

人均可支配收入

10%

39853

43838.3

48222.1

商品零售价格指数

2%

4369.7

4457.1

4546.2

住宅投资总额

7%

1501.35

1606.44

1718,89

带入回归方程,则可得多元线性方程预测的三年房价的值为:

2012

2013

2014

27499.35

30763.24

34245.12

预测模型的对比评价

通过收集实际数据,与两个预测模型进行对比,可对预测的结果进行评价得到结果如下:

两个模型预测房价与实际房价的对比:

2012

2013

2014

实际房价

25691

29537(截止到5月)

时间指数模型预测值

24765.33

29298.75

34662.03

与实际的偏差比例

3.6%

6.6%

多因素回归模型预测值

27499.35

30763.24

34245.12

与实际的偏差比例

6.5%

4.2%

则可知,指数模型和多因素线性回归模型均得到较好的预测值,预测偏差均非常小。根据房价时间模型,房价将随着时间呈指数增长之势,因此必须出台相关政策,有效抑制房价增长。根据多元线性模型,房价与各个自变量的正负相关性就是各个变量前系数的正负。要抑制房价的增长,可以通过使系数为正的自变量增长率减少,系数为负的自变量增长率增加来达到目的。比如可以通过中央人民银行对于贷款利率的增加,减少投资者的过度投机行为,使土地拍卖价格降低,直接降低房屋成本,同时贷款利率的增加减少了房地产商的贷款,使房地产商资金面收紧,迫使其降价卖出现有房屋,已达到回笼资金偿还原来贷款的目的。

由于某些数据的缺少,有些数据从网上搜索得到,可能会存在不准确的情况,与现实数据可能有所差异,预测模型仅供参考。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-08-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据挖掘DT数据分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档