用R语言作上海房价预测模型

考虑到商品房经济始于1998年,且可供查找的数据截止到2011年,故本文的数据来源于1998-2011年的《上海统计年鉴》和国家统计局。在本文中主要讨论影响上海商品房房价的因素及各个因素对于房价的影响作用,考虑到房地产不同于一般的消费品,它不仅提供居住的功能,带来收租收益,发生价值增值,而且对人的行为有重要的影响,因此,在进行预测自由贸易下的房价时,本文主要从人均生产总值、人均可支配收入、商品零售价格指数、常住人口、住房竣工面积、住宅投资总额、居民居住消费价格指数7个方面来考虑对于商品房房价的影响。

本文在建模型时,先通过R软件拟合商品房房价与时间的非线性回归模型,再利用7个自变量与因变量商品房价多元线性关系,并进行逐步回归,得到最优回归模型。最后将时间的非线性回归模型与影响因素的多元线性模型预测值进行比较,给出2012、2013、2014年的房屋价格,其中2012年与2013年可与实际进行对比,进而评价模型的好坏。

数据准备

本文从研究影响房地产价格的因素入手,鉴于国家在1998年出台停止福利分房,进而促进了的商品房的自由贸易,故数据始于1998年,且上海统计年鉴可查的到2011年年鉴,故通过综合国家统计局及上海市年鉴1998年——2011年的房地产相关数据,最后筛选出如下可能影响未来房地产价格走势的变量,本文取定七个因素:

x1:人均生产总值;

x2:人均可支配收入;

x3:商品零售价格指数;

x4:常住人口;

x5:住房竣工面积;

x6:住宅投资总额;

x7:居民居住消费价格指数;

xm: 上海商品房房产均价

数据如下:

建立非线性模型

首先对y画出关于时间t的散点图,对应的R语言程序为:

X=read.csv("D:\\shanghaifangjia.csv")

attach(X)

plot(t,y)

得到图一:

R语言程序为:

y1=log(ym)

a1=log(a)

reg=lm(y1~t)

summary(reg)

得到结果如下:

R语言程序为:

a1= -3.281e+02

a=exp(a1)

b= 1.681e-01

yy=a*exp(b*t)

plot(t,ym)

lines(t,yy)

得到如图:

回归方程的检验

模型的建立

模型的求解

得到散点图如下:

利用程序cor(X)得到相关矩阵并整理得:

y

t 0.9195056

y 1.0000000

x1 0.9533447

x2 0.9792964

x3 0.6385694

x4 0.9490735

x5 -0.3246709

x6 0.9005302

x7 -0.1598100

得到如下的七个结果:

首先对七个变量建立多元回归方程的R语言程序为:

reg1=lm(ym~x1+x2+x3+x4+x5+x6+x7)

summary(reg1)

得到如下结果:

将结果整理得:

估计值

标准差

t值

P值

β0

-4.725e+04

1.975e+04

-2.393

0.05384

β1

-4.246e-01

2.239e-01

-1.897

0.10665

β2

1.259e+00

3.204e-01

3.928

0.00773 **

β3

5.876e+00

2.104e+00

2.792

0.03148 *

β4

9.312e+00

1.086e+01

0.857

0.42413

β5

1.630e-01

6.739e-01

0.242

0.81691

β6

3.758e+00

1.788e+00

2.102

0.08031

β7

8.121e+01

8.101e+01

1.003

0.35479

得到如下结果:

得到如下结果:

得到如下结果:

对结果整理得:

估计值

标准差

T值

P值

β0

-3.136e+04

3.535e+03

-8.873

9.59e-06 ***

β1

-2.538e-01

5.395e-02

-4.705

0.00111 **

β2

1.126e+00

1.287e-01

8.750

1.07e-05 ***

β3

6.916e+00

8.896e-01

7.774

2.78e-05 ***

β6

4.538e+00

9.577e-01

4.738

0.00106 **

模型的总结

指数方程预测房价

三年的预测值为:

2012

2013

2014

24765.33

29298.75

34662.03

多元线性回归预测房价

自变量

增长率

2012年

2013年

2014年

人均生产总值

10%

90816

99897.6

109887.4

人均可支配收入

10%

39853

43838.3

48222.1

商品零售价格指数

2%

4369.7

4457.1

4546.2

住宅投资总额

7%

1501.35

1606.44

1718,89

带入回归方程,则可得多元线性方程预测的三年房价的值为:

2012

2013

2014

27499.35

30763.24

34245.12

预测模型的对比评价

通过收集实际数据,与两个预测模型进行对比,可对预测的结果进行评价得到结果如下:

两个模型预测房价与实际房价的对比:

2012

2013

2014

实际房价

25691

29537(截止到5月)

时间指数模型预测值

24765.33

29298.75

34662.03

与实际的偏差比例

3.6%

6.6%

多因素回归模型预测值

27499.35

30763.24

34245.12

与实际的偏差比例

6.5%

4.2%

则可知,指数模型和多因素线性回归模型均得到较好的预测值,预测偏差均非常小。根据房价时间模型,房价将随着时间呈指数增长之势,因此必须出台相关政策,有效抑制房价增长。根据多元线性模型,房价与各个自变量的正负相关性就是各个变量前系数的正负。要抑制房价的增长,可以通过使系数为正的自变量增长率减少,系数为负的自变量增长率增加来达到目的。比如可以通过中央人民银行对于贷款利率的增加,减少投资者的过度投机行为,使土地拍卖价格降低,直接降低房屋成本,同时贷款利率的增加减少了房地产商的贷款,使房地产商资金面收紧,迫使其降价卖出现有房屋,已达到回笼资金偿还原来贷款的目的。

由于某些数据的缺少,有些数据从网上搜索得到,可能会存在不准确的情况,与现实数据可能有所差异,预测模型仅供参考。


原文发布于微信公众号 - 大数据挖掘DT数据分析(datadw)

原文发表时间:2016-08-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏奇点大数据

DeepMind 重大突破:AI 进化出大脑级导航能力,像动物一样会“抄小路”

继在围棋棋盘上轻松战胜人类后,AI似乎在对空间的认知和巡航能力上也要将人类“踩在脚下了。

952
来自专栏腾讯大数据的专栏

腾讯数平精准推荐 | OCR技术之识别篇

本文介绍了腾讯数平精准推荐团队的OCR识别算法,包括识别算法的演进之路以及4个代表性方法。

5.8K11
来自专栏量子位

深度学习进化编年大事记

安妮 编译自 Import.io官方博客 量子位出品 | 公众号 QbitAI 本文作者Andrew Fogg,可视化网页抓取网站Import.io的联合创始人...

3317
来自专栏吉浦迅科技

Facebook的三堂AI入门课

语音助理、智慧家电、购物推荐⋯⋯ 人工智能替我们的生活中带来便利,但却也让不少人担心人工智能发展到最后,是否会产生自主行为,形成电影中机器挑战人类的情节。 在图...

34814
来自专栏华章科技

500款各领域机器学习数据集,总有一个是你要找的

美国劳工部统计局官方发布数据:http://dataju.cn/Dataju/web/datasetInstanceDetail/139

481
来自专栏机器之心

业界 | 搜狗机器翻译团队获得 WMT 2017 中英机器翻译冠军

搜狗语音交互技术中心 机器之心报道 每年的第三季度都是机器学习相关的顶级学术会议密集召开的时期,今年也不例外。其中,作为自然语言处理领域顶级国际会议之一的 EM...

34513
来自专栏目标检测和深度学习

CVPR 2018视频行为识别挑战赛结果出炉:前三名均由国内团队包揽

Moment 是由 MIT-IBM Watson AI Lab 开发的研究项目。该项目致力于构建超大规模数据集来帮助 AI 系统识别和理解视频中的动作和事件。

682
来自专栏机器之心

学界 | 结合生成式与判别式方法,Petuum新研究助力医疗诊断

34112
来自专栏大数据文摘

学界 | 北邮夺冠CVPR 2018 DeepGlobe比赛,他们是这样做卫星图像识别的

在刚刚结束的CVPR2018: DeepGlobe Road Extraction Challenge(全球卫星图像道路提取)比赛中,北京邮电大学信息与通信工程...

1115
来自专栏计算机视觉life

智能手机双摄像头原理解析:RGB +Depth

本篇来探讨一下智能手机摄像头中:普通彩色相机(RGB) + 深度相机(Depth)的技术原理。 首先来解释一下什么是深度相机吧。 深度相机 顾名思义,深度相机就...

2815

扫描关注云+社区