数据分析:浅析如何在北京买到理想的房子?

之前看到一篇超级经典的用数据选房的案例分析,只是由于资料变更找不到了,大致记得是采集和挖掘了房管局、统计局、各售房平台、区域发改委数据、交通数据、学校数据等等作为样本来分析,最终一步步找到理想的房子。

今天我看到了相对不错的文章,现在分享给大家:

选房,是买房的第一步,也是最复杂的一步,北京有近万个小区,近千所小学,没几个月的踩盘研究,很难选出适合自己的小区。

如何优化这个流程,让你输入需求,一步选出适合自己的房子?

虚拟个人,沙小鸟,后厂村路辛苦打拼的项目经理,和女朋友想买套600万左右的房子,小区离上班地方近点,住着舒服点,如果能考虑下孩子上学就更好了。

从之前采集微博和中介线上提问的数据看,人们关心的顺序是自住环境>学校>潜力。

1.自住环境

通勤时间,小鸟在西二旗百度大厦上班,他希望花在路上时间不超过1小时 ,我们按9点上班,6点下班算,北京记录在册的10700个小区,有3472个满足要求。

下图为北京不同城区到西二旗的路径动态图。

西二旗通勤图

周边配套,要求小区周边2公里内有10个3.5星以上饭店,5公里内有一家综合医院,以西二旗地铁站为例,蓝色标注为饭店,红色为综合医院。

西二旗配套分布图

小区环境,建成年代在1980年以后,面积在80-100平,两居和三居最宜,还剩201个小区,小区分布如下图。

小区分布图

2.学校

把北京小学分成5类,分布如下图:

第一梯队红色点,拥有极好的理念和口碑,在升学上占尽优势。

第二梯队蓝色点,在本城区内排名靠前,实力稳定过硬。

第三梯队绿色点,学校环境,学风都不错,在所属片区内有口碑。

第四梯队白色点,普通小学,没有明显的优点或者缺点。

第五梯队不标注,渣。

201个小区,剔除掉所属小学为渣小的,还剩81个小区。

3.潜力

潜力,通过回溯历史数据,敏感性比较,计算影响因子权重,根据不同地区,生成价格模型。

对现阶段,周边地区人流,企业入驻信息采集数据,配合最新城市规划,找出价值洼地。

什么是价值洼地?如何衡量潜力?

这部分比较敏感,我稍微举个例子:

按首付一半算,昌平在2015年前的年化是10%,西城是22%。

如果按目前贷款额度看,北京一大部分地区已经失去了作为家庭investment存在的意义,甚至有跑输定存的风险,这种地区,在部分权重因子上表现惊人的相似。

最终这81个小区分布如下,注意,不做推荐,只是举例分析。

有了心仪小区,下个房源APP,把自己关注的小区拉进去,每天看看有没有降价的好房源。

总结

除了列出来的条件,还有其他诸如小区环境,物业,随着数据的进一步积累,也可以将抽象的数据量化出来,辅助选择。

大数据的潜力不仅于此,我们可以通过采集周边数据,指出新盘定价是否合理~采集计生委每年新生婴儿数量,预估学位需求~

未来,只要你提出需求,就会自动选出符合你要求的房子,配合VR看房,将一切流程最简化,省却了数个月的踩盘看房。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据科学与人工智能

【应用】信用评分卡:简介

这次事件发生在2009年左右的一个朋友聚会上,这是该地球长期以来最严重的金融危机。街上的乔意识到抵押支持证券(MBS),次级贷款和信贷危机等因素是他困境原因。 ...

1512
来自专栏PPV课数据科学社区

NetFlix百万美金数据建模大奖的故事

我常对学生讲,互联网真是个好东西,它为年轻人提供了绝佳的施展舞台和成功的技术条件,那里有无穷的宝藏,数不清的成功机会。有不少学生听了这个说法并不理解,他们往往认...

4586
来自专栏数据科学与人工智能

大数据,小数据,哪道才是你的菜?

美国著名科技历史学家梅尔文?克兰兹伯格(Melvin Kranzberg),曾提出过大名鼎鼎的科技六定律,其中第三条定律是这样的[1]:“技术是总是配“套”而...

2487
来自专栏机器之心

演讲 | 运筹学专家叶荫宇:在物流、零售与金融行业,优化算法如何改变决策方式?

机器之心整理 参与:杜夏德 运筹学的历史比 AI 和机器学习更悠久,但 AI 与机器学习又为它提供了一种机会,很多顶层的东西都是要靠优化,不管是学习还是刚才讲到...

5008
来自专栏量子位

Goodfellow说,聊失败才不是在秀优越...

Ian Goodfellow是来自谷歌大脑的科学家。作为GAN的爸爸,他也是MIT科技评论选中的“35 under 35”中的一员。

831
来自专栏区块链大本营

王欣的哲学逻辑与产品猜想

2815
来自专栏CVer

我的八年博士生涯(学术篇)

Amusi日常逛知乎,于昨天(2018-11-23)看到关注的大神"王赟 Maigo"分享了一篇文章"11167 我的八年博士生涯——学术篇"。这篇文章重点介绍...

1672
来自专栏用户3246163的专栏

[和坚FRM1学习笔记_2.0]1.1 风控原则

风险管理的目标是减少和消除EL,但是更concern UL,A对 承担风险的数量和潜在损失的大小不是绝对相关的,B错 风险管理的最后一步是监控,C错 风险...

3604
来自专栏腾讯研究院的专栏

微信行为学:注意力是最稀缺的社交资源

汪丁丁 北京大学国家发展研究院经济学教授   微信也有行为学?   行为学研究动物(包括人类)乃至植物的行为,基于实证研究方法,逐渐深入,心理学和认知...

4276
来自专栏华章科技

数据说谎的艺术

大数据时代,数据被称为新时期的石油,但与石油又不同,其价值的体现很大程度依赖于人的解释,虽然数据本身不会说谎,但这给数据说谎提供了操作空间,具备数据甄别能力对于...

993

扫码关注云+社区

领取腾讯云代金券