首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

数据爬取、清洗到分析,如何徒手研究上海二手房房价

本文由作者:孙培培 原创投稿 声明:本文所公布代码及数据仅作学习用,若别有用途则后果自行承担。 提到上海,不得不提上海的高房价,最近一篇上海各市辖区均价的文章引起了我的注意,6月上海各辖区甚至各小区的房价到底处于一个什么样的水平呢? 我打算自己动手研究一下(本文主要研究2016年6月上海二手房房价水平,读者如果有研究房价变动的兴趣可以等到7月末的时候再研究下,然后对比看看上海房价在这一个月的变动情况),数据来源为6月30日的安居客二手房信息。 首先要进行的数据的收集,然后进行数据的清洗、整理以及最后的分析

06

python 自动抓取分析房价数据——安居客版

中秋回家,顺便想将家里闲置的房子卖出去。第一次卖房,没经验,于是决定委托给中介。中介要我定个价。最近几年,房价是涨了不少,但是长期在外,也不了解行情。真要定个价,心里还没个数。网上零零散散看了下,没有个系统的感知。心想,身为一代码农,为何要用这种低效的方式去了解房价。于是,就有了今天这篇专栏,也是继上篇《python 自动抓取分析文章阅读量——掘金专栏版》json 爬虫的一个补充。这次要抓取的房价来自安居客,西双版纳房价数据(其他房产相关的垂直平台还未覆盖)。之所以说是上一篇的补充,因为,这次数据来自 html 。废话不多说,撸起袖子开始干。

01

链家网杭州房产销售分析

杭州,一个集历史厚重积淀与现代发展潜质于一身的城市:回望历史,是当年越王勾践屯兵抗吴的重要军事城堡,也是隋炀帝杨广兴修京杭大运河的目的地,更是宋高宗赵构在靖康之耻后辗转多地重建南宋的国都;放眼当下,作为国内新一线城市翘楚,是阿里巴巴总部所在,更常有国内各大企业分中心,16年G20峰会举办地,也是22年亚运会承办城市,坐拥西湖、湘湖和千岛湖三大风景名胜,与苏州享有“上有天堂,下有苏杭”的美誉。然而,也正是这些标签带来的网红属性,杭州的房价也是一路飙升。所以,今天就以链家网平台上的房产销售数据为样本,简单分析杭州楼市行情,以作参考。

01

数据可视化(pyecharts库的介绍)

序言:学校里不学python的,没有开设这门课程,暑假买了三本书,都是入门的书籍,连带看b站大佬的视频,就感觉还好,毕竟自己学过c和java了,虽然也都是基础。再来看其它编程语言时,你会发现,语言其实是相通的,许多地方很相似。 被python强大的库所吸引,库的强大带来许多的方便。有人说,只会在python里调用库的猿友们不是大佬,会看源码的猿友们可以称之为大佬。我有一个大佬梦,相信每个人都有,不管是否可以达到预期的目标。我们不管怎样,是否可以学到真正的东西,还是得靠持之以恒。 以上算是对我的一个鼓励吧,我总是在很多事情上说到做不到,我希望我在以后得经历中可以坚持做事。废话说的有点多,进入正题吧。 我们来介绍pyecharts库的基础入门。 1:pyecharts库简介: pyecharts分为两个版本,v0.5.X 和 v1,这两个版本是互不兼容的,有我没你的样子,v0.5.X这个版本支持python2.7,3.4+,而新版的v1只支持我们的python3.6+。更加悲催的是v0.5.X已经被开发团队抛弃了,像个没人管的孤儿了,现在的真正的骄子就是v1了。我们下面主要对v1进行简单介绍。 2:pyecharts库的安装: 我们还是老办法,首先装上这个库。来win+R打开控制台。具体如下图: 由于我的已经装好了,所以再次执行 此安装命令时,就会告诉我already satisfied.之前如果没装的猿友们会出现collect这种。然后会有一个进度条。

01
领券