腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

数据分析1480

专栏作者

433

文章

619199

阅读量

99

订阅数

担心爬虫UA代理不够用？教你一招屡试不爽的方法！

python scrapy 爬虫 http

摘要：爬虫过程中的反爬措施非常重要，其中设置随机 User-Agent 是一项重要的反爬措施，Scrapy 中设置随机 UA 的方式有很多种，有的复杂有的简单，本文就对这些方法进行汇总，提供一种只需要一行代码的设置方式。

2019-08-06

1.9K0

Scrapy框架系列--爬虫又被封了？（2）

http scrapy python tcp/ip 爬虫

上一篇文章《爬虫利器初体验（1）》中，我们举了个简单的栗子，但是在真实的开发中这样的爬虫代码很容易就会被封掉。那么怎么样才能避免这些事发生呢？这一这篇文章我们一起来学习，如何健壮我们的爬虫代码。

2019-08-06

7580

Scrapy框架系列--爬虫利器之初体验（1）

scrapy 数据库 sql python 爬虫

为什么要学 scrapy 呢？看下图中的招聘要求，就清楚了。很多招聘要求都有 scrapy，主要是因为 scrapy 确实很强。那到底强在哪里呢？请在文中找答案。

2019-08-05

4240

分析了 6000 款 App，竟有这么多佳软神器没用过

摘要：在《6000 多款 App，看我如何搞定她们并将其洗白白~》中我们详细地分享了有关Scrapy框架抓取App数据的流程，并对抓回来的数据作了进一步的清洗。在本次分享中，接着对抓取回来的数据进行探索性分析，让你知道目前App市场的状况。

2019-08-05

6640

6000 多款 App，看我如何搞定她们并将其洗白白~

scrapy 爬虫 php mongodb 数据库

如果说 GitHub 是程序员的天堂，那么酷安则是手机 App 爱好者们（别称「搞机」爱好者）的天堂，相比于那些传统的手机应用下载市场，酷安有三点特别之处：

2019-08-05

5210

Scrapy框架系列--综合案例之租房数据的现状（4）

爬虫数据分析 scrapy php

八月份的时候，由于脑洞大开，决定用 python 爬虫爬取了深圳的租房数据，并写了文章《用Python告诉你深圳房租有多高》，文章得到了一致好评和众多转载。由于我本身的朋友圈大多都在广州、深圳，因此，早就有挺多小伙伴叫我分析一下广州的租房价格现状，这不，文章就这样在众多呼声中出炉了。然后，此次爬虫技术也升级了，完善了更多细节。源码值得细细探究。此次分析采集了广州 11 个区，23339 条数据，如下图：

2019-08-05

3710

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态