腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

杨熹的专栏

专栏作者

302

文章

365405

阅读量

55

订阅数

Python 爬虫 2 爬取多页网页

python 爬虫正则表达式存储

参考资料：极客学院: Python单线程爬虫代码：2.Single-thread-crawler.ipynb 本文内容： Requests.get 爬取多个页码的网页例：爬取极客学院课程列表爬虫步骤打开目标网页，先查看网页源代码 get网页源码找到想要的内容，找到规律，用正则表达式匹配，存储结果 Requests 收录了 python 的第三方http库完美地替代了 python 的 urllib2 模块更多的自动化，更友好的用户体验，更完善的功能 1. Requests.get import

2018-04-02

2K0

Python 爬虫 1 快速入门

python 爬虫正则表达式

Python 爬虫快速入门参考资料：极客学院: Python定向爬虫代码：1.crawler-basic.ipynb 本文内容：正则表达式用正则表达式抓取 html 内容半自动爬虫实战：抓取网页上的图片 1. 正则表达式 #-*-coding:utf8-*- # 导入re，正则表达式库文件 import re # from re import findall,search,S secret_code = 'hadkfalifexxIxxfasdjifja134xxlovexx23345sdf

2018-04-02

5600

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态