前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Scrapy框架对接selenium模拟知乎登录

Scrapy框架对接selenium模拟知乎登录

作者头像
不断折腾
发布2019-09-23 10:18:40
5260
发布2019-09-23 10:18:40
举报

概要:之前写了scrapy的基础,准备尝试模拟知乎登录,并爬取问答。 但是发现知乎已经做了更新,对参数做了加密处理,身为小白的我只好试试selenium,本篇文章我们来了解scrapy框架如何对接selenium。

1、新建项目

新建项目,以及基本的操作在上一篇文章应该都有了解,如果现在还不了解,

这里献上链接:爬虫框架Scrapy的安装与基本使用

2、模拟知乎登录

首先需要在seetings.py中将ROBOTSTXT_OBEY = True修改为ROBOTSTXT_OBEY = False,ROBOTSTXT_OBEY 可以说是君子协议吧,我们修改成False,否则不能爬取。

然后再spider写下如下代码:

对于selenium不了解的可以查看:selenium的使用(有点意思)

3、运行

这里教大家一个小技巧

我们在项目下创建一个main文件写下如下代码:

即可。

这样我们就不用每次在黑窗口下运行,很麻烦。

总结:

这次只是简单的写了下selenium在scrapy框架中运用,没有用到什么新知识。

希望不懂的可以看下基础。

完。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-07-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 python入门到放弃 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档