前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python scrapy 模拟登录(最基础)

python scrapy 模拟登录(最基础)

作者头像
用户5760343
发布2022-01-10 08:15:02
4450
发布2022-01-10 08:15:02
举报
文章被收录于专栏:sktj

l=ItemLoader(item=xxxItem(),response=response) l.add_xpath('title','//xxx',MapCompose(str.strip,str.title)) MapCompose(float) #turn to float l.add_value('title',response.url) l.load_item() start_URL=[i.strip() for i in open('xxx').readlines()] 1、scrapy startproject loginscrapy cd loginscrapy scrapy genspider -t basic loginspider example 2、设置setting.py:添加 USER_AGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_3) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.54 Safari/536.5' 3、vi spider/loginspider

-- coding: utf-8 --

import scrapy from scrapy import Request,FormRequest

class BasicloginSpider(scrapy.Spider): name = 'basiclogin' allowed_domains = ['example.webscraping.com']

start_urls = ['http://example.webscrping.com/']

代码语言:javascript
复制
def start_requests(self):
    return [Request("http://example.webscraping.com/places/default/user/login",callback=self.login,meta={"cookiejar":1})]
def login(self, response):
    data={"email":"liushuo@webscraping.com","password":"12345678"}
    return [FormRequest.from_response(response,meta={"cookiejar":response.meta["cookiejar"]},callback=self.parse)]
def parse(self,response):
    print("logined")
    print(response.url)

登录页面只有用户名和密码,没有验证码,且里面有form元素,可以通过formid来指定用哪个form

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.05.14 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • -- coding: utf-8 --
  • start_urls = ['http://example.webscrping.com/']
    • 登录页面只有用户名和密码,没有验证码,且里面有form元素,可以通过formid来指定用哪个form
    相关产品与服务
    验证码
    腾讯云新一代行为验证码(Captcha),基于十道安全栅栏, 为网页、App、小程序开发者打造立体、全面的人机验证。最大程度保护注册登录、活动秒杀、点赞发帖、数据保护等各大场景下业务安全的同时,提供更精细化的用户体验。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档