首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >返回仅包含找到关键字的urls的文件

返回仅包含找到关键字的urls的文件
EN

Stack Overflow用户
提问于 2021-02-09 20:46:13
回答 1查看 20关注 0票数 0

我正在尝试使用scrapy来抓取urls列表,并仅将找到特定关键字的urls作为输出。我通过shell尝试了if语句,它似乎起作用了--我尝试了if(..):exit(),它确实退出了shell--但是下面的输出是一个空文件(使用的url与在shell中返回if语句的url相同)。

代码语言:javascript
代码运行次数:0
运行
复制
def parse(self, response):

    filename = f'file.txt'
    
    if (response.css('*').re('keyword')):
            with open(filename, 'wb') as f:
                f.write(response.url)
            self.log(f'Saved file {filename}')
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-02-09 21:13:58

您以写二进制模式打开文件并尝试向其中写入字符串,这应该会引发错误。

而不是以附加模式打开文件:with open(filename, 'a') as f:

或者仅仅处于写入模式:with open(filename, 'a') as f:

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66119288

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档