腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
scrapy
python
中
使用
带有
URL
的
csv
文件
时
出错
、
、
我有多个
URL
要抓取存储
在
csv
文件
中
,其中每一行都是一个单独
的
URL
,我
使用
下面的代码来运行它 def start\\_requests(self): if
url
!= "": yield
scrapy</em
浏览 3
提问于2020-07-21
得票数 0
回答已采纳
2
回答
在
scrapy
中
从多个
文件
中
刮取多个地址
、
、
、
我
在
目录中有一些JSON
文件
。在任何这些
文件
中
,我都需要一些信息。我需要
的
第一个属性是"start_urls“
的
链接列表。我该怎么做?到目前为止,我<em
浏览 2
提问于2018-01-05
得票数 1
回答已采纳
3
回答
如何像一个简单
的
脚本那样以编程
的
方式运行一个刮破
的
蜘蛛?
、
、
现在,我可以
在
终端
中
通过这个命令运行:但是我想像一个简单
的
python
脚本一样运行它。
浏览 14
提问于2017-12-13
得票数 9
回答已采纳
2
回答
scrapy
shell:将结果输出到
文件
、
、
、
我如何在刮板壳输出结果到一个
文件
,最好是
csv
? 我
在
我
的
bpython shell中有一个有趣
的
元素列表,我可以把它们做成item。但是如何将其重定向到
文件
呢?
浏览 2
提问于2016-12-20
得票数 2
回答已采纳
1
回答
使用
Scrapy
:如何从一些提取
的
链接下载pdf
文件
、
我已经创建了一些从网站中提取链接
的
代码(PDF链接),现在我需要下载这些PDF
文件
,但是我很难做到这一点。这是代码: name = "all5" yield
scrapy
.Request(next_link,callback
浏览 0
提问于2019-07-28
得票数 0
回答已采纳
1
回答
python
scrapy
转换为exe
文件
使用
pyinstaller
、
、
我正在尝试转换一个
scrapy
脚本到一个exe
文件
。我正在
使用
pyinstaller.exe --onefile main.py将其转换为可执行
文件
。当我尝试打开dist
文件
夹
中
的
main.exe
文件
时
,它开始输
出错
误:我
浏览 2
提问于2018-05-24
得票数 2
4
回答
刮掉
的
csv
文件
有统一
的
空行吗?
、
这是蜘蛛:from danmurphys.items import DanmurphysItem namein urls: return itemimpor
浏览 8
提问于2016-09-13
得票数 6
回答已采纳
1
回答
python
刮伤需要帮助。我想保存到一个(.
csv
)
文件
中
。我该怎么做?
、
、
、
我
使用
(11.2),我想保存到一个(.
csv
)
文件
中
。我该怎么做?from
scrapy
.spiders import CSVFeedSpider name = 'cs_spider/'] start_urls = ['http://ocw.mit.edu/courses/electrical-engineering-and-comp
浏览 10
提问于2022-02-22
得票数 0
1
回答
在
csv
中将刮取
的
数据保存在一行而不是多行。
、
、
、
我
使用
刮除从一个网站刮网址,并将结果保存在一个
csv
文件
中
。但是它只保存在一行
中
,而不是多行。我试图
在
堆栈溢出
中
搜索答案,但在vain.Here
中
是我
的
文件
:from
scrapy
.item import Field, Item # print response.xpath('
浏览 1
提问于2018-02-22
得票数 0
回答已采纳
1
回答
如何打开一个包含urls列表
的
大型
csv
并抓取这些urls?
、
我
在
本地机器上有一个很大
的
csv
,它只包含一个urls列表,没有其他我想要抓取
的
列,并从每个urls中提取特定
的
css元素。我已经完成了一个测试,不看
csv
,只做一个一次性
的
开始
url
。我不知道如何打开一个包含一百万个urls
的
大型
csv
,让
scrapy
遍历每个urls,然后再转到下一个。import
scrapy
from ..items import stkscrapeItem
浏览 3
提问于2020-04-30
得票数 0
1
回答
抓取将额外
的
数据从
csv
文件
传递到解析。
、
、
、
我
的
抓取蜘蛛查看
csv
文件
并运行start_urls,其中包含
csv
文件
中
的
地址,如下所示: with open('addresses.
csv
where='+row["Address"].replace(',','').replace(' ','+') f
浏览 1
提问于2017-03-02
得票数 3
回答已采纳
2
回答
如何
使用
产量代替打印与刮擦选择器和硒?
、
、
、
、
from
scrapy
import Spiderfrom
scrapy
.selector import Selector print(price) pass 这里,刮刀打印价格,但当我
使用
收益率
时
我想把价格存到
csv
文件
里。如何
使用
“收益率”保存数据?
浏览 0
提问于2018-10-15
得票数 1
回答已采纳
1
回答
抓取/
Python
-试图错开蜘蛛
、
、
试图错开两只蜘蛛:spider2从.
csv
中
爬行,然后提取特定数据。FileNotFoundError: [Errno 2] No such file or directory: 'urls.
csv
' 看起来spider1无法首先触发,而且/或因为代码
的
顺序,那个
python
正在检查
文件
urls.
csv
,并且由于
文件
浏览 7
提问于2022-04-27
得票数 0
1
回答
将图像下载到绝对路径
、
li/a/img')): abs_path = os.path.abspath(path) #Path where I want to download 如何创建管道来将图像存储
在
我创建
的
绝对路径
中
,我检查了,但找不到改变存储位
浏览 0
提问于2020-03-12
得票数 0
回答已采纳
1
回答
抓取解析网页,提取结果页,并下载图像。
、
、
、
、
我已经用
python
编写了一个web爬虫,
使用
了Beautiful,并请求为一个项目抓取图像,但是速度很慢。我听说
Scrapy
要快得多,所以我安装了它并阅读了大量教程,但是我不知道如何在爬行器脚本
的
parse函数
中
实现爬虫。如果我提供到搜索结果
的
第一页
的
链接,它应该: 'id' 通过分析特定类
的
<a>标记来查找搜索结果
中
的
页数,并根据特定类
的
<a>标记分析
浏览 3
提问于2020-05-17
得票数 1
回答已采纳
1
回答
刮除-每个星形单独
的
输出
文件
、
、
、
、
我有一只皮肤粗糙
的
蜘蛛运行良好:import
scrapy
url
= response.urljoin(
url
) yield
scrapy
.Request(
url
=
url
,callback=self.parse_detailsdiv.ce_text.first.la
浏览 0
提问于2017-11-18
得票数 3
2
回答
乱码不能正常工作
…我有一个
在
shell
中
运行
的
scrapy
代码,但当我尝试将其导出到
csv
时
,它返回一个空
文件
。当我不进入链接并尝试解析描述
时
,它会导出数据 name = "dmoz" start_urls
浏览 0
提问于2016-03-30
得票数 0
1
回答
XPATH/
Python
/
Scrapy
-如何将文本附加到href
、
、
、
我正在
使用
Scrapy
和
Python
来抓取页面。我
的
目标是:我一直
在
试图让这个接口为XPATH工作--我相信这是语法
的
脱节,或者是href
的
位置脱节,但我还没有找
浏览 0
提问于2022-02-16
得票数 0
回答已采纳
1
回答
刮伤
中
的
ItemLoader
、
我
在
刮伤日志
中
没有发现任何错误,只是什么都没有被提取。任何想法都会有帮助
的
!allowed_domains = ['medium.com', 'towardsdatascience.com'] buttonNormal"]/text()')
浏览 1
提问于2020-02-24
得票数 0
回答已采纳
1
回答
如何在Spyder或VScode中
使用
Scrapy
、
我想在Spyder中
使用
Scrapy
,而不是通过终端/shell
使用
它。我是一个windows用户,
Scrapy
版本1.8.0,pyhton 3.7.3,我正面临着BeautifulSoup
的
问题。例如,我试图从一个网站获取一个产品
的
价格,问题是它并不总是得到数据,但
Scrapy
在这里通过
使用
CSS选择器工作得很好。所以我想将
Scrapy
与Spyder或Vscode一起
使用
,因为我还有其他依赖于
Sc
浏览 69
提问于2019-12-14
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券