腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Python
Scrapy
提取
子项
、
、
、
、
div class="post-text"> </div></div> 我想从answer类中
提取
我尝试过:response.css('.post-text > p::text').extract(),但它同时
提取
了问题和答案。我是
Scrapy
的新手,所以也许我做错了什么。任何帮助都
浏览 19
提问于2020-02-16
得票数 2
回答已采纳
1
回答
AttributeError:“选择器”对象没有属性'find‘(
Scrapy
)
、
我得到的擦伤错误是: File "/anaconda/lib/
python
2.7/urlparse.py",
浏览 7
提问于2017-11-11
得票数 1
1
回答
Scrapy
+
Python
,返回多个项,发布读取页面
、
、
我试图使用
Scrapy
和
python
将多个项
提取
到数据库中。为了构建我的代码,我首先使用
Scrapy
读取页面,并测试与数据
提取
相关的代码行。
scrapy
shell "http://www.goodmans.net/d/1706/brands.htm"response.css('.SubDepartmentsa::text'
浏览 2
提问于2020-03-18
得票数 0
回答已采纳
2
回答
Scrapy
-如何抓取网站并将数据存储在Microsoft SQL Server数据库中?
、
、
、
我正在尝试从我们公司创建的网站中
提取
内容。我已经在MSSQL Server中为
Scrapy
数据创建了一个表。我还设置了
Scrapy
并配置了
Python
来抓取和
提取
网页数据。我的问题是,如何将
Scrapy
抓取的数据导出到本地MSSQL Server数据库中?这是
Scrapy
用于
提取
数据的代码: name = &q
浏览 1
提问于2017-04-07
得票数 2
2
回答
是否有可能将
Scrapy
实现为dekstop应用程序?
、
Scrapy
能否在我的自定义桌面应用程序中实现,在这个应用程序中,它会自动在网页列表上进行抓取过程,并将其作为表导出到数据库中?
浏览 1
提问于2019-10-31
得票数 0
回答已采纳
1
回答
如何忽略
Scrapy
中的URL引用
、
、
我正在使用
Scrapy
刮刮一个网站,其中包含一个菜单与许多子程序菜单。问题是,我正在
提取
多个URL,它们对应于网站中的同一项/
子项
目。我
提取
它们就好像它们是不同的项目一样,因为URL包含"ref=“部分。而不是这样,我只想
提取
一个与subsubitem_ABC对应的URL这样,mi的意图是减少爬虫的时间消耗,并避免对同一
子项</
浏览 2
提问于2022-04-14
得票数 1
3
回答
在
Scrapy
中,如何设置每个url的时间限制?
、
我正在尝试抓取多个网站使用
Scrapy
链接
提取
器,并遵循为真(递归)。寻找一个解决方案,以设置时间限制爬行为每个网址在start_urls列表。谢谢 title =
scrapy
.Field()
浏览 39
提问于2016-07-28
得票数 1
3
回答
Scrapy
可以在PHP上工作吗?
、
、
、
我可以在PHP上使用
Scrapy
吗?或者有类似的工具可以在PHP上使用吗? 我不是一个技术人员,但只是研究可用的网络抓取工具和他们的功能,以支持我的技术同事。
浏览 2
提问于2014-01-20
得票数 8
1
回答
从链接中
提取
刮痕
、
、
我试图在某些链接中
提取
信息,但我不能进入链接,我从start_url中
提取
,我不知道为什么。这是我的代码:from
scrapy
.contrib.spiders import CrawlSpider, Rulefrom tutorial.items import DmozItem from
scrapy
.selector impo
浏览 3
提问于2015-06-10
得票数 1
回答已采纳
2
回答
使用css选择器选择一组元素和文本
、
、
是否有任何方法选择这样的组,并使用CSS选择器、Xpath或其他方法从每个组中
提取
这些特定值?
浏览 5
提问于2022-07-11
得票数 0
回答已采纳
1
回答
Python
:无限期运行刮伤蜘蛛来监视页面更改
、
、
我用刮擦来检查我感兴趣的某些服装产品的价格和可用性。class MonitorSpider(SitemapSpider): sitemap_urls = [ 'https://www.exampl
浏览 3
提问于2017-09-26
得票数 1
回答已采纳
5
回答
如何使用py文件运行
scrapy
、
嗨,我在
scrapy
上工作,我用
scrapy
startproject example创建了一个
scrapy
文件夹,并编写了爬行器来抓取url中的所有数据,我已经使用
scrapy
crawl spider_name命令运行了爬行器,它工作得很好,能够
提取
数据。但是我有一个要求,我需要用创建的单个爬虫文件运行
scrapy
,我的意思是单个py文件,类似于
python
-u /path/to/spider_file_inside_
scr
浏览 1
提问于2012-09-29
得票数 8
回答已采纳
1
回答
如何通过xpath获取元素
、
、
我正在为网站设计一个使用
python
scrapy
的刮板。 []
浏览 2
提问于2020-04-13
得票数 0
5
回答
用pip安装
Python
模块
、
、
、
我用我在我的/usr/local/lib/
python
2.7/site包中看到了'
scrapy
‘文件夹,但是当我试图将它导入
Python
程序时,是说没有这个名称的模块/usr/local/lib/
python
2.7/site-packages (from
Scrapy
) Requirement already satisfied (use
浏览 2
提问于2013-11-12
得票数 11
回答已采纳
1
回答
Xpath/美汤...有没有一种方法可以从html输出而不是dom树中抓取?
、
、
、
、
如果没有,我在考虑完全通过
python
来解析,但我想先看看你用过哪些工具来处理中等复杂的抓取。谢谢!/Loyalty_to_the_King" title="Loyalty to the King">Loyalty to the King</a>")附注:我认为括号中的东西稍后可以通过
python
浏览 0
提问于2014-12-04
得票数 0
1
回答
用
Scrapy
从文本文件中从多个URL中抓取所有外部链接
、
、
、
、
我对
Scrapy
和
Python
很陌生,因此我是个初学者。我希望能够让
Scrapy
读取一个包含大约100 k URL的种子列表的文本文件,让
Scrapy
访问每个URL,并
提取
每个种子URL上的所有外部URL(其他站点的URL),并将结果导出到一个单独的文本文件中
Scrapy
只应该访问文本文件中的URL,而不是爬行并跟踪任何其他URL。 我希望能够让
Scrapy
尽快工作,我有一个非常强大的服务器与1 1GBS线。如何在
Scrapy
中创建一个项目,以便从存储
浏览 0
提问于2016-08-28
得票数 1
回答已采纳
1
回答
如何获取
Python
Scrapy
工具抓取的项目数?
、
我正在使用
Python
Scrapy
工具从网站
提取
数据。我能够抓取数据。现在我想要从一个特定的网站上刮下来的项目的计数。我怎样才能得到抓取的项目数?在
Scrapy
中有内置的类吗?任何帮助都将不胜感激。
浏览 0
提问于2013-10-24
得票数 1
2
回答
在
scrapy
上使用xpath
提取
类内的字符串
、
、
我想在下面的html中
提取
单词白色我使用的是
python
-
scrapy
,它只能用Xpath进行
提取
。使用chrome,我得到了xpath:使用
scrapy
我得到了 hxs.select('//*[@id=&
浏览 1
提问于2013-07-14
得票数 2
2
回答
仅剪贴式正文文本
、
、
、
我尝试使用
python
Scrapy
从正文中抓取文本,但还没有成功。 希望一些学者能够在这里帮助我从<body>标记中抓取所有的文本。
浏览 1
提问于2011-03-22
得票数 9
回答已采纳
1
回答
使用
scrapy
、
python
提取
url的标题。
、
我刚接触
Scrapy
,
Python
。我需要
提取
urls的标题,而不是上下文。下面的代码
提取
上述内容以及title.Kindly帮助 name = 'bg' start_urls = ['https://blog.scrapinghub.com
浏览 1
提问于2017-02-07
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券