腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
scrapy
能够
检查
是否
只有
下一个
同级
有
预期
的
标签
?
、
、
、
、
问题是,我上面展示
的
html实际上不是静态
的
,所有页面都有不同
的
结构,这意味着有时在包含img src
的
center
标签
之前会有更多
的
p
标签
由于p和center
标签
在每个页面中都是随机构造
的
,我在考虑获取所有的p
标签
,例如使用response.css('#hello p'),然后循环遍历所有的p以获取文本,但是在循环时从当前
的
p
标签
获取文本时,还要
检查
浏览 12
提问于2020-09-10
得票数 1
回答已采纳
2
回答
JQuery .next()不使用选择器拾取
下一个
元素
、
、
、
我看过与JQuery方法相关
的
.next()文档,它声明: 如果紧接着
的</e
浏览 2
提问于2015-07-21
得票数 0
回答已采纳
2
回答
CSS自定义广播按钮我看不到我想要显示
的
图像
、
、
我看不见我想要显示
的
图像。我用
的
是鞋带。我担心引导代码可能会干扰我自己
的
代码。 谢谢!
浏览 2
提问于2015-08-04
得票数 1
回答已采纳
1
回答
使用不同标记复制显示行为
的
困难
、
我试图复制播放器
的
行为:,除了这一点之外,我什么都能做(您可以查看页面源代码以获得完整
的
代码)。-- Etc -->但是,我
的
页面有以下结构: <article class="article> <!,这些行为与<ol>中演示页面中
的
锚标记相同,因此我想自动播放每个锚标记,问题是它们不是在<ol>内部,而是在实际
的
单独文章中。nex
浏览 2
提问于2013-06-04
得票数 0
回答已采纳
2
回答
Scrapy
中
的
If条件
、
、
、
我正在使用
scrapy
抓取给定url中
的
标签
,并
检查
标签
中
的
url链接
是否
与网站
的
url匹配。我想将结果导出到csv,其中有一列指示
是否
存在匹配。我
有
以下代码,但不确定如何添加匹配条件:import pandas as pdfrom
scrapy
.crawler import CrawlerProcessclass urlsit
浏览 1
提问于2019-07-03
得票数 0
1
回答
Scrapy
停止抓取,但继续爬行
、
、
我试图从一个网站
的
几个页面中抓取不同
的
信息。在第16页之前,一切正常:页面被抓取,抓取,我
的
数据库中
的
信息存储,但是在第16页之后,它停止抓取,但继续抓取。我查看了这个网站,
有
470多个页面提供了信息。HTML
标签
是一样
的
,所以我不明白为什么它会停止抓取。url_list.append(url) return url_list class ListeCourse_level1(
scrapy
.S
浏览 0
提问于2018-01-24
得票数 4
3
回答
为什么‘返回’在'if‘语句中不完全停止函数?
、
我目前正在执行访问DOM
的
操作。在页面底部,
有
一个关于创建函数以遍历DOM中
的
所有节点并获取
下一个
节点
的
小片段。我已经让代码正常工作了,但我不确定它到底是如何工作
的
。: 这个功能
的
第一步是什么?例如,它首先
检查
所选节点
是否
有
子节点。如果有的话,它会“归还”它。这不是应该结束功能吗?我以为回来是打破常规
的
一种方式?为什么它还在继续?当它继续到while循环时,它会
检查
是否
浏览 5
提问于2014-11-23
得票数 3
回答已采纳
1
回答
在jSoup中选择位于已知
标签
之后
的
未知
标签
、
、
我必须使用jSoup选择图片中指示
的
<ul>。该列表总是出现在报头(<h2>)之后,该报头包含具有id Events
的
span。
浏览 4
提问于2013-07-15
得票数 1
1
回答
刮蜘蛛精刮工艺不刮任何东西
、
、
我
有
一只蜘蛛在亚马逊搜索信息。另外,控制台上没有出现错误,爬行器启动,“爬行”关键字,然后停止。这是完整
的
蜘蛛import reimport random from <em
浏览 1
提问于2019-02-01
得票数 2
回答已采纳
1
回答
Scrapy
-如何获取'script‘标记
的
'src’值
、
我正在尝试使用
Scrapy
()获取'script‘
标签
的
'src’值。_AC_SX75_.jpg"]},for sel in response.xpath('//script'): yield item 示例
浏览 0
提问于2015-06-25
得票数 0
2
回答
获取两个不同html标记之间
的
文本
、
、
我想知道
是否
有
可能通过python中
的
漂亮
的
were包在两个完全不同
的
文本之间获得
标签
。print(tag) <dtposted>2020<trnamt>10<fitid>202010<name>RESTAURANT</name></fitid></trnamt></dtposted> 我希望
能够
分别获得dtposted,trnamt
浏览 25
提问于2020-11-09
得票数 0
回答已采纳
3
回答
“克隆”复选框元素转到Jquery中
的
另一个div。
、
、
在将
检查
的
元素从div克隆到另一个div时,我面临一个问题。我
能够
得到选中
的
元素,但并不是所有的元素都附加在后面。这是我
的
密码 <p> ($(
浏览 1
提问于2013-09-17
得票数 1
4
回答
为什么keyup不起作用?
、
我正在尝试让我
的
输入文本字段在keyup时成为下一行
的
焦点。
浏览 0
提问于2013-04-18
得票数 0
10
回答
使用if语句
检查
div
是否
为空
如果一个单独
的
div是空
的
,我会尝试删除一个特定
的
div。下面是我使用
的
代码: if ('#leftmenu:empty') { $('#menuTitleWrapper'
浏览 1
提问于2011-01-12
得票数 118
1
回答
如何向另一个具有不同设置
的
爬行器生成
Scrapy
请求?
、
、
这个问题本质上和是一样
的
,但是我想仔细
检查
一下
是否
有
“原生
的
”方法来解决这个问题。 我正在抓取网页,99%
的
时间都可以成功抓取,而不需要渲染JavaScript。我想写一个带有item_scraped方法
的
Scrapy
,该方法
检查
是否
所有
预期
的
字段都已填充,如果没有,则生成一个包含开机启动设置
的
custom_settings
的
不同爬行器
浏览 16
提问于2017-07-20
得票数 1
回答已采纳
1
回答
如何使一个for-循环完成,然后才触发一个擦伤函数。
、
、
、
我
有
一个简单
的
蜘蛛类,它有两个函数。一个从起始页面获取链接并输入它们(也--获得
下一个
页面链接),另一个解析每个链接(它所指向
的
页面)。问题是,我
有
一个for循环,它在链接上迭代并为每个链接生成一个
scrapy
.Request,在这个循环之后,我
有
一个if语句来
检查
当前页面
是否
是最后一个页面,如果不是--如果不是,我想使用
下一个
页面链接产生第一个函数item = re.sub('sth_to_be_dele
浏览 3
提问于2019-10-28
得票数 1
3
回答
如果同时安装了两个版本
的
python,如何让
scrapy
使用python 3?
、
关于
scrapy
正在使用
的
python版本
的
快速问题。我在archlinux上从AUR存储库安装了
scrapy
,它默认使用python 2.7。
Scrapy
支持python 3.3+。有没有人知道如何在不卸载2.7
的
情况下强制使用3.3,在网上找不到任何东西。
浏览 4
提问于2016-12-15
得票数 5
1
回答
MediaCodec.dequeueOutputBuffer在Android上编码h264时花费了很长时间
、
、
、
、
我试着用MediaCodec对安卓上
的
MediaCodec视频进行实时视频编码,但是dequeueOutputBuffer花费
的
时间很长(实际上有时非常快,但在其他时候非常慢,见下面的日志输出)。我已经看到它甚至达到了200毫秒
的
输出缓冲区准备就绪。我
的
代码
有
什么问题吗?还是您认为这是OMX.Nvidia.h264编码器
的
问题? 也许我需要把图像从1280x720降到更小
的
地方?或者,在等待输出缓冲区时,我需要去排队并排队更多
的
输入缓冲区?(
有
浏览 1
提问于2016-01-21
得票数 5
回答已采纳
3
回答
循环中从脚本中运行多个蜘蛛
、
、
我
有
100多个蜘蛛,我想一次运行5个蜘蛛使用脚本。为此,我在数据库中创建了一个表,以了解蜘蛛
的
状态,即它
是否
已完成运行、运行或等待运行。from
scrapy
.utils.project import get_project_settings print('-------------this is the-----{}--iteratio
浏览 1
提问于2018-01-31
得票数 1
回答已采纳
1
回答
data-reactid元素
的
Xpath
、
、
使用
scrapy
和命令行工具在python中工作。正在尝试:只返回"[]“-为什么,我如何获得正确
的
(”仓库结构“)文本?
浏览 0
提问于2016-01-30
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫你可能都会用,但是背后的架构你真的懂了吗?
Python爬虫很简单,真正的这些隐藏的知识你都懂吗?
爬虫可能都会用,但是背后的架构你真的懂了吗?
高级爬虫:Scrapy爬虫框架初探
用 Python 分析B站的变化
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券