腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9083)
视频
沙龙
1
回答
不
转到第
二页
通过
scrapy
提取
数据
保存一页
数据
,
不
转到第
二页
,不显示任何错误。import
scrapy
class QouteSpider(
scrapy
.Spider):
浏览 6
提问于2019-11-02
得票数 0
1
回答
在使用selenium webdriver进行分页时,如何从表中获取
数据
我有一个表格,其中只有10个
数据
显示在第一页,然后第11个
数据
到第
二页
。在使用selenium webdriver进行分页时,如何获取表
数据
。
浏览 5
提问于2015-06-23
得票数 1
1
回答
如何在python中使用selenium或
scrapy
点击“下一步”按钮
、
、
、
、
我正在尝试使用
scrapy
从flipkart.com中抓取一些
数据
。除了翻到下一页,我什么都拿到了。首先,我尝试使用
scrapy
,然后使用selenium。使用
scrapy
:我无法获取任何结果。我得到的是空白输出。 使用selenium:每当我尝试点击下一页时,从第一页到第
二页
都可以正常工作。但是然后不是
转到第
三页,而是返回到第
二页
。
浏览 45
提问于2021-02-10
得票数 1
2
回答
使用
scrapy
跟踪新闻链接
、
、
、
、
我是新的爬行和刮伤,我试图从
提取
一些新闻,也只是与标签san-valentin匹配的新闻。 import
scrapy
nameself, 'tag', None) if tag is not No
浏览 1
提问于2019-02-14
得票数 0
回答已采纳
1
回答
scrapy
:请求url必须是str或unicode获取列表
、
、
、
我想刮第一页,然后,对于该页上的每个链接,
转到第
二页
,以
提取
项目的描述。当我运行下面的代码时,我得到:exception.TypeError: url必须是str或unicode,get list。这是我的代码:from
scrapy
.selector import Selectorfrom
scrapy
.item import Item,
浏览 7
提问于2014-07-23
得票数 1
回答已采纳
2
回答
checkedbox在单击下一页后在上一页上未选中
、
、
、
当我选中我的页面(1)上的复选框
数据
,然后
通过
分页(页面的底部按钮,如1234)转到下一页(2),然后选中页面(2)上的
数据
。 当我返回到第(1)页时,它保持未选中状态,因为我没有选中任何内容!当从一页
转到第
二页
时(第一页的复选框忘记他的值并取消选中),当从第
二页
转到第
一页之后,同样的事情也会发生。抱歉,我的英语又差又粗糙。有什么建议吗?
浏览 0
提问于2012-11-27
得票数 2
回答已采纳
1
回答
刮擦-复制前2页并完成
、
、
、
我目前正在使用Python3.5的
Scrapy
来
提取
家得宝网站的SKU#和定价值。
通过
使用这些杂乱无章的教程文档,我成功地整理了一些东西,这些东西可以
提取
出正确的
数据
,然后继续到下一页。问题是,在
Scrapy
生成第
二页
的项目后,它会再次返回到第一页,然后在结束前重复。从本质上讲,它只是运行URL-1 -> URL2,-> Url 1,-> Url 2,->2,然后没有错误地完成。我使用的代码如下:
浏览 0
提问于2017-03-30
得票数 0
回答已采纳
1
回答
用
scrapy
抓取论坛
、
、
我试图用
scrapy
废弃一些论坛,并将
数据
存储在
数据
库中。但是当涉及到更新
数据
库时,我不知道如何有效地做到这一点。我的问题是,当我再次删除同一个论坛时,比如说一周后,没有必要浏览所有的页面,因为新的帖子或任何有新帖子的帖子都会在其他
不
活跃的帖子上。
转到第
二页
是没有意义的。因此,爬虫应该转到另一个论坛(forums.example.com/forum?id=2)。我尝试修改start_urls和规则,但似乎在爬虫运行后它们没有响应。有没有办法用
scrap
浏览 1
提问于2012-10-10
得票数 1
1
回答
在ColdFusion中访问会话
数据
、
在这里,我试图访问冷融合页面中的会话
数据
。您可以验证以下代码:A部分代码放在第一页,B部分代码放在第
二页
。当我
通过
打印会话
数据
从第一页
转到第
二页
时,获得一个error.But,我可以访问第一页本身的会话
数据
。我是否在第
二页
中缺少访问会话
数据
所需的任何标记。有谁能帮我一下吗?
浏览 0
提问于2017-10-15
得票数 1
1
回答
刮除-只从第一页抓取
数据
,而不是从分页中的“下一步”页中抓取
数据
。
、
、
、
下面的代码(摘自一篇博文)可以很好地从第一页中删除
数据
。我添加了“规则”从第
二页
提取
数据
,但仍然只从第一页
提取
数据
。# -*- coding: utf-8 -*-from
scrapy
.spiders import CrawlSpider, Rule from
scrapy
.linkextractorsproduct-profile-link"]/@hre
浏览 0
提问于2016-08-10
得票数 1
回答已采纳
3
回答
在表单中使用get而不是post来处理像index.php?page=homepage这样的url
、
第一页有一个表单,用于第
二页
并查询
数据
库。我知道这里应该使用POST方法(根据),但是我想实现这个页面的GET方法,因为当用户在第
二页
时,他们会在那里选择他们的选项并
转到第
三页,但是当用户在第三页时,他们可能需要使用browser back按钮返回到第
二页
来更改一些值page=two“时,输入名称不会像将操作设置为"pagetwo.php”那样被
提取
并放入URL中(这将变成pagetwo.php?data=x)。我怎么才能绕过这个障碍?
浏览 5
提问于2012-01-29
得票数 0
回答已采纳
1
回答
如何在离子2中保留视图\页状态?
、
在点击第一页的一个按钮,我导航到第
二页
和ionViewDidLoad(第
二页
),我调用
数据
服务和呈现在一个列表中的
数据
。接下来,当我
通过
单击顶部的“后退”按钮向后导航时,我会
转到第
一页。现在,如果我点击第一页的按钮,我导航到第
二页
。但是,在这种情况下,再次进行服务调用,这意味着再次触发ionViewDidLoad (这正是我希望避免的)。 如何保留第二视图的先前状态?
浏览 5
提问于2017-01-11
得票数 2
回答已采纳
1
回答
单击html表单按钮转到
scrapy
/ python格式的下一页
、
、
我用
scrapy
编写了一个蜘蛛程序,用来从网站上
提取
数据
。我有一个具有相似结构的html表的链接列表,到目前为止,这些链接的
提取
工作都很好。现在的问题是,这些表中的一些运行在多个页面上,即如果一个
数据
集超过30行,它就会被拆分。大多数表格只有一页,但有些表格要长得多,最多有70页。下一页是
通过
按下html表单形式的"next sheet“按钮来到达的。我希望爬行器去到每个表,从第一页
提取
数据
,然后继续到第
二页
,第三页等,直到
浏览 1
提问于2016-02-02
得票数 2
1
回答
如何从网站上抓取二级网页
、
、
、
、
我想问你如何使用python + Beautiful soup或
Scrapy
来抓取网页,如果有2个级别的页面,一个简短的描述+一个到职位帖子完整细节的链接,那么它包含了例如招聘公告?我需要从招聘公告的标题中抓取
数据
,然后更深入地
提取
完整的描述,并将这些
数据
添加到
数据
库或文本文件中?问题是
转到第
二层,在那里完整的描述和获得完整的细节,包括图像链接,如果存在的话…有人这么做过吗?
浏览 0
提问于2019-09-26
得票数 1
1
回答
加载应用程序时的模态对话框
、
、
、
我有一些关于模态对话的问题:2.我想在应用程序加载时显示模态对话框,在他按下按钮后显示到第
二页
.。 假设那是我的对话。
浏览 5
提问于2017-05-05
得票数 2
1
回答
我可以合并从网页上从刮取值到项目上吗?
我定义的项目如下: # define the fields for your item here like: usage=
scrapy
.Field()title来自第一页,usage来自第
二页
,storage来自第三页。
不
,我试着从下面的网页中获取价值 def parse_item(self, response
浏览 12
提问于2022-09-14
得票数 -1
1
回答
如何从同一csv行中的多个页面中刮取
数据
?
、
、
我需要从多个页面中抓取
数据
。首先,它应该从第一页抓取
数据
,然后从这个页面中
提取
一个url到第
二页
,并从中获取一些
数据
。 这是我的密码:import urlparseimpo
浏览 4
提问于2017-03-25
得票数 0
1
回答
用
Scrapy
从延迟加载内容中
提取
图像源
、
、
我试图使用
Scrapy
提取
trying标记的值。<img src="https://media.rightmove.co.uk/map/_generate?53.803485&longitude=-1.561766&signature=rq2YsiaRQTXqZ2ilgvbFF3fdWfU= 当我查看从刮伤外壳返回的Chrome响应时,我可以看到我希望(
通过
开发人员工具)
提取
的
数据
,但是当我尝试用XPath<
浏览 6
提问于2020-12-30
得票数 0
回答已采纳
3
回答
向导应用程序的UI测试
、
、
、
登录一次 另外,使用Junit testSuite,我们只能在类中运行所有测试,而不
浏览 0
提问于2012-02-20
得票数 0
0
回答
CSS打印-未跨页面拆分大段落
、
、
我以一种我认为对打印机友好的方式设置了它,但它似乎不想将一个大段落分成两页,只留下第一页上只有几个项目,页面底部有一个很大的空白点,然后第
二页
上有一个大段落。这是我的页面的一个简化版本(原始页面上的大量
数据
是
通过
php和mysql
数据
库等生成的)。 当您打印页面时,您可以看到“基本信息”部分跳
转到第
二页
,而此时它应该被分成第一页和第
二页
。
浏览 9
提问于2017-06-14
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
新手爬虫之创建第一个完整的scrapy项目
码以致用02-用Scrapy 爬虫抓取简单心理咨询师资料
Python数据科学实战系列之Web信息爬取
Python之Scrapy 爬虫框架视频详解
Scrapy向导
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券