腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3036)
视频
沙龙
1
回答
Selenium
/
BeautfulSoup
中
用于
抓取
电子商务
网站
的
下一
页
迭代
、
、
、
我正在
抓取
一个
电子商务
网站
,Lazada使用
Selenium
和bs4,我设法
抓取
了第一
页
,但我无法
迭代
到
下一
页
。我想要实现
的
是根据我选择
的
类别来
抓取
整个页面。下面是我尝试过
的
: # Run the argument with incognito option.add_argument(
浏览 24
提问于2020-09-29
得票数 0
1
回答
如何使用
selenium
python自动分页?(无需手动选择next按钮)
、
、
、
、
我正在
抓取
图像
的
网站
列表,使用
selenium
webdriver+scrapy,但每个
网站
的
下一
步按钮都有不同
的
类/div名称,如何自动查找不同
网站
中
的
下一
页
进行
抓取
?
浏览 11
提问于2020-06-20
得票数 0
2
回答
Python -如何在URL
中
不分页地刮分页
、
如何使用URL访问
下一
页
,内容如下:我知道如何使用刮取库(BS4、
Selenium
),但我不知道如何
抓取
这样
的
站点。我一直在玩谷歌Chrome开发工具,但没有成功。我知道pubmed有API,但是API不返回我需要
的
信息(天气文章是否可以免费下载)。像Python这样
的
抓取
站点通常
的
工作流程是什么?
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
3
回答
如果不存在单击按钮,如何使用Web
抓取
进入分页
、
、
因此,我正在尝试使用
Selenium
(Python)浏览药房
网站
。这个
网站
提供了数千种药品和保健产品
的
目录。我试着做一个“横向”
的
网络
抓取
,提取每一个产品在目录
的
每一
页
的
链接(此刻,我可以这样做)。分页
中
的
前面的按钮如下所示:HTML还有
下
浏览 7
提问于2022-02-02
得票数 0
1
回答
试图生成所有上传到
中
的
应用程序列表
、
、
、
问题--我想列出playstore
中
列出
的
所有应用程序。我实际上正在开发一个应用程序分析算法,并试图使用
的
应用程序数据对其进行回溯测试。这项研究
的
目的是找出一个应用程序名称
的
长度和其他动态与其总下载量之间
的
任何关联。 我知道使用
selenium
或其他工具很容易
抓取
/自动化该部分以找到下载范围。然而,我仍在努力想出一种方法来列出playstore
中
的
所有应用程序。感激地告诉我,如果有人能建议我如何生
浏览 7
提问于2021-11-09
得票数 0
1
回答
如何使用BeautifulSoup转到
下一
页
?
、
、
我试图从
的
所有37个网页
中
抓取
数据。这是为next按钮编写
的
HTML。data-use="/cms/svg/site/icon_caret_right.36.svg"> </svg>我知道这可以用
Selenium</
浏览 4
提问于2022-03-22
得票数 0
回答已采纳
1
回答
在试图遍历页面并打算
抓取
多个页面时,会得到“过时
的
元素引用”
、
、
、
、
我
的
Python代码有问题。其意图是使用
Selenium
打开
网站
(craigslist),搜索一个文本(Honda),然后
抓取
该
网站
的
三个页面。我不断地收到 "StaleElementReferenceException:陈旧元素引用:元素未附加到页面文档“异常 当
迭代
到达第二个页面时。我不能确切地说出为什么它停在第二
页
,而不是再次单击“
下一
步”按钮到达第三
页
,然后最后
抓取
数据并打印出来。
浏览 14
提问于2021-03-28
得票数 0
1
回答
我需要帮助将列表存储为表格和
迭代
抓取
页面
、
、
因此,我设法
抓取
这个
电子商务
网站
,我有for-loop
的
产品名称和产品价格。我
的
第一个问题是如何将这两个表合并在一个表
中
。第二个问题是如何在
网站
的
不同页面或多个urls
中
迭代
这些内容。对于这个愚蠢
的
问题,我很抱歉,但我只是开始使用python,因为我想把它作为一个更好
的
抓取
工具来使用,而R是我更擅长
的
。感谢您
的
回复。import
浏览 10
提问于2021-03-05
得票数 0
回答已采纳
2
回答
当我切换到不同
的
选项卡时,
Selenium
抓取
停止
、
、
我必须刮从印度
电子商务
网站
的
产品细节。在显示前20个项目之后,我们需要向下滚动以获得
下一
组项目。我在python中使用了
selenium
,它会打开一个选项卡来
抓取
站点。但当我从这个选项卡切换到另一个选项卡或窗口时,滚动立即停止,无法进一步
抓取
。这部分代码可以为我滚动。browser.find_element_by_xpath('//div[@id="see-more-products" and @class="
浏览 14
提问于2020-09-09
得票数 0
1
回答
使用python爬行页面
、
、
我正在制作一个爬虫,可以
用于
所有的
电子商务
网站
。目前,我正在以下
网站
上测试我
的
爬虫。 在
中
,我需要单击显示更多结果,以便显示更多产品。在
中
,我只需向下滚动即可获得更多产品 在
中
,按下
浏览 1
提问于2014-06-14
得票数 0
1
回答
当
下一
页
的
后续链接在当前页面源代码
中
不可用时,
抓取
网站
的
所有页面
、
嗨,我已经成功地通过使用Python和正则表达式
抓取
了一些购物
网站
的
所有页面。但现在我遇到了麻烦,要
抓取
某个特定
网站
的
所有页面,该
网站
的
下一
页
后续链接不存在于当前页面
中
,就像这里
的
本
网站
通过Ajax调用动态加载同一
页
面
中
的
下一
页
数据。所以在
抓取
的<
浏览 0
提问于2013-05-28
得票数 0
2
回答
Web
抓取
访问被拒绝|限制访问
的
Cloudflare
、
、
我正在尝试使用python脚本访问和获取来自www.cclonline.com
网站
的
数据。这就是代码。PC-Components/Graphics-Cards/')print(source.status_code) print(html.text) 这是我得到
的
错误
浏览 137
提问于2021-05-08
得票数 0
回答已采纳
1
回答
使用R-
selenium
从aspx网页
抓取
数据
、
、
、
我对r和
selenium
还是个新手,所以希望我能清楚地表达我
的
问题。我想从一个
网站
(.aspx)上
抓取
一些数据,我需要键入一些化学代码,以便能够在
下一
页
中提取一些信息(使用R-
selenium
输入并单击element)。到目前为止,我已经能够构建一个简短
的
代码,可以帮助我完成第一步,即拉出我想要
的
正确页面。但是我很难找到一个好
的
方法来从这个
网站
上
抓取
数据(表
中
<e
浏览 0
提问于2016-07-19
得票数 0
1
回答
如何在python中使用
selenium
或scrapy点击“
下一
步”按钮
、
、
、
、
我正在尝试使用scrapy从flipkart.com
中
抓取
一些数据。除了翻到
下一
页
,我什么都拿到了。首先,我尝试使用scrapy,然后使用
selenium
。实际上,一个类有上一
页
和
下一
页
的
两个链接。 使用scrapy:我无法获取任何结果。我得到
的
是空白输出。 使用
selenium
:每当我尝试点击
下一
页
时,从第一
页
到第二
页
都可以正
浏览 45
提问于2021-02-10
得票数 1
3
回答
用
Selenium
循环遍历网页
的
<a>标记
、
、
我正在使用
Selenium
构建一个使用Python
的
web爬虫。这是我正在
抓取
数据
的
网页: 如您所见,此页面
中
的
表随着我们单击使用数字标识
的
按钮而发生变化。这一
页
是一份巴西基金报告。‘别有用心’
的
意思是‘前’,'seguinte‘
的
意思是
下一
步。我想
迭代
所有这些数字,但我尝试过
的
都没有用。我正在尝试单击<a>标记,该标记使用
Sele
浏览 6
提问于2020-10-27
得票数 1
1
回答
Scrapy修改cookie
、
在我正在工作
的
电子商务
网站
中
,这个cookie处理邮政编码,每个页面都使用这个邮政编码来修改产品属性。我可以使用
selenium
修改邮政编码,
抓取
每一
页
,但
抓取
过程太慢。我可以使用下面的代码根据我
的
请求创建cookie在spider.py yield scrapy.Request(response.urljoincookies={'c
浏览 4
提问于2020-10-03
得票数 0
1
回答
尝试将代码自动输入到gov
中
。车辆登记检查器并按回车键
、
、
我找不出
网站
HTML代码
中
的
哪一部分
用于
车辆注册输入部分 https://vehicleenquiry.service.gov.uk/ConfirmVehicle 这是我正在使用
的
代码--我该用什么来代替此外,任何关于我如何编写代码然后点击
下一
页
的
建议-当你在页面
中
输入reg时,它会问你找到
的
汽车是否正确-它总是正确
的
。 然后可能还建议我如何自动
抓取
这
浏览 7
提问于2019-10-17
得票数 0
1
回答
Selenium
Web driver无法在Google Chrome webstore中找到div类
、
、
、
、
我想从中
抓取
一些数据。但是,每当我尝试使用
selenium
webdriver时,我都会遇到一个问题。当我使用下面的代码时,我得到一个错误,指出这个元素在站点中不存在。button = driver.find_element_by_class_name("a-d-l-L")还有,如何从弹出窗口中获取数据(当我按
下一
个按钮时,该窗口就会出现)。下面的屏幕可以在
下一
页
找到。我想存储弹出消息
中
显示
的
数据。
浏览 2
提问于2018-09-08
得票数 0
1
回答
如何使用
Selenium
和BeautifulSoup
抓取
页面,然后单击按钮转到
下一
页
进行
抓取
、
、
我正在
抓取
一个网页,其中有一个表与子tr和td标签。我能够正确地刮掉第一
页
。但是要转到
下一
页
,我需要一个按钮点击。我需要一些帮助来理解这一点。我正在使用
Selenium
and Beautiful soup来获得页面响应。page btn.click() 单击按钮可转到
下一
页
,但无法
抓取
2-14
页
<
浏览 28
提问于2019-10-01
得票数 0
1
回答
屏幕
抓取
-仍不工作
、
我想刮
的
html页面,有一些脚本运行,通常执行
的
脚本,以显示点击后
的
链接。一些人提到了firebug,另一些人则谈到了我需要
的
代码
的
逆向工程。removeClass('activeLink'); }我正在使用vb.net,一些
网站
很容易使用firebug,在那里,通过查看脚本,我能够提取所需
的
数据。该链
浏览 3
提问于2010-03-13
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券