腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
多个
href
列表
中
抓取
python
selenium
、
、
prices=300-400,200-300&size_types=men&years=2017的url 我能够提取所有产品详细页面的
href
链接,但我只得到一个结果结束。from
selenium
.webdriver import Firefoxfrom
selenium
.webdriver.common.keys# options.add_argument('-headless') dr
浏览 16
提问于2019-03-10
得票数 2
回答已采纳
1
回答
如何
抓取
和提取链接到n级,并再次
抓取
数据并将其映射到
python
中
的输出?
、
、
我正在学习
python
中
的网络爬行和
抓取
。我想要
抓取
数据,在一个网站上有链接,而在这些链接里面有更多的链接。所以我想
抓取
数据直到预定义的级别n。BeautifulSoup(driver.page_source,"lxml")links=[] links.append(urljoin(web_url,url.g
浏览 40
提问于2019-12-17
得票数 0
2
回答
我不能
抓取
每个链接内容的具体时间段
从
确实
、
、
、
、
我是
python
和web scraping的新手。您的帮助我们将不胜感激。我在编程和练习方面是新手。我正在使用
python
和
selenium
进行web
抓取
。 我正在试着从事实上
抓取
数据。提前感谢,下面是我的代码示例: import timefrom
selenium
.webdriver.common.by import Byfrom
selenium
.webdriver.support.u
浏览 33
提问于2020-07-15
得票数 1
回答已采纳
1
回答
无法使用
Selenium
打开新选项卡
、
我试图打开
从
eBay到刮刮的每一个
列表
。我的目标是在一个"for循环“
中
打开每个eBay的
列表
,这样我就可以
抓取
每个
列表
的数据。不幸的是,我收到一个错误声明:driver = webdriver.Chrome('/Users/kenny/Dropbox/
Py
浏览 3
提问于2019-10-21
得票数 0
回答已采纳
1
回答
Selenium
webscraping app -如何
从
302重定向获得最终的下载URL
、
我正在开发一个
python
应用程序,使用
selenium
从
unsplash
中
抓取
图像。我可以使用下面的代码获得照片URL的
列表
:import time browser.gettime.sleep(1) for elm in el:
浏览 2
提问于2021-03-15
得票数 0
2
回答
在过滤了所有可用的
href
标签之后,我如何打开论坛
中
的每个链接?
、
、
是否可以为所有可能的链接添加一个单击链接事件或一个新选项卡,这样我就可以通过
抓取
包含视图线程的所有链接将URL用作筛选器来筛选论坛,但是当我试图让它点击它时,没有错误,可以有人向我解释它,因为我对web
抓取
非常陌生。from
selenium
import webdriver from
selenium
.webdriver.chrome.serviceimport Service
浏览 10
提问于2022-09-15
得票数 0
回答已采纳
1
回答
使用
selenium
进行电子邮件
抓取
的XPath
、
、
我需要使用
selenium
在
python
中
抓取
多个
联系人页面,以获取电子邮件地址。它们的布局和站点结构都不一样,所以我必须想出一个非常动态的XPATH模式来查找附件。另一个障碍是,这些附件有时是纯文本,有时是
href
mailto:。.,'@')]]").text 但是,如果
多个
数据存储在同一个div
中
,则不起作用,它还返回一个元素
列表
,但我只需要电子邮件。
浏览 0
提问于2020-05-30
得票数 0
回答已采纳
2
回答
ChromeDriver有时关闭,有时不关闭
、
、
我尝试实现
Selenium
以
从
列表
中
抓取
页面。当试图刮掉
列表
时,有时执行就会停止。有时候执行似乎没有经过driver.close(),而且完全是随机的。下面是我用来刮
多个
页面的代码。如果有人建议一个方法来确保司机在
抓取
数据后关闭,我将不胜感激。from
selenium
import webdriverresul
浏览 3
提问于2021-07-09
得票数 0
回答已采纳
1
回答
具有相同类名的
多个
元素的innerHTML
、
driver.close() 我在
Python
中使用
selenium
,并试图获得具有相同类名的
多个
元素的innerHTML。我以为我的结果会
抓取
所有的元素,并将它们存储在一个
列表
中
,但它只会
抓取
第一个元素并存储它。 我将如何在页面上获取每个元素?
浏览 2
提问于2013-12-26
得票数 0
回答已采纳
1
回答
如何对urls
列表
进行洗牌并将其应用于the驱动程序
、
、
、
我想从一个网站刮
Href
,并洗牌。一旦完成,我希望它读取
列表
中
的每一行,并将其应用于驱动程序,从而在循环中为
列表
中
的每个
Href
抓取
每个网页。我已经找到了有关如何使用记事本文件执行此操作的信息,但在
Python
中
处理
列表
的信息并不多。总之,如何对
列表
进行洗牌,
从
每一行(
href
)读取,并为每个
Href
循环加载Driver.get?我在windo
浏览 3
提问于2017-08-28
得票数 0
回答已采纳
2
回答
在css选择器'a‘
中
为每个类'r’获取页面上的所有链接
、
、
我正在使用
python
中
的
selenium
从
google搜索
中
抓取
所有相关的URLS。我知道,如果我想在同一个类中有一个URL
列表
,我可以执行以下操作:name = div.find_elements_by_css_selector('a') 我真正想要的是在谷歌页面上的每一个类'r‘的
href
的网址。
浏览 1
提问于2020-03-26
得票数 0
1
回答
如何下载来自谷歌群组的所有消息?
我想下载来自谷歌群组的所有消息,因为我想分析那里可用的讨论。我该怎么做呢?
浏览 2
提问于2013-03-02
得票数 9
1
回答
Python
和
Selenium
: Webscraping
、
我对使用
selenium
和
python
进行web
抓取
是个新手。我试图
从
其中
抓取
数据的网页在特定的nav类中有
href
元素。我需要在EXAMPLE3
中
单击,但我找不到类名或id。
浏览 13
提问于2021-09-24
得票数 0
回答已采纳
1
回答
如何在
python
语言中使用
selenium
和chromedriver
抓取
此页面?
我正在尝试使用
selenium
和chromedriver
从
网站“”
中
抓取
数据。当我运行代码时,chromedriver成功地输入了url,但无法加载页面,显示了一个空白页面。我尝试将目标网站切换到google.com,但
抓取
成功。我的结论是目标网站服务器检测到
selenium
并拒绝发送回数据。那么如何在
Python
语言中使用
selenium
和chromedriver
从
网站
抓取
数据呢?我是一个
Python</e
浏览 0
提问于2020-05-29
得票数 0
2
回答
如何
从
Google搜索结果
中
抓取
所有标题和链接(
Python
+
Selenium
)
、
、
我正在尝试使用
selenium
(
Python
)
从
Google搜索结果
中
抓取
标题和链接。我的问题是我只能
抓取
前4个结果,而不能
抓取
其他6个结果。我的感觉是,这可能与网页的加载时间有关,但我不确定。代码:from
selenium
import webdriver from
selenium
.webdriver.chrome.options import Optionsfrom
selenium</
浏览 0
提问于2021-05-21
得票数 1
1
回答
如何使用
Selenium
、Bs4和Docx将
多个
URL(输入) WebScrape到
多个
输出Docx文件
中
?
、
、
、
我一直在摆弄一些不同的解决方案,如何用
Selenium
,BS4和Docx
抓取
多个
URL,到目前为止,我已经能够
抓取
1个URL来提取我想要的东西,还可以将输出导出到单个docx文件
中
。这只是当涉及到
多个
或1+网址时,我遇到了麻烦。 目前,我有下面的代码,它可以
抓取
内容。 我想创建一个循环来
抓取
,首先,只是2个网页或
多个
网址,当它可以循环通过这些我可以附加与其他网址的
列表
。代码如下: from
seleniu
浏览 12
提问于2020-10-28
得票数 0
回答已采纳
1
回答
selenium
从
网站中将内容
抓取
到数组
中
、
、
、
我对
从
网站上
抓取
内容并将其放入数组感兴趣。具体来说,我感兴趣的是通过识别纯文本所在的html元素,将纯文本
抓取
到数组
中
。我正在与Java一起使用
selenium
,我希望有人能够了解一下实现这一目标的最佳方法。我将扫描
多个
纯文本元素,并将它们按顺序排列到一个数组
中
。纯文本将在html表
中
,我需要获取表
中
具有我感兴趣的纯文本的特定部分。
浏览 0
提问于2015-05-11
得票数 0
回答已采纳
1
回答
使用
Python
抓取
Javascript加载的页面
、
我正在尝试使用
Python
从
英国广播公司的一篇文章
中
抓取
评论:然而,我想要
抓取
多个
页面,但当我尝试更改第一页
中
的“page=x”时,它只会将我带到第一页。我考虑过使用
Selenium
/Dryscape,但我不确定如何才能到达每个页面来运行它们。
浏览 1
提问于2016-11-25
得票数 1
1
回答
Coursera URL web
抓取
、
我有
python
代码,可以刮课程的细节,如course_title,评级,学生数量等,但我想课程链接以及。谁能帮助我如何
从
coursera获取每个课程的URL。
浏览 0
提问于2020-08-12
得票数 0
1
回答
如何
抓取
表格的形式,使
列表
变得均匀
、
、
、
、
我正在使用
Selenium
Webdriver (
Python
3.0)从这个中
抓取
数据。所有的数据都被正确地
抓取
了,但是它是以
列表
的形式
抓取
的,这意味着有127个团队和赔率以及129个Hrefs。不幸的是,这意味着
Href
不在团队旁边,在excel
中
的赔率是正确的。有没有办法绕过这个问题? 我有附加的截图和我的代码如下。有没有办法将其调整为
抓取
为表,以便它知道在看不到团队和赔率的情况下不
抓取
Href
浏览 13
提问于2017-08-27
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用Python从列表中删除指定的元素
python中列表的知识点总结,python编程从入门到实践
selenium+python爬取简书文章
利用Python和Repl.it进行网页信息爬取
使用Python进行网页抓取的介绍
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券