从多个href列表中抓取python selenium_python selenium抓取href (来自网站的链接)_从类中获取href - selenium python - 腾讯云开发者社区

、、

prices=300-400,200-300&size_types=men&years=2017的url 我能够提取所有产品详细页面的href链接，但我只得到一个结果结束。from selenium.webdriver import Firefoxfrom selenium.webdriver.common.keys# options.add_argument('-headless') dr

浏览 16提问于2019-03-10得票数 2

回答已采纳

1回答

如何抓取和提取链接到n级，并再次抓取数据并将其映射到python中的输出？

、、

我正在学习python中的网络爬行和抓取。我想要抓取数据，在一个网站上有链接，而在这些链接里面有更多的链接。所以我想抓取数据直到预定义的级别n。BeautifulSoup(driver.page_source,"lxml")links=[] links.append(urljoin(web_url,url.g

浏览 40提问于2019-12-17得票数 0

2回答

我不能抓取每个链接内容的具体时间段从确实

、、、、

我是python和web scraping的新手。您的帮助我们将不胜感激。我在编程和练习方面是新手。我正在使用python和selenium进行web抓取。我正在试着从事实上抓取数据。提前感谢，下面是我的代码示例： import timefrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.u

浏览 33提问于2020-07-15得票数 1

回答已采纳

1回答

无法使用Selenium打开新选项卡

、

我试图打开从eBay到刮刮的每一个列表。我的目标是在一个"for循环“中打开每个eBay的列表，这样我就可以抓取每个列表的数据。不幸的是，我收到一个错误声明：driver = webdriver.Chrome('/Users/kenny/Dropbox/Py

浏览 3提问于2019-10-21得票数 0

回答已采纳

1回答

Selenium webscraping app -如何从302重定向获得最终的下载URL

、

我正在开发一个python应用程序，使用selenium从unsplash中抓取图像。我可以使用下面的代码获得照片URL的列表：import time browser.gettime.sleep(1) for elm in el:

浏览 2提问于2021-03-15得票数 0

2回答

在过滤了所有可用的href标签之后，我如何打开论坛中的每个链接？

、、

是否可以为所有可能的链接添加一个单击链接事件或一个新选项卡，这样我就可以通过抓取包含视图线程的所有链接将URL用作筛选器来筛选论坛，但是当我试图让它点击它时，没有错误，可以有人向我解释它，因为我对web抓取非常陌生。from selenium import webdriver from selenium.webdriver.chrome.serviceimport Service

浏览 10提问于2022-09-15得票数 0

回答已采纳

1回答

使用selenium进行电子邮件抓取的XPath

、、

我需要使用selenium在python中抓取多个联系人页面，以获取电子邮件地址。它们的布局和站点结构都不一样，所以我必须想出一个非常动态的XPATH模式来查找附件。另一个障碍是，这些附件有时是纯文本，有时是href mailto:。.,'@')]]").text 但是，如果多个数据存储在同一个div中，则不起作用，它还返回一个元素列表，但我只需要电子邮件。

浏览 0提问于2020-05-30得票数 0

回答已采纳

2回答

ChromeDriver有时关闭，有时不关闭

、、

我尝试实现Selenium以从列表中抓取页面。当试图刮掉列表时，有时执行就会停止。有时候执行似乎没有经过driver.close()，而且完全是随机的。下面是我用来刮多个页面的代码。如果有人建议一个方法来确保司机在抓取数据后关闭，我将不胜感激。from selenium import webdriverresul

浏览 3提问于2021-07-09得票数 0

回答已采纳

1回答

具有相同类名的多个元素的innerHTML

、

driver.close() 我在Python中使用selenium，并试图获得具有相同类名的多个元素的innerHTML。我以为我的结果会抓取所有的元素，并将它们存储在一个列表中，但它只会抓取第一个元素并存储它。我将如何在页面上获取每个元素？

浏览 2提问于2013-12-26得票数 0

回答已采纳

1回答

如何对urls列表进行洗牌并将其应用于the驱动程序

、、、

我想从一个网站刮Href，并洗牌。一旦完成，我希望它读取列表中的每一行，并将其应用于驱动程序，从而在循环中为列表中的每个Href抓取每个网页。我已经找到了有关如何使用记事本文件执行此操作的信息，但在Python中处理列表的信息并不多。总之，如何对列表进行洗牌，从每一行( href)读取，并为每个Href循环加载Driver.get？我在windo

浏览 3提问于2017-08-28得票数 0

回答已采纳

2回答

在css选择器'a‘中为每个类'r’获取页面上的所有链接

、、

我正在使用python中的selenium从google搜索中抓取所有相关的URLS。我知道，如果我想在同一个类中有一个URL列表，我可以执行以下操作：name = div.find_elements_by_css_selector('a') 我真正想要的是在谷歌页面上的每一个类'r‘的href的网址。

浏览 1提问于2020-03-26得票数 0

1回答

如何下载来自谷歌群组的所有消息？

我想下载来自谷歌群组的所有消息，因为我想分析那里可用的讨论。我该怎么做呢？

浏览 2提问于2013-03-02得票数 9

1回答

Python和Selenium: Webscraping

、

我对使用selenium和python进行web抓取是个新手。我试图从其中抓取数据的网页在特定的nav类中有href元素。我需要在EXAMPLE3中单击，但我找不到类名或id。

浏览 13提问于2021-09-24得票数 0

回答已采纳

1回答

如何在python语言中使用selenium和chromedriver抓取此页面？

我正在尝试使用selenium和chromedriver从网站“”中抓取数据。当我运行代码时，chromedriver成功地输入了url，但无法加载页面，显示了一个空白页面。我尝试将目标网站切换到google.com，但抓取成功。我的结论是目标网站服务器检测到selenium并拒绝发送回数据。那么如何在Python语言中使用selenium和chromedriver从网站抓取数据呢？我是一个Python</e

浏览 0提问于2020-05-29得票数 0

2回答

如何从Google搜索结果中抓取所有标题和链接(Python* + Selenium)*

、、

我正在尝试使用selenium (Python)从Google搜索结果中抓取标题和链接。我的问题是我只能抓取前4个结果，而不能抓取其他6个结果。我的感觉是，这可能与网页的加载时间有关，但我不确定。代码：from selenium import webdriver from selenium.webdriver.chrome.options import Optionsfrom selenium</

浏览 0提问于2021-05-21得票数 1

1回答

如何使用Selenium、Bs4和Docx将多个URL(输入) WebScrape到多个输出Docx文件中？

、、、

我一直在摆弄一些不同的解决方案，如何用Selenium，BS4和Docx抓取多个URL，到目前为止，我已经能够抓取1个URL来提取我想要的东西，还可以将输出导出到单个docx文件中。这只是当涉及到多个或1+网址时，我遇到了麻烦。目前，我有下面的代码，它可以抓取内容。我想创建一个循环来抓取，首先，只是2个网页或多个网址，当它可以循环通过这些我可以附加与其他网址的列表。代码如下： from seleniu

浏览 12提问于2020-10-28得票数 0

回答已采纳

1回答

selenium从网站中将内容抓取到数组中

、、、

我对从网站上抓取内容并将其放入数组感兴趣。具体来说，我感兴趣的是通过识别纯文本所在的html元素，将纯文本抓取到数组中。我正在与Java一起使用selenium，我希望有人能够了解一下实现这一目标的最佳方法。我将扫描多个纯文本元素，并将它们按顺序排列到一个数组中。纯文本将在html表中，我需要获取表中具有我感兴趣的纯文本的特定部分。

浏览 0提问于2015-05-11得票数 0

回答已采纳

1回答

使用Python抓取Javascript加载的页面

、

我正在尝试使用Python从英国广播公司的一篇文章中抓取评论：然而，我想要抓取多个页面，但当我尝试更改第一页中的“page=x”时，它只会将我带到第一页。我考虑过使用Selenium/Dryscape，但我不确定如何才能到达每个页面来运行它们。

浏览 1提问于2016-11-25得票数 1

1回答

Coursera URL web抓取

、

我有python代码，可以刮课程的细节，如course_title，评级，学生数量等，但我想课程链接以及。谁能帮助我如何从coursera获取每个课程的URL。

浏览 0提问于2020-08-12得票数 0

1回答

如何抓取表格的形式，使列表变得均匀

、、、、

我正在使用Selenium Webdriver (Python3.0)从这个中抓取数据。所有的数据都被正确地抓取了，但是它是以列表的形式抓取的，这意味着有127个团队和赔率以及129个Hrefs。不幸的是，这意味着Href不在团队旁边，在excel中的赔率是正确的。有没有办法绕过这个问题？我有附加的截图和我的代码如下。有没有办法将其调整为抓取为表，以便它知道在看不到团队和赔率的情况下不抓取Href

浏览 13提问于2017-08-27得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云