我想在一个动态的href上做一个循环。实际上,我每页下载一组文件。在每个页面上,我下载了100个文本文件,但我必须下载20万个文件。所以,我必须在2000年单击next按钮。为此,我获得了next按钮的href地址,但不幸的是,这个链接中的两个对象发生了变化,页码1、2、3等,以及一个字符串。请参阅附件中的下一步按钮的变化样本。
我是Python的新手。我的水平不好。
#Before I add selenium setup for scraping.
n=2000
for i in range(1,n):
href="https://search.proques
我正在使用Python和Selenium来抓取网页。
我试图在页面中找到以下“下一页”按钮:
<button class="pagination__next" aria-label="click to go to the next page" disabled="true" aria-hidden="true"></button>
当我在多页嵌入式javascript生成表的最后一页时,disabled='true'就会出现。
可能有更多的按钮在页面上,有些是禁用时,我正在寻找这个特定的按钮
我正在尝试一页一页地打印搜索结果的所有标题。
搜索谷歌,然后打印第一页结果的标题是成功的。但是,当我尝试单击下一步按钮,然后打印第二页结果的标题时,我得到了StaleElementReferenceException: Element not found in the cache错误。
单击第一页上的下一步按钮后,如何打印第二页标题。
我的代码:
public class goopick {
public static void main(String[] args) {
WebDriver driver = new FirefoxDriver();
searchGoog
下面有搜索元素的代码。如果找不到该元素,请单击下一页。我想要的是,如果元素直到最后一页才被找到,它应该打印“元素未找到”。
elpath=f"//span[contains(text(),[value})]"
while True:
time sleep(2)
try:
driver.find element_by_xpath(elpath).click()
break
except Exception:
if driver.find element_by_xpath("Xpath to click