即使使用selenium - Python 3，也无法获取与检查页匹配的HTML

。Selenium是一个用于自动化浏览器操作的工具，它可以模拟用户在浏览器中的操作，包括点击、填写表单、获取页面内容等。然而，有些网站可能会采取一些反爬虫的措施，阻止Selenium等工具获取页面内容。

这种情况下，可以尝试以下方法来解决无法获取匹配的HTML问题：

更换浏览器驱动：Selenium支持多种浏览器驱动，如Chrome、Firefox、Edge等。尝试使用不同的浏览器驱动，有时可以绕过网站的反爬虫机制。
使用无头浏览器：无头浏览器是一种没有图形界面的浏览器，可以在后台运行。无头浏览器可以更好地模拟真实浏览器行为，有时可以绕过反爬虫机制。常见的无头浏览器包括Headless Chrome和PhantomJS。
模拟用户行为：有些网站会根据用户的行为进行反爬虫检测，可以尝试模拟用户的点击、滚动等操作，使网站认为是真实用户在访问。
分析网站反爬虫机制：分析网站的反爬虫机制，了解其具体实现方式，然后针对性地进行处理。例如，有些网站会通过检测浏览器的User-Agent来判断是否是爬虫，可以修改User-Agent来绕过检测。
使用其他技术手段：如果以上方法都无法解决问题，可以考虑使用其他技术手段来获取页面内容，如网络抓包工具、代理服务器等。

需要注意的是，使用这些方法时需要遵守网站的使用规则和法律法规，不得进行非法的数据采集和侵犯他人隐私的行为。

页面内容是否对你有帮助？

有帮助

没帮助

如何使用硒和美汤点击元素？

、、、、

如何在python中使用selenium和漂亮的汤点击一个元素？我得到了这些代码，我发现它很难实现。我想在每次迭代中单击每个元素。没有分页或下一页。只有大约10个元素，在单击最后一个元素后，它应该会停止。有人知道我该怎么做吗。以下是我的代码 from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.support.ui import WebDriverWait import urllib import urllib.request from bs4

浏览 2提问于2019-11-13得票数 0

2回答

有没有一种方法可以使用Python来遍历变量ID？

、

我有脚本女巫测试网络应用程序： from selenium import webdriver from selenium.webdriver.common.keys import Keys import time driver = webdriver.Chrome("C:\\Program Files\\Google\\Chrome\\Application\\chromedriver.exe") time.sleep(2) driver.get("https://website.com") driver.find_element_by_id('us

浏览 3提问于2020-11-04得票数 0

回答已采纳

1回答

在页面上找元素有困难。硒、蟒蛇

、、

在这里刮这一页。我正试图在名字中得到邮件图标。我尝试过许多事情，但似乎无法找到它。帮帮忙好吗？ from selenium import webdriver from bs4 import BeautifulSoup from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrom

浏览 2提问于2020-12-18得票数 0

回答已采纳

2回答

Selenium Python:单击JSON应用程序生成的链接

、、

[艾德:也许我只是在问这个？不确定-- ] 我正在尝试使用Selenium (Python)通过超链接导航到web数据库中的页面。一个页面返回一个表，其中包含我希望Selenium遵循的超链接。但是这些链接不会出现在页面的源代码中。与感兴趣的表相对应的唯一html是指示该站点正在从方面搜索中提取结果的标签。在div中有一个<script type="application/json">标记和几个搜索选项。没别的了。同样，我可以在Firefox中查看超链接，但不能使用"View Page Source“或Selenium的selenium.webdrive

浏览 0提问于2015-04-29得票数 2

1回答

使用selenium从动态网页表格中查找值

、、、

我有一段python代码，它使用selenium打开大学成绩网页，输入一些学生值，并打开该学生的结果页面。结果页面有一个动态表，我无法访问它的HTML代码。如何查找特定行和列的值？我打开大学成绩网页的python代码是： from selenium.webdriver.support.ui import Select firefox_browser = webdriver.Firefox(executable_path=r'C:\Program Files\gecko\geckodriver.exe') firefox_browser.get("http://res

浏览 12提问于2020-04-12得票数 2

2回答

基于像素模式识别的Java自动化框架

、、、

我必须用Java开发某种机器人作为测试背景。我们在浏览器之外的所有web应用中都使用了Selenium :像素识别；也就是截图，然后将其与我已有的图像进行比较，并获得该图案在屏幕截图上位置的坐标。有没有框架或免费的Java库可以让这项工作变得更容易？提前感谢！

浏览 0提问于2011-09-21得票数 1

回答已采纳

1回答

xpath用于单击按钮- python/selenium

、、、

我试图访问一个主页，登录，点击登录按钮，点击一个按钮(在第二页)使用python/selenium。我使用Xpath编写的登录按钮运行良好。浏览器打开、写入用户和登录，然后单击登录按钮。不幸的是，在下一页，我无法点击我需要的按钮。它使用Xpath不起作用，我也不明白为什么。html与第一个按钮完全不同，按钮名为'Reservar‘，它位于一个名为<app-menu_menu>的类中，编写如下： <a href="/Services" id="advanced" class="element ">

浏览 10提问于2022-02-13得票数 1

回答已采纳

5回答

需要从selenium服务器转储带有元素id的整个DOM树

、、

我一直在使用python进行web自动化测试。自动化的关键部分是为HTML页面中的用户可见对象找到正确的元素。下面的API大部分时间都能工作，但并不是所有时间都能工作。 find_element_by_xxx, xxx can be id, name, xpath, tag_name etc. 当HTML页面太复杂时，我想搜索dom树。想知道是否可以要求selenium服务器序列化整个DOM (可以使用元素id通过webdriver执行操作)。客户端(python脚本)可以执行自己的搜索算法来找到正确的元素。请注意，python selenium可以通过以下方式获得整个html页面 dr

浏览 4提问于2014-08-18得票数 17

回答已采纳

2回答

Python Selenium -没有找到这样的元素..。我迷路了

、、、、

我试图点击一个元素，它应该将我发送到下一页，但是，我似乎无法正确定位它，甚至无法找到页面上的任何项目。元素HTML代码 <a data-qa="menu-button" class="HeaderMenu__HeaderItemButton-kr6p0e-0 hbeYmr MenuButton__MenuButtonWrapper-dq0g44-0 imLDTG" data-cv-test="headerSearchLink" href="/cars" target="_self">Searc

浏览 7提问于2021-06-17得票数 0

回答已采纳

2回答

如何使用Selenium和Python启动边缘浏览会话

、、、、

当运行驱动程序边缘打开时，我会得到以下错误，但是这个错误会弹出，无法运行代码的其余部分我的代码 from selenium import webdriver driver = webdriver.Edge() driver.get("https://stackoverflow.com") Traceback (most recent call last): File "C:\Users\Jawad Azhar Ch\Documents\1.CODING\idm dload\id.py", line 4, in <module> dri

浏览 3提问于2020-07-20得票数 2

回答已采纳

2回答

我无法使用python中的selenium单击网页中的按钮。

、

下面的代码有什么问题？ import os import time from selenium import webdriver driver = webdriver.Firefox() driver.get("http://x.x.x.x/html/load.jsp") elm1 = driver.find_element_by_link_text("load") time.sleep(10) elm1.click() time.sleep(30) driver.close() 页源是 <body> <div class="fo

浏览 3提问于2017-08-20得票数 0

回答已采纳

2回答

我不能让pip工作与变态安装

、

我是python的新手，并计划经常使用精神病。我使用的是一台工作计算机，但拥有完全的管理员权限。 version是随python版本2.7.11一起提供的，并且已经包含setuptools。我正在尝试安装selenium模块，但在让pip正常工作时遇到了问题。在cmd中，它识别' python‘命令，所以我知道python在我的路径中。我从以下位置得到消息"can't open file 'pip'：Errno2 No No file or directory“(无法打开文件‘pip’：没有这样的文件或目录)： python pip install

浏览 1提问于2017-05-04得票数 0

3回答

本地HTML字符串上的Python Selenium

、

我试图在本地HTML字符串上运行Selenium，但似乎找不到任何关于如何这样做的文档。我从电子邮件API中检索HTML源代码，因此Selenium将无法直接解析它。是否要修改以下内容，以便读取下面的HTML字符串：用于远程访问的Python代码： from selenium import webdriver from selenium.webdriver.common.keys import Keys driver = webdriver.Firefox() driver.get("http://www.python.org") assert "Python

浏览 11提问于2015-12-29得票数 11

回答已采纳

1回答

Python selenium无法检测当前页面元素(按钮)

、、

Python Selenium在打开新选项卡后无法检测当前页上的按钮，它仍然认为旧页类似于html结构.它不使用一个打开的选项卡复制或执行任何操作，只有我在运行程序时第一次打开的选项卡以下是代码： driver = webdriver.Chrome(path) driver.get("https://temp-mail.org/en") time.sleep(10) button = driver.find_element_by_xpath('//*[@id="tm-body"]/div[1]/div/div/div[2]/div[1]/form

浏览 2提问于2021-07-15得票数 0

回答已采纳

2回答

Selenium/Safari的下一页

、、

我正试图在一个网站上做一些网络抓取，但我无法访问safari上的下一个页面。网址是：代码只给我相同的结果，第一页两次，我需要前第三页 from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.common import exceptions from bs4 import BeautifulSoup import re import pandas as pd import os browser = webdriver.Safari() browser.get(&

浏览 4提问于2019-11-24得票数 0

2回答

空白页: Python中的Selenium Chrome自动化

、、、、

我试图在Python中使用selenium和chrome浏览器来自动化一个进程。我的浏览器对大多数页面都能正常工作，但无法呈现包括chrome://version/在内的几个页面。对于一般自动化(没有无标题)，它正确地返回页面和页面源，而对于无头浏览，它返回一个空白页和页源如下所示 <html><head></head><body></body></html> 我在不同的操作系统中尝试过chrome，包括OpenSUSE、fedora和Windows。我尝试过很多事情，比如:删除所有的初始参数，使用无头关闭的浏览器。供

浏览 7提问于2019-09-24得票数 6

1回答

chromedriver selenium.common.exceptions.NoSuchElementException:消息:没有这样的元素:无法定位元素

、、

我一直在为find_element_by_class_name而苦苦挣扎。我正在尝试使用selenium和chromedriver登录一个网页。为此，我必须首先找到登录按钮并单击它。不幸的是，当我使用find_element_by_class_name或find_element_by_xpath方法时，我得到了以下错误消息: selenium.common.exceptions.NoSuchElementException:消息:没有这样的元素:无法定位元素我使用的是selenium版本3.141.0 chrome版本86.0.4240.75 python3 下面是我的代码： import

浏览 20提问于2020-10-29得票数 0

回答已采纳

2回答

Python通过更改url编号转到新页面

嗨，我需要使这个python代码循环页从1到5 ('') 如果他们有任何与selenium的方式，那将是很酷的<凌晨3点新的python from urllib.request import urlopen from bs4 import BeautifulSoup import re import requests import json import csv import time html = urlopen('https://test.com/index/1') bs = BeautifulSoup(html, 'html.parser&

浏览 0提问于2019-10-16得票数 0

1回答

试图解析z-lib的所有结果，以建立图书标题数据库。

、、

我正在努力刮一张z库中所有可用书籍的列表，但是结果只能通过一个搜索词提供，我想要所有书籍的标题。此外，查询功能仅10页，每页50个结果，总共500个。只使用空格进行空搜索，就可以得到500本最受欢迎的书籍。我打算使用Selenium和Python，但是我无法访问整个图书列表。有什么想法吗？谢谢

浏览 7提问于2022-01-30得票数 -2

2回答

如何使用Python和Selenium点击页面上的多个下拉列表？

、、

我试图点击一个页面上的多个下拉列表，但是我一直收到一个错误，说我的列表对象没有属性tag_name‘。我的代码 def click_follow_buttons(driver): selects = Select(driver.find_elements_by_class_name("jBa"))#jBa print selects for select in selects: select.select_by_index(0) driver.find_element_by_class_name("bA"

浏览 1提问于2015-12-15得票数 3

1回答

Python：init()接受一个位置参数，但给出了2个

、、

我的刮胡刀坏了。它给了我这个错误，"TypeError：init()接受一个位置参数，但是给出了两个位置参数。“ 当我尝试使用Edge、Chrome和Firefox打开时，我就遇到了这个错误。 from selenium import webdriver from selenium.webdriver.common.keys import Keys driver = webdriver.Edge(executable_path="C:\\Users\.......\Python\Python37-32\Lib\site-packages\selenium\edgedriver

浏览 0提问于2019-07-26得票数 0

2回答

从web链接中获取基于登录按钮的xpath

、、

我正在尝试使用python运行Selenium，并且我成功地启动了浏览器并输入了用户名和密码，但是我无法运行xpath的登录按钮。 Python Script import selenium from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import Select from selenium.common.exceptio

浏览 1提问于2018-09-28得票数 0

回答已采纳

2回答

使用Python在Selenium Web驱动程序中模拟HTTP响应

、、、、

我目前正在试验Selenium驱动程序的Python版本。到目前为止，使用驱动程序一直很直接，但我最近一直在努力解决模拟HTTP响应的问题。是否有允许您以编程方式模拟web应用程序中的HTTP响应的Python包？也就是说，它允许Selenium发送真正的HTTP请求(例如，单击应用程序中的一个链接)，但随后拦截它们并发送我通过代码创建的假HTTP响应。当然，应用程序会显示那些虚假的回复。它必须能够与Python驱动程序完美地集成，并且不干扰它与Web应用程序的通信。额外的好处是能够将所有对特定URL (或URL正则表达式)的请求进行统计。编辑:根据近地天体在下面的建议，我实现了以下步骤：

浏览 0提问于2015-07-02得票数 4

1回答

webdriver org.openqa.selenium.NoSuchElementException:找不到元素：

、、

我正在尝试做的是检查每个页面上的元素，如果它在当前页面上可见，我想要做一些断言。我的代码如下所示： package com.example.tests; import java.util.Iterator; import java.util.List; import java.util.regex.Pattern; import java.util.concurrent.TimeUnit; import org.junit.*; import static org.junit.Assert.*; import static org.hamcrest.CoreMatchers.*; im

浏览 0提问于2015-01-26得票数 1

1回答

如何使用selenium获得javascript结果？

、、

我有以下代码： from selenium import selenium selenium = selenium("localhost", 4444, "*chrome", "http://some_site.com/") selenium.start() sel = selenium sel.open("/") sel.type("ctl00_ContentPlaceHolder1_SuburbTownTextBox", "Adelaide,SA,5000") sel.click("

浏览 0提问于2010-03-18得票数 3

回答已采纳

2回答

逐个文本查找元素并打印下一个/前一个兄弟姐妹。

、、、、

我正试着抓取这一页的内容，需要关注的是，有时数据是按这个顺序命名-地址-Pin-Mobile-等等。有时地址不存在，名字-Pin-Mobile 没有定义特定的类，我也不确定要使用哪个xpath来获取准确的文本。我正在使用Selenium Python。我们可以通过文本查找元素和打印父级的下一个兄弟类吗？让我举个例子来澄清， <td> <b>Address :</b> " Sri Saadhuraam Parisar, Kosamnara, Kotra Road Raigarh " </td> 那么，是否有办法通过

浏览 1提问于2014-05-23得票数 0

回答已采纳

2回答

不能使用带Selenium的xpath获得具有Find元素的文本

、

我试图用selenium和Python从下面的示例中获取元素'show-more-less-html__markup‘中的所有文本：这是我的尝试： description = browser.find_element_by_xpath("//div[@class='show-more-less-html__markup']").text

浏览 4提问于2021-11-04得票数 0

回答已采纳

3回答

.NET验证POST请求结果

、、

我需要我的应用程序登录到现场与用户定义的登录和密码。尽管发送POST数据非常简单，但我无法管理如何检查返回的页面是否显示“登录”或“错误密码”语句。搜索指定语句的.html字符串太慢，比较预置错误页不起作用，因为页面是动态加载的(具有相同的url)。是否有管理.html内容的库？如果有必要的话，我可以使用java或python以及c#。

浏览 4提问于2014-01-06得票数 3

回答已采纳

1回答

我不能单击一个项来使用python和selenium填充表单。

、

我对这两个Python都是新手，这是我第一次尝试Selenium。我的目标是使我在工作中放的一些罚单自动化。我使用的边缘，它似乎是建立的页面使用角。我开始选择我的选择，但无论我做什么，我都不能选择它，我已经在这里搜索了关于这个问题的其他帖子，并尝试了我能找到的所有解决方案，但它仍然不起作用。这是一张我走多远的照片。这是我的代码，我做错什么了？ from selenium import webdriver from selenium.webdriver.edge.service import Service from selenium.webdriver.edge.options i

浏览 3提问于2022-04-02得票数 0

4回答

Python chromedriver无法启动浏览器

、

我正在使用selenium webdriver版本2.49.2和Python2.7.7。视窗。我在'C:/Python27‘和'C:/Python27/Scripts’中有chromedriver.exe，这两个都添加到了Path变量中。我的代码在browser=webdriver.Chrome()上失败了，我也尝试过 browser = webdriver.Chrome("C:/Python27/chromedriver.exe")，但有相同的结果。有一个像命令行窗口一样的黑色窗口有一瞬间，但浏览器窗口没有出现。错误消息为空，因此很难排除故障： Trace

浏览 1提问于2016-01-27得票数 1

1回答

使用python从交互式网页中提取数据

、、

相对来说，我是蟒蛇的新生。我刚刚学会了如何使用python识别网页中的urls。但是，现在我想从网页中的图表中提取数据。我有三个问题需要有意见。它需要登录才能看到网页。(用户名:18521057966；pw:saifmf) 无法从源代码中找到数据(我假设为html) 如果我们能找到哪一部分是图表，我们如何提取数据。

浏览 1提问于2015-04-23得票数 1

7回答

在Selenium IDE中，如何获取基url的值

、、、

是否可以从Selenium脚本(从Selenium中保存的普通脚本)中检索基url的值？我要做的是使用assertLocation验证当前的url。但是assertLocation返回绝对url。我希望将当前的url与相对的url进行比较，而不必在url的开头使用*。我希望能够访问基字符串，因为我希望能够在不同的站点(各种开发站点+生产站点)上运行测试，但是如果我使用*，我无法检查根页面(对于以/结束的每个页面，*/都是正确的)。我现在就是这样做的： */一些-页(页) 这就是我想做的： baseURL +“/some” 注:是否有可能：在目标中使用变量；连接

浏览 5提问于2010-02-04得票数 21

回答已采纳

2回答

指定最高号。同时循环的尝试

、

我最后一次经历斯塔克溢流是很棒的，我感谢每一个帮助我的人。我现在试着在这个网站上刮代码中的不同页面。但是，当我试图点击下一页时，我有以下问题，我不知道如何传递它们， 1)下一页按钮的Xpath更改为no。搜索结果。就像。如果有5页，那么xpath是//html/body/div1/div7/div1/div1/div3/div/div/ul/li7/a‘，如果有10，那么xpath就是//html/body/div1/div7/div1/div1/div3/div/div/ul/li12/a’。我决定为10页或以上的人创建2种不同的脚本，为10页以下的人创建1种不同的脚本，但是即使这样做，

浏览 0提问于2014-05-23得票数 0

回答已采纳

2回答

Selenium HTML开放标记

、、、

也许答案很简单，但有没有人知道，Selenium和XPath是否能正确处理非XML的超文本标记语言，即包含开放标记？在我的例子中，它们是<col>和<input>。我问的原因是我们的自动化测试团队经常遇到这样的问题，在某些情况下Selenium XPath选择器不工作，而相同的XPath选择同一页面上的元素，例如，当我们在FirePath中使用它时。会不会是因为我们的HTML不是有效的XML？据我所知，XPath最初是用来处理XML数据的。

浏览 0提问于2012-08-06得票数 1

回答已采纳

1回答

PHP，Docker，Selenium Grid:如何运行测试？

、、、

有Docker容器:一个本地项目(php-framework)，Selenium Grid，Selenium节点(Chrome，Opera ...)。如何运行Selenium IDE (Python)生成的测试？ docker-compose.yml中的设置如下： selenium-hub: image: selenium/hub:latest volumes: - ./project/tests/Selenium:/tests container_name: selenium-hub ports: - 4444:4444 ch

浏览 0提问于2020-04-15得票数 0

2回答

ElementNotVisibleException:消息:不可见的元素- Python3 Selenium

、、

我的任务是写一个解析器来点击一个href链接，它看起来像一个按钮，在一个网站上，我有一些问题。下面是html：https://pastebin.com/HDKLXpdJ 下面是源代码html：https://pastebin.com/PgT91kJs Python代码： browser = webdriver.Chrome() ... try: element = WebDriverWait(browser, 20).until( EC.presence_of_element_located((By.ID, "reply-panel-reveal-btn&#

浏览 0提问于2017-10-13得票数 0

回答已采纳

1回答

如何等待页面完成呈现并获得完整的页源

、、

我在一个C#项目中使用Selenium(版本4.1.0)，我查找了很多信息。这是我的密码 ChromeDriver driver = new ChromeDriver(); driver.Navigate().GoToUrl("xxxx"); var wait = new WebDriverWait(driver, TimeSpan.FromSeconds(30)); wait.Until(ExpectedConditions.ElementExists(By.Id("xxx"))); context.Response.Write(driver.pageSour

浏览 2提问于2022-03-28得票数 0

1回答

无法在Windows 10中打开Chrome Open驱动程序

、、

我想在python和selenium库中使用chrome；但是，我在python控制台中打开webdriver时遇到了问题。它正在查找路径并打开它似乎是一个浏览器的内容，它还启动了一个在端口####上侦听的服务，但当我这样做的时候。 driver.get('http://www.google.com') Traceback (most recent call last): File "<stdin>", line 1, in <module> NameError: name 'driver' is not define

浏览 0提问于2020-03-15得票数 0

回答已采纳

1回答

selenium webdriver，java，Eclipse，Xpath

、

我试图使用Xpath在IE 11上拾取元素。我可以做它在其他网站，但不是为这一个。下面是我得到的信息，我也尝试过核磁共振成像，我无法定位这些元素，它没有选择任何元素。我可以在java和eclipse中使用Selenium webDriver。它只是第一页Login.Please help.It午餐网站，但没有定位任何元素。信息:检测到的方言:线程“W3C”org.openqa.selenium.NoSuchElementException中的异常:无法找到带有xpath == // For @name=‘EmailAddress’和@id=的元素；电子邮件；4“有关此错误的文档，请访问：

浏览 0提问于2018-04-24得票数 0

1回答

硒中的Python /美丽的汤

、、、

使用本教程，我试图从使用selenium和漂亮汤的站点中提取房地产列表信息：目标是在找到“下一页”按钮之前从第一页收集所有的href链接，导航到next，收集该页面上的所有链接等等。尝试用一个单一的函数来实现这一点，并对每个页面重复，但不知道为什么它不工作。刚开始学习代码，看起来太琐碎了，还找不到答案。会很感激你的帮助 from selenium import webdriver from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_co

浏览 2提问于2019-12-31得票数 0

回答已采纳

1回答

在VPS上运行Selenium时出现的各种Urllib2错误

、、、、

我正在使用Selenium与Python绑定一起使用无头火狐从网页中刮取AJAX内容。在我的本地机器上运行时，它工作得很好。当我在VPS上运行完全相同的脚本时，会在看似随机(但一致)的行上抛出错误。我的本地系统和远程系统具有相同的操作系统/体系结构，因此我猜想两者之间的区别是与VPS相关的。对于每个跟踪，在抛出错误之前运行该行4次。在执行URLError以将元素滚动到视图中时，我通常会得到这个JavaScript。 File "google_scrape.py", line 18, in _get_data driver.execute_script("ar

浏览 3提问于2013-12-05得票数 5

回答已采纳

2回答

Webscraping点击按钮Selenium

、、、

我正在试着用indeed.com搜索工作，用的是python，里面有硒和美汤。我想点击下一页，但似乎不知道该怎么做。看了很多线程，但我不清楚我应该在哪个元素上执行。这是网页html，当我检查“下一步”按钮时，带有灰色标记的代码就会出现。 ? 我还想提一下，我首先尝试了在执行mousedown时url发生了什么变化。在读取addppurlparam函数并在函数中添加字符串并使用该url后，我会返回到第一页。以下是我为selenium编写的类的代码，用于单击按钮： from selenium import webdriver from selenium.webdriver imp

浏览 23提问于2020-11-15得票数 0

回答已采纳

14回答

使用Python获取Selenium WebDriver中WebElement的HTML源代码

、、、、

我正在使用Python绑定来运行Selenium WebDriver： from selenium import webdriver wd = webdriver.Firefox() 我知道我可以像这样抓取一个网页： elem = wd.find_element_by_css_selector('#my-id') 我知道我可以拿到整个页面的源代码... wd.page_source 但是有没有办法获得“元素源”呢？ elem.source # <-- returns the HTML as a string 用于Python的Selenium WebDriver文档基

浏览 353提问于2011-09-01得票数 582

回答已采纳

1回答

如何在python中使用selenium或scrapy点击“下一步”按钮

、、、、

我正在尝试使用scrapy从flipkart.com中抓取一些数据。除了翻到下一页，我什么都拿到了。首先，我尝试使用scrapy，然后使用selenium。实际上，一个类有上一页和下一页的两个链接。使用scrapy:我无法获取任何结果。我得到的是空白输出。使用selenium:每当我尝试点击下一页时，从第一页到第二页都可以正常工作。但是然后不是转到第三页，而是返回到第二页。有没有其他方法可以做到这一点？我应该如何区分上一页和下一页的URL？

浏览 45提问于2021-02-10得票数 1

2回答

使用Beautiful Soup进行数据提取:数据在网站上可见，但在HTML标记中不存在文本或值

、、、、

我正在尝试从一个网站中提取数据使用HTML 我无法从HTML.I中提取文本。我正在使用Python，Selenium和Beautiful Beautiful来提取数据。我使用CSS Selector从jquery中检查。如何在jquery中使用python选择值

浏览 1提问于2018-01-19得票数 1

2回答

HTML5缓存声明:后备部分和网络*

、

来自 CACHE MANIFEST FALLBACK: / /offline.html NETWORK: * 考虑到这段代码到底做了什么，我无法从URL中理解。“回退”部分是否表示在没有找到任何内容时，显示offline.html页？那么network: *所有的资源都将被缓存吗？上面也写着它在每个页面上使用常见的CSS、JavaScript和图像。这些资源中的每一个都需要在CACHE中显式列出。这似乎与network: *相冲突，在那里它似乎说缓存所有东西？

浏览 2提问于2010-07-19得票数 4

回答已采纳

2回答

在Selenium中查找隐藏的超链接(Python爬行)

、、、

我想用Selenium追踪化妆品品牌的销售数据，但我很难找到下一页的超链接。在这个链接中，有3页，如果我点击页面底部的2或3，我可以浏览下一页。但是，当我检查html代码时，它只返回<a data-index="2">2</a>表单。因此，我在"a“标签中找不到到下一页的任何超链接。有什么方法可以找到下一页的链接吗？我的临时密码在这里。soup.find_all('nav',{'class':'paging'})[0]是关于下一页的html代码。 from selenium import

浏览 1提问于2019-09-16得票数 1

回答已采纳

1回答

无法使用webdriver从按xpath拆分单元格的表中获取数据

、、

无法从一个单元格的拆分表中获取数据，谢谢！ Python代码 from selenium import webdriver driver = webdriver.Firefox() driver.get("url") print driver.find_element_by_xpath('//html/body/div/div[3]/table/tbody/tr[1]/td[4]/p[1]/span').text print driver.find_element_by_xpath('//html/body/div/div[3]/table/tbody

浏览 11提问于2018-08-25得票数 1

回答已采纳

2回答

WebDriverException:消息:无法加载配置文件。可能是火狐版本不匹配。对于Firefox，您必须使用GeckoDriver代替

、、、、

我尝试如何通过python和selenium解析网站。但我总是遇到以下问题:调用函数webdriver.Firefox会打开一个火狐实例，但是没有任何网站可以通过get调用，似乎:整个代码都阻塞在函数firefox中(参见:print(“未到达的打开调用”))浏览器正在打开，大约30秒后，一个异常将导致broswer退出，并带有消息： selenium.common.exceptions.WebDriverException: Message: Can't load the profile. Possible firefox version mismatch. You must use

浏览 9提问于2020-09-24得票数 1

回答已采纳

1回答

Selenium: WebDriverWait (presence_of_all_elements_located)实际上是如何工作的？

、、

我知道它能做什么，但我不明白它是怎么做的，如果你知道我的意思。例如，下面的代码将从页面中取出所有链接，如果它在页面上找不到任何<a>标记，它就会超时。 driver.get('https://selenium-python.readthedocs.io/waits.html') links = WebDriverWait(driver, 30).until(EC.presence_of_all_elements_located((By.TAG_NAME, 'a'))) for link in links: print(link.get_a

浏览 2提问于2020-07-30得票数 2

回答已采纳