使用Selenium从网页中提取数据时遇到问题

文章/答案/技术大牛

发布

1回答

java、html、selenium

这应该连接到网页，通过XPath定位HTML元素，然后将文本的值记忆到一个变量中。

浏览 14提问于2020-02-20得票数 0

回答已采纳

1回答

Python:使用Selenium WebDriver在客户端不打开浏览器

python、selenium、selenium-webdriver

我开发了一个使用Selenium WebDriver打开一些页面的应用程序。它在本地完全正常工作，但我也需要在客户端启动浏览器。

浏览 0提问于2018-11-30得票数 2

1回答

如何从Selenium中的xpath表达式获取文本元素？

java、xpath

当Selenium浏览网页时，我想保存该网页中的一些文本。我在Java中使用Selenium。那么有没有办法从web页面中提取具有特定xpath文本呢？

浏览 1提问于2011-08-30得票数 0

1回答

C#下载包含正确显示所需内容的网站

c#、web-crawler

由于多种原因，我们想要显示索引，以便我们可以把它放在我们的投资组合中。第一个想法是对每个网站进行程序截图。我们公司的负责人立即揭穿了它，因为他们想要现场直播。Iframes显然不是一种选择。

浏览 3提问于2016-03-30得票数 0

2回答

使用selenium ide测试时如何单击浏览器刷新确认弹出窗口

selenium、selenium-ide

尝试使用Selenium IDE测试web应用程序时遇到问题。当我刷新网页时，弹出浏览器确认消息，selenium IDE中是否有任何选项可以自动单击此浏览器确认消息的确定请帮帮我..

浏览 0提问于2013-01-02得票数 1

1回答

如何自动化chrome扩展与父网页的交互？

python、selenium、google-chrome-extension、automated-tests、sikuli

我已经使用selenium-python自动化了父网页，但我无法使用selenium来自动化chrome扩展，因为selenium绑定到网页视图，所以我无法单击google chrome标题栏中的chrome由于这个限制，我尝试使用sikuli点击chrome-extension图标，但我无法获得当点击该扩展图标时出现的chrome-extension弹出HTML的DOM，因为我必须访问该扩展弹出的html我认为我可

浏览 16提问于2019-07-09得票数 0

2回答

使用selenium递归浏览链接

python、selenium

我想知道是否可以使用python (例如: yahoo.com)浏览站点中的所有链接(包括父链接和子链接)，将子链接中的所有链接打开到三个四层。

浏览 6提问于2014-05-18得票数 1

回答已采纳

1回答

如何查看Selenium测试变量中的内容

php、regex、selenium

我是第一次使用Selenium webdriver。这是我工作的第一天，用它来测试我们公司网站的一部分。这个环境是为我预先设置的:它是一个带有Selenium的Laravel安装环境，我使用PhpStorm创建我的测试，然后通过iTerm运行它们。2)我在从网页上拉出一段文本时

浏览 1提问于2014-06-03得票数 0

2回答

与selenium api通信的jquery事件处理程序

java、jquery、events、selenium

我有一个java selenium应用程序，它需要知道某些事件。这意味着java应用程序等待在打开的浏览器窗口中进行的用户输入。例如，如果我想在用户每次点击某个元素时向java应用程序发送一条消息，这样我就可以用该信息做一些事情，我该如何实现呢？更新2 我需要的基本上是通过使用JavaScript代码触发回调函数来执行回调函数的可能性。

浏览 2提问于2011-09-16得票数 0

回答已采纳

1回答

扫描网站中的所有链接(URL)，并在selenium get()方法中使用每个链接

url、selenium、selenium-webdriver

我需要获取网站中的所有URL，以便使用Selenium get()方法打开网页。在打开一个页面后，我打算从网页中提取一些数据，然后转到下一个链接。

浏览 0提问于2013-10-29得票数 0

1回答

Python -使用Selenium从网页中提取数据

python、list、selenium

我正在尝试使用Selenium从网页中提取IP地址信息，下面是代码的一部分ServerNames = driver.find_elements_by_xpath("//spany.click()for ip in ips:当找到并单击“ServerNames”对象时，该网页将同时显示该特定服务器的主IP地址和备份IP地

浏览 1提问于2017-10-04得票数 0

回答已采纳

1回答

Selenium aspx结果

selenium、internet-explorer、dom、viewstate

我是刚接触selenium的人，所以如果这个问题不是很好的话，很抱歉。我正在考虑自动化一些数据收集。有一个ASP.NET站点，您可以在其中请求有关特定主题的数据。当数据查询完成时，用结果更新网页。当我使用selenium获取page_source时，我看不到数据。我相信它是在__VIEWSTATE中编码的。使用IE DOM Explorer，数据以纯文本形式存在。

浏览 23提问于2020-01-25得票数 0

1回答

如何使用Scrapy自动获取请求头？

web-scraping、scrapy

我们知道，在浏览器中，可以查看->网络-> XHR -> Headers和get Request Header。然后可以将这些标头添加到Scrapy请求中。但是，有没有一种方法可以使用Scrapy请求自动获取这些请求头，而不是手动获取？我尝试使用：response.request.headers，但此信息还不够： {b'Accept': [b'text/html,application/xhtml+xml,application/xml

浏览 50提问于2021-05-21得票数 0

回答已采纳

1回答

如何使用python selenium迭代网页中的动态表？

python、selenium、selenium-webdriver、web-scraping、ui-automation

如何使用python selenium迭代网页中的动态表？当我迭代循环时，它每次只单击第一行并提取数据。没有点击到第二行吗？

浏览 52提问于2018-07-23得票数 -1

1回答

如果我们可以使用Selenium，为什么还需要像BeautifulSoup这样的解析器呢？

python、selenium、beautifulsoup、web-crawler、urllib2

我目前正在使用Selenium从一些网站抓取数据。与urllib不同，我似乎并不需要像BeautifulSoup这样的解析器来解析HTML。我可以简单地找到一个带有Selenium的元素，并使用Webelement.text来获取我需要的数据。正如我所看到的，有些人在web爬行中同时使用Selenium和BeautifulSoup。

浏览 3提问于2017-04-02得票数 8

回答已采纳

1回答

有没有办法将Internet explorer窗口中的内容复制到Jframe应用程序窗口？

java、swing、jframe

我正在为一个自动化项目创建一个使用Java和Jframe的小型可执行应用程序。我只想通过单击Jframe应用程序中的一个按钮来复制网站(在Internet Explorer中打开)中的特定内容。

浏览 1提问于2016-10-26得票数 0

2回答

用Scrapy检测表格(并填写它们)

python、xpath、web-scraping、scrapy、lxml

我很难找到一种通用的方法来检测HTML中的表单，然后提交它。当预先知道给定页面的页面结构时，我们当然有几种选择：-手动确定POST查询的形式，然后直接用urllib2进行重构：('field_32[]', 82)])或使用<

浏览 2提问于2016-02-08得票数 1

回答已采纳

1回答

如何使用python/selenium获得数据时间戳

python、selenium

下面是我想要从中提取数据时间戳的表的html。网页在到目前为止，我尝试了我在这里找到的非常丰富的变体，但似乎没有任何效果。有人能帮我提取(例如) 1536962400吗？换句话说，我想提取表的每个数据时间戳值。欢迎您提出任何建议！我使用selenium/python从网站中提取表数据，但是数据时间戳总是会出现错误。

浏览 0提问于2018-09-20得票数 0

回答已采纳

1回答

如何从需要JavaScript的URL中提取HTML？

ruby

我试图从需要JavaScript的页面中提取原始的HTML (最终目标是只提取纯文本)。不幸的是，简单的get请求返回指定需要运行JS的浏览器的HTML。\n </noscript>"html = = HTTP.headers(user_agent_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3

浏览 2提问于2018-01-02得票数 2

回答已采纳

1回答

登录重定向后的web抓取

python、selenium、web-scraping、beautifulsoup

我需要从一个网页抓取数据“阻止”登录重定向。因此，我使用selenium输入所有必要的登录信息，并导航到数据所在的位置。然而，据我所知，selenium不支持提取标题和其他文本数据，这意味着我将不得不使用另一个web抓取工具，如beautiful soup。有没有办法可以使用selenium来提取数据，或者使另一个工具能够与已经登录的selenium</e

浏览 26提问于2020-08-13得票数 0

回答已采纳

点击加载更多