我想使用Selenium在链接被点击后获取页面的HTML。通常,我只下载我想要单击的链接,但在这种情况下,当单击该链接时,它会触发一些混淆的Javascript,将数据加载回当前页面的DOM中。所以,这就是我所期望的。这将加载页面,找到并单击我需要的链接,然后使用JavaScript中的outerHTML以文本形式返回DOM:
from selenium<
目前,我正在使用Selenium Webdriver for c#和PDFBox来自动化报告的PDF文本。现在,使用PDFBox,我们能够解析给定URL链接的pdf,其中URL = new URL("link of pdf");但是,这不需要任何前提条件就可以直接获取URL链接。如果我使用直接URL地址访问PDF,则会出现“未找到资源”错误。我基本上需要登录到应用程序,并选择我需要的报告,以便加载实际的PDF。它具
我在C#中有一个控制台程序,使用Selenium控制Chrome浏览器实例,我想从一个页面获得所有链接。但是在页面加载Selenium之后,Selenium的PageSource与我导航到的网站的HTML有所不同。页面的内容由JavaScript异步加载,并且超文本标记语言被更改。即使我像下面这样加载网站的HTML,HTML仍然不同于Selenium控制的浏览器窗口中的HTML:
var html