屏幕抓取带有.exe href链接的页面_获取带有xpath的href链接的内部href_定位带有Selenium的href链接 - 腾讯云开发者社区

、

我正在尝试使用curl从以下网页获取实时水流数据：https://www.waterrights.utah.gov/cgi-bin/dvrtview.exe?SYSTEM_NAME=BEAVER%20RIVER 使用： bret@ubuntu:~$ curl https://www.waterrights.utah.gov/cgi-bin/dvrtview.exe我怀疑这与通过可执行文件dvrtview.exe调用via服务器上的数据库而生成<

浏览 16提问于2019-06-06得票数 0

1回答

IMDB网络爬虫- Scrapy - Python

、、、

,asc'] urls = response.css('h3.lister-item-header > a::attr(hrefresponse.urljoin(url),callback=self.parse_movie) item['actors&#

浏览 21提问于2018-08-26得票数 0

回答已采纳

1回答

将站点屏幕抓取到新的浏览器窗口

、

我不确定我问的是不是可能。我有内部Sharepoint网站，只能通过有效的凭据(Windows/SQL身份验证)访问。从测试ASP.NET web应用程序，我执行了登录屏幕抓取，获得_VIEWSTATE，__VIEWSTATEGENERATOR，__EVENTVALIDATION等，然后提供凭据和准备的PostData，并能够获得cookies，最后能够成功登录到安全页面。我得到了安全页面的html源代码。现在，我需要在单独的浏览器窗口中启

浏览 0提问于2018-05-24得票数 1

3回答

Scrapy LinkExtractor无法提取带有邮件地址的链接：

、、

我使用LinkExtractor类来提取页面中的所有链接 print link.url这将打印页面中的所有URL。但是我似乎不能得到href等于mailto: link的链接。例如： <a href="mailto:example@gmail.com">Mail<&#x

浏览 2提问于2016-01-21得票数 0

1回答

WGET -从第三方网站下载特定文件(通过扩展或mime类型)

、、、

我需要使用wget从网站获取所有的".js“扩展文件，包括第三方的扩展文件，但并不总是这样做。我的代码中是否遗漏了什么？提前感谢！

浏览 24提问于2020-04-29得票数 0

1回答

如何使用从selenium检索到的元素？

、

如何有效地使用从Selenium检索到的存储在变量中的元素？我使用的是python。matching_threads.append(i)print(matching_threads)我从matching_threads的打印输出中得到以下内容我要做的是转到该元素，然后单击该元素右侧的元素。我不能理解的是，如何使用matching_threads中存储的信息检索sele

浏览 21提问于2021-02-18得票数 0

回答已采纳

1回答

用于在不同的html标记之间抓取文本的Xpath查询

、、

我正在使用R来抓取屏幕。我已经抓取了一个页面，并且我已经设法找到了页面上在页面上某个位置找到的所有链接(具有name属性的锚标签内的锚标签)，使用：现在，我已经从Curl的链接中抓取

浏览 0提问于2013-09-27得票数 1

3回答

如何点击在href中有javascript:__doPostBack的链接？

、、

我正在用python编写一个带有模块'mechanize‘的屏幕抓取器脚本，我想在一个在href中有javascript:__doPostBack的链接上使用mechanize.click_link()我相信我正在尝试解析的页面正在使用AJAX。>>> next_link.__class__.attrs=[('id',

浏览 1提问于2009-09-13得票数 7

回答已采纳

1回答

刮掉似乎没有URL的页面

、、、、

我试图在一个属于我的客户的网站上为这些职位列表提供更多的曝光机会。问题是，我需要能够链接到具体的工作列表，以便求职者申请。我试着保存列表链接。如果我能为求职者保存一个地址，让他们点击原始名单，然后再申请，那将是非常理想的。这个网站为什么不提供这些页面的URL？如果我无法获得一个特定的地址，我想我可以得到它，这样用户就可以点击一个链接，该链接触发我的客户站点上的</em

浏览 3提问于2013-09-28得票数 1

回答已采纳

1回答

如何使用jquery或部分匹配匹配文本

我在锚点标记中有这个超链接现在，我希望当该页面被单击时，我会看到带有如下超链接的页面有没有可能我可以用jquery抓取var1。即使它部分匹配，它也是好的

浏览 0提问于2010-06-21得票数 0

回答已采纳

1回答

屏幕抓取-仍不工作

、

我想刮的html页面，有一些脚本运行，通常执行的脚本，以显示点击后的链接。一些人提到了firebug，另一些人则谈到了我需要的代码的逆向工程。jQuery(this).addClass('activeLink'); ); 我正在使用vb.net，一些网站很容易使用firebug，在那里，通过查看脚本，我能够提取所需的数据该链接是和类别是我试图访问的。请注意，url不会更

浏览 3提问于2010-03-13得票数 1

1回答

使用JavaScript制作HTML链接对搜索引擎优化是有效的吗？

、、

我希望在WordPress站点上的每一篇文章中的内容区域中将匹配文本替换为html链接。我是通过JavaScript实现的，如下所示。document.querySelectorAll( selector )[i].innerHTML = document.querySelectorAll( selector )[i].innerHTML.replace( term ,`<a href="https://yuis-programming.com/vpn&qu

浏览 0提问于2020-01-14得票数 1

1回答

单击使用Ajax接收到的Anchor时重新运行函数？

、、

我正在尝试使用jQuery和Ajax创建一个页面转换效果。然后，我使用ajax获取href并抓取容器div中的所有HTML，在本例中是带有transition id的div，并在内容之间进行一些衰落。因此，我将用使用ajax提取的HTML替换页面上的HTML。这是我第一次使用transitionLink类单击锚链接时，它非常有效，但是一旦我尝试单击另一个锚链接(在HTML中从ajax调用中接收到)，

浏览 0提问于2019-05-24得票数 1

回答已采纳

2回答

Perl，使用机械化来导航网页

、、

我有一堆网页，我想通过一个脚本导航和抓取所有的内容。我知道这个链接是每个页面上的第18个链接。我有以下代码作为测试，只需跟踪链接一次并抓取屏幕：use WWW::Mechanize; p

浏览 0提问于2012-03-22得票数 0

1回答

BeautifulSoup "find“方法莫名其妙地返回NoneType

、

我正在使用BeautifulSoup模块查找不同种类的水母菌类的图像和站点链接，将它们写入html文件，并将它们显示给用户。links.append(link["href"]) </a></html> webbrowser.open(&

浏览 37提问于2020-03-29得票数 0

回答已采纳

1回答

使用python lxml抓取多个页面的Glassdoor

、

我使用下面的脚本通过Glassdoor抓取工作列表。下面的脚本只抓取了第一页。我在想，我怎么才能把它从第一页刮到最后一页呢？如果有任何帮助，我将不胜感激

浏览 11提问于2018-02-09得票数 0

1回答

如何使用webscrabe图像链接选项卡

、、、、

我正在尝试网络刮图像标签，以便我可以得到它的链接，我可以使用，这样我就可以直接去图像我正在制作的项目。，但不同的链接，所以我如何区分这两者？图片链接的HTML我希望我可以在这里放一个截图，因为这是很难理解的。1H5a1 1 0 0 0-1 1v14a1 1 0 0 0 1 1h7v-.01h7a1 1 0 0 0 1-1V5z"></path></svg></span>I

浏览 0提问于2019-08-31得票数 0

2回答

我正在抓取一个亚马逊网站，使用selenium作为产品链接，但得到下面附加的错误

、、、、

下面是我从亚马逊抓取产品链接的代码，但得到了错误。我试图从多个页面抓取链接的代码是很好的，3页后，给出了下面提到的错误。wbD = wb.Chrome('chromedriver.exe') pp2 = elem.find_element_by_ta

浏览 19提问于2020-10-14得票数 0

1回答

JavaScript:将像素位置添加到每个链接的href

是否可以将href-link的坐标添加到target-query中？我的意思是这样的： <a href="index.php?action=create&id=123&x=[...]&y=[...]" id="123">Link 123</a> 这应该通过document.write()或其他方法将页面上链接(id)的坐标添加到查询中。PS:应该在没有J

浏览 6提问于2020-10-20得票数 0

2回答

如何使用Nokogiri在href中加载javascript函数

、

我想在我的ruby项目中使用Nokogiri抓取一些html页面。在爬虫页面，有一些链接，我也想抓取。但问题是链接的href在javascript函数中。<a href="javascript:nextPage('some text','','other text')">Click here</a> 如何

浏览 3提问于2016-02-18得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云