python selenium抓取href (来自网站的链接)_Python抓取href链接_使用selenium抓取链接(Href)时出现问题；href="#“ - 腾讯云开发者社区

python、selenium

我有这个网站的https://jobs.ubs.com/TGnewUI/Search/home/HomeWithPreLoad?siteid=5012&PageType=searchResults&SearchType=linkquery&LinkID=6017#keyWordSearch=&locationSearch= 我想要抓取每个工作角色的链接，其中一个角色的HTML源是： <a i

浏览 16提问于2021-01-17得票数 0

回答已采纳

2回答

无法单击带有js后端的下载链接。

python、selenium、xpath、css-selectors、webdriverwait

在下载csv文件的网站上有一个链接。该链接位于一个表中，但实际下载链接是隐藏的。test-example="">Ford</td> <a test-example="" href#">ford.csv</a>

浏览 4提问于2019-11-10得票数 1

回答已采纳

2回答

Python -如何在URL中不分页地刮分页

python-3.x、web-scraping

如何使用URL访问下一页，内容如下：我知道如何使用刮取库(BS4、Selenium)，但我不知道如何抓取这样的站点。我一直在玩谷歌Chrome开发工具，但没有成功。我知道pubmed有API，但是API不返回我需要的信息(天气文章是否可以免费下载)。像Python这样的抓取站点通常的工作流程是什么？

浏览 0提问于2019-07-05得票数 0

回答已采纳

1回答

有可能刮掉这些特定的href链接吗？

python、selenium、web-scraping

我试图刮特定的href链接，但我只能抓取没有链接或每个链接可能在网站上，它有可能抓取每个链接，是在一个div标签？div标记具有相同的确切名称，但我无法找到在div标记中查找的方法，然后获取href标记from selenium.we

浏览 6提问于2022-09-14得票数 0

1回答

如何抓取和提取链接到n级，并再次抓取数据并将其映射到python中的输出？

python、web-scraping、web-crawler

我正在学习python中的网络爬行和抓取。我想要抓取数据，在一个网站上有链接，而在这些链接里面有更多的链接。所以我想抓取数据直到预定义的级别n。这是我的基本代码 import requestsfrom requests_ntlm import HttpNtlmAuth from seleniu

浏览 40提问于2019-12-17得票数 0

1回答

如何使用python代码自动下载

python-3.x

如何使用python打开一个文本文件中的每个URL，在IDM“添加URL角”(或chrome，如果IDM不允许)中打开并开始下载，它还必须等待下载完成并开始下载下一个文件(简而言之，在IDM或chrome上由python自动下载过程)。 import io

浏览 30提问于2019-08-18得票数 0

回答已采纳

1回答

Python:从html的href标签中获取javascript文件

javascript、python、html、web、web-scraping

考虑一个类似以下内容的网站： <a href="javascript:$('form_cofo_pdf_view_B000114563.PDF').submit();">B000114563.PDF</a> 我想用python打开底层文件，有效地抓取</e

浏览 6提问于2016-09-09得票数 1

3回答

如何在一个webtable中打开多个hrefs，以便在selenium中搜索。

python、selenium、selenium-webdriver、web-scraping、webdriver

我正在尝试使用python和selenium来抓取这个网站。然而，我所需要的所有信息都不在主页上，所以我如何单击“应用程序编号”列中的链接，一个接一个地转到该页面，然后刮掉信息，然后返回原始页面？Select(driver.find_elements_by_xpath('//*[@id="node-41"]/div/div/div/div/div/div[1]&

浏览 2提问于2018-09-11得票数 0

回答已采纳

4回答

我试图刮一个网站，有链接到亚马逊与Python使用这些框架-硒，美丽的汤。我的目标是收集以下Amazon产品的详细信息--> Title，Price，Description，First Review 但我很难使用漂亮的选择器，我尝试了许多组合，但我要么得到一个空输出，要么得到错误，不幸的是不是那么专业。主要的问题是Beautiful soup没有XPath选择器(AFAIK)。我应该使用scrapy来完成这项任务，还是scrap

浏览 50提问于2018-06-08得票数 0

回答已采纳

2回答

我不能抓取每个链接内容的具体时间段从确实

python、selenium、selenium-webdriver、web-scraping、selenium-chromedriver

我是python和web scraping的新手。您的帮助我们将不胜感激。我在编程和练习方面是新手。我正在使用python和selenium进行web抓取。我正在试着从事实上抓取数据。目标是找到过去24小时内发布的所有工作，并刮刮外部链接，这是在工作详细信息页面上与链接文本“申请公司网站”，标题，公司，名称，位置，工作描述。我写了以下代码，但是它正确地获取了页面上的所有链

浏览 33提问于2020-07-15得票数 1

回答已采纳

2回答

如何让selenium抓取标记内的href？

python、python-3.x、selenium

我目前正在尝试从这个网站解析href：from selenium.webdriver.chrome.webdriver import WebDriver from selenium.webdriver.support.uiim

浏览 0提问于2021-06-02得票数 0

1回答

我们如何自动化真正的浏览器，而不是使用selenium浏览器实例

selenium、selenium-webdriver、web-scraping、browser、automation

我正在尝试抓取一个网站，但是它没有加载selenium。当我在我的“真正的”chrome浏览器中浏览这个网站时，一切都很正常。有没有什么方法可以用我的真正浏览器和python来自动化东西，而不是使用selenium？谢谢

浏览 21提问于2021-03-24得票数 0

回答已采纳

2回答

尽管在技术上不可行，但While语句仍在循环

python、python-3.x、selenium、selenium-webdriver、geckodriver

我正在编写一个Selenium Python脚本，它应该从所有页面中抓取所有超链接，并使用单击的“下一步”按钮在它们之间切换。这成功地抓取了所有的链接，但当它到达“下一步”按钮元素不再存在的最后一个页面时，它会继续在最后一个页面上循环，并一直将抓取的数据一遍又一遍地写入CSV文件中。这就是我想要获取信息的网站：https://www.sreality.cz&#x

浏览 42提问于2021-02-23得票数 0

回答已采纳

4回答

检索广告URL

python

我正在寻找一种方法来检索这个网站的广告网址。有什么建议吗？

浏览 2提问于2012-11-05得票数 0

1回答

用Selenium和BeautifulSoup4抓取动态加载的Href属性

python、python-3.x、selenium、web-scraping、beautifulsoup

我尝试用Selenium和BeautifulSoup4抓取动态加载的href属性。当我查看-source网站时，href属性是空的，但当我单击inspect元素时，href属性将有一个链接。意味着href属性是动态加载的。如何提取该链接？soup.find_all('div',{'class':"rh_button_wrapper

浏览 42提问于2020-08-09得票数 0

回答已采纳

1回答

搜索pdf链接从各地的网站

python、selenium、web-scraping、beautifulsoup、scrapy

我想搜索一个网站，寻找所有的pdf链接。我知道BeautifulSoup有几种使用标签查找pdf文件的解决方案，但我想使用基本url搜索整个域，而不仅仅是链接的页面。我的想法是a)首先搜索整个网站的所有子链接，然后b)过滤掉有.pdf扩展名的链接。print(external_url_links, '\n') 我希望它能够抓取并返回所有链接，比

浏览 11提问于2021-07-02得票数 0

1回答

浏览器模拟和抓取与风车或selenium，多少个http请求？

python、selenium、selenium-webdriver、httprequest、windmill

我想使用风车或selenium来模拟一个浏览器，它访问一个网站，抓取内容，并在分析完内容后，根据分析结果进行一些操作。我最大的问题是使用风车或selenium可以完成多少个http请求。我的意思是，这两个程序是否可以

浏览 8提问于2013-07-14得票数 0

2回答

错误的NoSuchElementException导致基于硒的刮码失败。

python、html、selenium

我有一个Python代码，它废弃了不同的数据。例如，它从这个Website中删除了。NoSuchElementException-Encoding”：“标识”，“连接”：“关闭”，“内容-长度”：“95”，“内容-类型”：“应用程序/json”；charset=UTF-8"，“主机”：“127.0.0.1:40581”，“用户-代理”：“Pythonpost“：”{\“User\”User\“：\"link text\"，\”sessionId“：\"a7a441f0-0f6a-11e8-a

浏览 1提问于2018-02-11得票数 1

回答已采纳

2回答

Python Selenium元素单击

python、selenium、xpath、css-selectors、webdriverwait

使用selenium方面的初学者知识，我尝试找到click元素，打开链接。这些项目的链接没有href。如何执行单击正确的元素来打开链接。我正在使用python，selenium，chrome驱动程序，BeautifulSoup。所有库都会更新。下面是示例html片段，其中有一个标题，我需要单击selenium。如果你需要更多的html源代码，请告诉我。此代码来自“登录”唯一的<e

浏览 7提问于2020-11-16得票数 0

回答已采纳

1回答

当Selenium由于错误无法加载链接时，如何跳转到新网站？

python-3.x、selenium、selenium-webdriver、beautifulsoup、selenium-chromedriver

我有一个大约13.000个网站的列表。从这些链接中，我打算一个接一个地通过Python、Beautiful和Selenium来抓取信息。for house in all_nd: if str(requests.he

浏览 1提问于2021-04-29得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云