链接本身中包含特定关键字的href的xpath

、、

我需要的是找到页面上的所有链接，其中有一些关键字内的链接本身。因此，基于一些堆栈主题，我按如下方式构建我的xpath：它应该返回一个类似于=“……”的链

浏览 3提问于2017-02-25得票数 4

回答已采纳

1回答

如何使用Selenium和Python获取祖先<a>标记相对于子代<h3>标记的href属性

、、、、

我正在尝试获取一个<a>元素，以防它的嵌套(内部) <h3>标记包含特定文本。我该怎么做呢？假设结构如下： <section class="section"> <div class="section-content在匹配元素之后，我希望获得一个标记的href的值，

浏览 9提问于2020-12-05得票数 0

1回答

R: XPath表达式返回选定元素之外的链接

、

我使用R在上使用XPath语法从主表中抓取链接。主表是页面上的第三个，我只想要包含杂志文章的链接。(contains(@href, '/recherche/'))]/@href"))如果您查看输出，最后的链接不是来自主表，而是来自侧栏，尽管我通过请求objecty只包含第三个表来选

浏览 0提问于2013-05-18得票数 6

回答已采纳

1回答

Xpath选择不选择url

、

我想得到所有的href链接，其中包含医疗援助本身。通常，我使用的xpath工作，但在本例中不起作用。我遗漏了什么？<div class="download"><span class="downloads">25746</span><a href="/download/?prijevod=cobbl

浏览 4提问于2022-04-24得票数 1

回答已采纳

2回答

如何将输出转换为列表来统计它的数量？

、

我写了一个脚本来解析一个网页，并获取其上的链接量(‘a’标签)：import lxml.htmldom = lxml.html.fromstring(connection.read()) print link脚本的</em

浏览 0提问于2013-01-29得票数 2

回答已采纳

1回答

Roboframework - Selenium -查找所有包含特定文本的HREF

、、、

我的目标是在包含特定文本的网页中找到所有的HREF链接。使用Chrome DevTools，我在“查找元素”中进行了测试： ${elements}= Get WebElements xpath://[href*='photo/?expre

浏览 0提问于2021-03-13得票数 0

回答已采纳

1回答

如何获取给定网页中的所有出站链接并遵循它们？

、、、

我有下面的代码来获取网页中的所有链接：from scrapy import Selector item['TargetTitle'] = link.xpath('text()').extract() item['link'] = link.x

浏览 0提问于2014-11-29得票数 0

1回答

告诉-based() XPath查询在到达一个字母后停止？

、、、、

我为给定的关键字抓取各种作业页面，并在有匹配时提取标题和链接。(XPATH_MAPPING_HYPERLINKS['text'] % keyword)] hrefs = root.xpath(XPATH_MAPPING_HYPERLINKS['href']然而，对于像和关键字“Engineer”这样的页面，它会提取其中的单个工程作业，但也会提取到该公司的</em

浏览 3提问于2016-02-09得票数 2

2回答

Python/Selenium查找特定的类元素，分析它是否包含特定的span类，如果包含，则复制链接

、、、

尝试创建一个循环遍历收件箱的脚本，并找到所有包含“相对灵活”的div类，如果div类包含一个标有"dn dib-1“的span类，那么它将复制并保存以下href链接到我的列表，并移到下一个div。</a>link_list = []message = browser.find_elements_by_xpath('

浏览 4提问于2019-11-29得票数 1

回答已采纳

2回答

属性在selenium中引发NoSuchElementException。

、、、

我可以得到包含X的元素，但不能获得属性本身。为什么？data-href, "https://www.messenger.com/t/")]')links = browser.find_elements_by_xpath('//div[@aria-label="Conversations"]//a[cont

浏览 6提问于2020-04-07得票数 0

回答已采纳

1回答

如何使用Nokogiri (以及XPATH和CSS)提取HTML链接和文本

、、、

(更新:这个答案是从Nokogiri的角度编写的，但是如果您要为特定的查询寻找XPATH或CSS语法，它也很有用。) 我喜欢Nokogiri --它是从XML和HTML文档中提取元素的极好工具。如何使用Nokogiri从HTML中提取链接和链接文本？

浏览 1提问于2016-09-23得票数 7

回答已采纳

1回答

Nokogiri html解析问题

、

我很难弄清楚为什么我不能通过nokogiri正确地解析关键字。在下面的示例中，我让a href链接文本功能正常工作，但不知道如何提取关键字。这是我到目前为止所拥有的代码：doc = Nokogiri::HTML(open("http://www.cnn.com"))#doc.xpath</e

浏览 1提问于2010-08-10得票数 5

回答已采纳

2回答

拒绝某些URL

、

我目前正在为我的大学机构知识库项目使用Scrapy，在那里我需要获得每个大学的外部链接。有没有办法拒绝某些URL，比如'google.com‘和'twitter.com’。下面是我目前所拥有的。'http://eprints.utm.my/id/eprint/', self.parse) for hrefin response.xp

浏览 21提问于2019-03-11得票数 2

回答已采纳

6回答

获取Nokogiri中的属性值以提取链接URL

、、

我有一个文档，看起来像这样： <a href="http://google.com">link</a>我无法让Nokogiri获取href属性的值我想将地址作为字符串存储在Ruby变量中。

浏览 3提问于2011-08-18得票数 37

回答已采纳

5回答

如何获取href属性的值？

、

在XPath的帮助下，如何在以下情况下获取href属性的值(只抓取正确的url )：<a href="http://example.com">the right one</a> <a href="http:&

浏览 0提问于2011-01-19得票数 2

2回答

如何通过输入的关键字搜索使用selenium的网页？

、、

我对python中的selenium是个新手。我使用Xpath通过关键字搜索最高website： WebDriverWait(driver, 5).until(EC.element_to_be_clickable( (By.XPATH, "//a[contains(text(),'Supreme Time Tee')]"))).click() 我的问题是，我如何在关键字中搜索任

浏览 6提问于2020-04-22得票数 1

回答已采纳

1回答

xpath帮助获取链接包含一些href值的类下的按钮

、、

我正在尝试为这个站点编写一些自动化测试//button//i[@class='fa fa-plus'] 这将使我获得basket__ite

浏览 2提问于2016-02-09得票数 0

2回答

开发一个使用Chrome在多个选项卡中打开所有链接的python抓取器

、、

我正在尝试开发一个使用python的刮刀，它将在Chrome的多个选项卡中打开网页中的链接。我拼凑的代码是from datetime import timedelta, dateimport'，‘(在日期中)，所以我试着点击文本中有一个’，‘的链接。我确实意识到要让它在多个站点上工作，我最终需要使用一些更通用<em

浏览 0提问于2017-04-02得票数 0

2回答

如何使用Nokogiri从HTML head获取规范链接

、、

我正在尝试使用Nokogiri从网页中获取已定义的规范链接：我要找的是href。这就是我所拥有的： canon = page.xpath('//canonical

浏览 4提问于2016-11-17得票数 2

2回答

使用Python、Selenium和XPath查找href链接

、、、、

我希望使用XPath表达式从标记中获取href。<article> <div class="inner-artic

浏览 4提问于2016-11-03得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用Selenium和Python获取祖先<a>标记相对于子代<h3>标记的href属性

R: XPath表达式返回选定元素之外的链接

Xpath选择不选择url

如何将输出转换为列表来统计它的数量？

Roboframework - Selenium -查找所有包含特定文本的HREF

如何获取给定网页中的所有出站链接并遵循它们？

告诉-based() XPath查询在到达一个字母后停止？

Python/Selenium查找特定的类元素，分析它是否包含特定的span类，如果包含，则复制链接

属性在selenium中引发NoSuchElementException。

如何使用Nokogiri (以及XPATH和CSS)提取HTML链接和文本

Nokogiri html解析问题

拒绝某些URL

获取Nokogiri中的属性值以提取链接URL

如何获取href属性的值？

如何通过输入的关键字搜索使用selenium的网页？

xpath帮助获取链接包含一些href值的类下的按钮

开发一个使用Chrome在多个选项卡中打开所有链接的python抓取器

如何使用Nokogiri从HTML head获取规范链接

使用Python、Selenium和XPath查找href链接

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐