腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
链接
本身
中
包含
特定
关键字
的
href
的
xpath
、
、
我需要
的
是找到页面上
的
所有
链接
,其中有一些
关键字
内
的
链接
本身
。因此,基于一些堆栈主题,我按如下方式构建我
的
xpath
:它应该返回一个类似于=“……”
的
链
浏览 3
提问于2017-02-25
得票数 4
回答已采纳
1
回答
如何使用Selenium和Python获取祖先<a>标记相对于子代<h3>标记
的
href
属性
、
、
、
、
我正在尝试获取一个<a>元素,以防它
的
嵌套(内部) <h3>标记
包含
特定
文本。我该怎么做呢?假设结构如下: <section class="section"> <div class="section-content在匹配元素之后,我希望获得一个标记
的
href
的
值,
浏览 9
提问于2020-12-05
得票数 0
1
回答
R:
XPath
表达式返回选定元素之外
的
链接
、
我使用R在上使用
XPath
语法从主表
中
抓取
链接
。主表是页面上
的
第三个,我只想要
包含
杂志文章
的
链接
。(contains(@
href
, '/recherche/'))]/@
href
"))如果您查看输出,最后
的
链接
不是来自主表,而是来自侧栏,尽管我通过请求objecty只
包含
第三个表来选
浏览 0
提问于2013-05-18
得票数 6
回答已采纳
1
回答
Xpath
选择不选择url
、
我想得到所有的
href
链接
,其中
包含
医疗援助
本身
。通常,我使用
的
xpath
工作,但在本例
中
不起作用。我遗漏了什么?<div class="download"><span class="downloads">25746</span><a
href
="/download/?prijevod=cobbl
浏览 4
提问于2022-04-24
得票数 1
回答已采纳
2
回答
如何将输出转换为列表来统计它
的
数量?
、
我写了一个脚本来解析一个网页,并获取其上
的
链接
量(‘a’标签):import lxml.htmldom = lxml.html.fromstring(connection.read()) print link脚本
的</em
浏览 0
提问于2013-01-29
得票数 2
回答已采纳
1
回答
Roboframework - Selenium -查找所有
包含
特定
文本
的
HREF
、
、
、
我
的
目标是在
包含
特定
文本
的
网页中找到所有的
HREF
链接
。使用Chrome DevTools,我在“查找元素”中进行了测试: ${elements}= Get WebElements
xpath
://[
href
*='photo/?expre
浏览 0
提问于2021-03-13
得票数 0
回答已采纳
1
回答
如何获取给定网页
中
的
所有出站
链接
并遵循它们?
、
、
、
我有下面的代码来获取网页
中
的
所有
链接
:from scrapy import Selector item['TargetTitle'] = link.
xpath
('text()').extract() item['link'] = link.
x
浏览 0
提问于2014-11-29
得票数 0
1
回答
告诉-based()
XPath
查询在到达一个字母后停止?
、
、
、
、
我为给定
的
关键字
抓取各种作业页面,并在有匹配时提取标题和
链接
。(
XPATH
_MAPPING_HYPERLINKS['text'] % keyword)] hrefs = root.
xpath
(
XPATH
_MAPPING_HYPERLINKS['
href
']然而,对于像和
关键字
“Engineer”这样
的
页面,它会提取其中
的
单个工程作业,但也会提取到该公司
的</em
浏览 3
提问于2016-02-09
得票数 2
2
回答
Python/Selenium查找
特定
的
类元素,分析它是否
包含
特定
的
span类,如果
包含
,则复制
链接
、
、
、
尝试创建一个循环遍历收件箱
的
脚本,并找到所有
包含
“相对灵活”
的
div类,如果div类
包含
一个标有"dn dib-1“
的
span类,那么它将复制并保存以下
href
链接
到我
的
列表,并移到下一个div。</a>link_list = []message = browser.find_elements_by_
xpath
('
浏览 4
提问于2019-11-29
得票数 1
回答已采纳
2
回答
属性在selenium
中
引发NoSuchElementException。
、
、
、
我可以得到
包含
X
的
元素,但不能获得属性
本身
。为什么?data-
href
, "https://www.messenger.com/t/")]')links = browser.find_elements_by_
xpath
('//div[@aria-label="Conversations"]//a[cont
浏览 6
提问于2020-04-07
得票数 0
回答已采纳
1
回答
如何使用Nokogiri (以及
XPATH
和CSS)提取HTML
链接
和文本
、
、
、
(更新:这个答案是从Nokogiri
的
角度编写
的
,但是如果您要为
特定
的
查询寻找
XPATH
或CSS语法,它也很有用。) 我喜欢Nokogiri --它是从XML和HTML文档中提取元素
的
极好工具。如何使用Nokogiri从HTML中提取
链接
和
链接
文本?
浏览 1
提问于2016-09-23
得票数 7
回答已采纳
1
回答
Nokogiri html解析问题
、
我很难弄清楚为什么我不能通过nokogiri正确地解析
关键字
。在下面的示例
中
,我让a
href
链接
文本功能正常工作,但不知道如何提取
关键字
。这是我到目前为止所拥有的代码:doc = Nokogiri::HTML(open("http://www.cnn.com"))#doc.
xpath</e
浏览 1
提问于2010-08-10
得票数 5
回答已采纳
2
回答
拒绝某些URL
、
我目前正在为我
的
大学机构知识库项目使用Scrapy,在那里我需要获得每个大学
的
外部
链接
。有没有办法拒绝某些URL,比如'google.com‘和'twitter.com’。下面是我目前所拥有的。'http://eprints.utm.my/id/eprint/', self.parse) for
href
in response.
xp
浏览 21
提问于2019-03-11
得票数 2
回答已采纳
6
回答
获取Nokogiri
中
的
属性值以提取
链接
URL
、
、
我有一个文档,看起来像这样: <a
href
="http://google.com">link</a>我无法让Nokogiri获取
href
属性
的
值我想将地址作为字符串存储在Ruby变量
中
。
浏览 3
提问于2011-08-18
得票数 37
回答已采纳
5
回答
如何获取
href
属性
的
值?
、
在
XPath
的
帮助下,如何在以下情况下获取
href
属性
的
值(只抓取正确
的
url ):<a
href
="http://example.com">the right one</a> <a
href
="http:&
浏览 0
提问于2011-01-19
得票数 2
2
回答
如何通过输入
的
关键字
搜索使用selenium
的
网页?
、
、
我对python
中
的
selenium是个新手。我使用
Xpath
通过
关键字
搜索最高website: WebDriverWait(driver, 5).until(EC.element_to_be_clickable( (By.
XPATH
, "//a[contains(text(),'Supreme Time Tee')]"))).click() 我
的
问题是,我如何在
关键字
中
搜索任
浏览 6
提问于2020-04-22
得票数 1
回答已采纳
1
回答
xpath
帮助获取
链接
包含
一些
href
值
的
类下
的
按钮
、
、
我正在尝试为这个站点编写一些自动化测试//button//i[@class='fa fa-plus'] 这将使我获得basket__ite
浏览 2
提问于2016-02-09
得票数 0
2
回答
开发一个使用Chrome在多个选项卡
中
打开所有
链接
的
python抓取器
、
、
我正在尝试开发一个使用python
的
刮刀,它将在Chrome
的
多个选项卡
中
打开网页
中
的
链接
。我拼凑
的
代码是from datetime import timedelta, dateimport',‘(在日期中),所以我试着点击文本中有一个’,‘
的
链接
。我确实意识到要让它在多个站点上工作,我最终需要使用一些更通用<em
浏览 0
提问于2017-04-02
得票数 0
2
回答
如何使用Nokogiri从HTML head获取规范
链接
、
、
我正在尝试使用Nokogiri从网页
中
获取已定义
的
规范
链接
:我要找
的
是
href
。这就是我所拥有的: canon = page.
xpath
('//canonical
浏览 4
提问于2016-11-17
得票数 2
2
回答
使用Python、Selenium和
XPath
查找
href
链接
、
、
、
、
我希望使用
XPath
表达式从标记
中
获取
href
。<article> <div class="inner-artic
浏览 4
提问于2016-11-03
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel综合:单元格内容是否包含多个关键字中的任何一个?
数据分析师的编程之旅——Python爬虫篇(2)HTML解析器
Python爬虫入门4 爬取豆瓣TOP250图书信息
神级程序员用Scrapy爬取豆瓣图书这一项目带你成功入职企业!完美
EXCEL智能抓取实例
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券