首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

XPATH:选择子节点不包含某些文本的节点

XPATH是一种用于在XML文档中定位节点的查询语言。它可以通过路径表达式来选择节点,并且可以使用谓语来过滤节点。在选择子节点时,可以使用谓语来排除包含某些文本的节点。

XPATH的语法包括以下几个部分:

  1. 节点选择器:用于选择节点的类型,例如选择元素节点、属性节点、文本节点等。
  2. 路径表达式:用于指定节点的路径,可以使用绝对路径或相对路径。
  3. 谓语:用于过滤节点,可以使用条件表达式来判断节点是否满足条件。

对于选择子节点不包含某些文本的节点,可以使用以下的XPATH表达式:

代码语言:txt
复制
//节点名称[not(contains(., '某些文本'))]

其中,//表示从根节点开始搜索,节点名称表示要选择的节点名称,not(contains(., '某些文本'))表示节点的文本内容不包含某些文本。

这样的XPATH表达式可以用于在XML文档中选择不包含某些文本的特定节点。例如,如果我们有一个XML文档如下:

代码语言:txt
复制
<root>
  <node>节点1</node>
  <node>节点2</node>
  <node>节点3</node>
</root>

我们可以使用以下的XPATH表达式来选择不包含"节点2"文本的节点:

代码语言:txt
复制
//node[not(contains(., '节点2'))]

这将选择到<node>节点1</node><node>节点3</node>这两个节点。

对于腾讯云相关产品和产品介绍链接地址,由于要求不能提及具体的云计算品牌商,我无法提供具体的链接。但是,腾讯云作为一家知名的云计算服务提供商,提供了丰富的云计算产品和解决方案,可以通过访问腾讯云官方网站来了解更多相关信息。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Python爬虫Xpath库详解

因为 XPath 中 text 方法前面是 /,而此处 / 含义是选取直接节点,很明显 li 直接节点都是 a 节点文本都是在 a 节点内部,所以这里匹配到结果就是被修正 li 节点内部换行符...可想而知,这里是选取所有子孙节点文本,其中前两个就是 li 节点 a 节点内部文本,另外一个就是最后一个 li 节点内部文本,即换行符。...如果想获取某些特定子孙节点所有文本,可以先选取到特定子孙节点,然后再调用 text 方法方法获取其内部文本,这样可以保证获取结果是整洁。 10....按序选择 有时候,我们在选择时候某些属性可能同时匹配了多个节点,但是只想要其中某个节点,如第二个节点或者最后一个节点,这时该怎么办呢?...第五次选择时,我们调用了 descendant 轴,可以获取所有子孙节点。这里我们又加了限定条件获取 span 节点,所以返回结果只包含 span 节点包含 a 节点

12110

学爬虫利器Xpath,看这一篇就够了(建议收藏)

因为Xpath中text()前面是/,而此处/含义是选取直接节点,很明显li直接节点都是a节点文本都是在a节点内部,所以这里匹配到结果就是被修正li节点内部换行符,因为自动修正li节点尾标签换行了...分析可知,这里是选取所有子孙节点文本,其中前面两个就是li节点a节点内部文本,另一个就是最后一个li节点内部文本,即换行符。...如果想获取某些特定子孙节点所有文本,可以先选取到特定子孙节点,然后再调用text()方法获取其内部文本,这样可以保证获取到结果是整洁。 6.获取属性 这里我们用@符号就可以获取节点属性。...9.按序选择 有时候,我们在选择时候某些属性可能同时匹配了多个节点,但是只想要其中某个节点,如第二个节点或者最后一个节点,这时该怎么办呢?...它们具体作用可以参考:http://www.w3school.com.cn/xpath/xpath_functions.asp. 10.节点选择 Xpath提供了很多节点选择方法,包括获取元素、

1.2K40

学会XPath,轻松抓取网页数据

XPath节点是指在XML或HTML文档中被选择元素或属性。XPath中有7种类型节点,包括元素节点、属性节点文本节点、命名空间节点、处理指令节点、注释节点以及文档节点(或称为根节点)。...在XPath中,可以使用text()函数来选择文本节点,例如://p/text()表示选择所有元素中文本内容。- 命名空间节点:表示XML文档中命名空间。...category='fiction'>中category属性node()匹配任何类型节点//book/node() 选取元素下所有类型节点,包括元素节点文本节点、注释节点等以及使用谓词来进一步筛选选择节点集...string 是节点文本内容,substring 是要查找字符串//book[contains(title, 'XML')] 选取标题中包含字符串'XML'元素[starts-with...条件语句:XPath提供了条件语句(如if-else语句),使得我们可以根据某些条件来选择性地提取元素或属性3。

40410

Python3网络爬虫实战-28、解析库

选取当前节点节点 @ 选取属性 在这里列出了XPath常用匹配规则,例如 / 代表选取直接节点,// 代表选择所有子孙节点,. 代表选取当前节点,.....因为 XPath 中 text() 前面是 /,而此 / 含义是选取直接节点,而此处很明显 li 直接节点都是 a 节点文本都是在 a 节点内部,所以这里匹配到结果就是被修正 li 节点内部换行符...如果我们想获取某些特定子孙节点所有文本,可以先选取到特定子孙节点,然后再调用 text() 方法获取其内部文本,这样可以保证获取结果是整洁。 10....按序选择 有时候我们在选择时候可能某些属性同时匹配了多个节点,但是我们只想要其中某个节点,如第二个节点,或者最后一个节点,这时该怎么办呢?...节点选择 XPath 提供了很多节点选择方法,英文叫做 XPath Axes,包括获取元素、兄弟元素、父元素、祖先元素等等,在一定情况下使用它可以方便地完成节点选择,我们用一个实例来感受一下:

2.2K20

学爬虫利器XPath,看这一篇就够了

@选取属性 在这里列出了XPath常用匹配规则,例如 / 代表选取直接节点,// 代表选择所有子孙节点,....因为 XPath 中 text() 前面是 /,而此 / 含义是选取直接节点,而此处很明显 li 直接节点都是 a 节点文本都是在 a 节点内部,所以这里匹配到结果就是被修正 li 节点内部换行符...如果我们想获取某些特定子孙节点所有文本,可以先选取到特定子孙节点,然后再调用 text() 方法获取其内部文本,这样可以保证获取结果是整洁。 10....按序选择 有时候我们在选择时候可能某些属性同时匹配了多个节点,但是我们只想要其中某个节点,如第二个节点,或者最后一个节点,这时该怎么办呢?...节点选择 XPath 提供了很多节点选择方法,英文叫做 XPath Axes,包括获取元素、兄弟元素、父元素、祖先元素等等,在一定情况下使用它可以方便地完成节点选择,我们用一个实例来感受一下:

1.9K21

左手用R右手Python系列16——XPath与网页解析库

如果这里赋值,我们只是选择了所有含有term属性节点。 xpathSApply(content,"//entry/category[@term]",xmlGetAttr,"scheme") ?...3、匹配操作: 文本谓语中可以执行特殊匹配操作,功能类似于Excel中left、right以及mid函数。就是匹配文本中以什么开始、结束或者包含某些文本记录。...这里*号指代所有可能路径,因而第一句函数意思就是在所有可能路径中搜寻具有节点id节点内容。...如果这里赋值,我们只是选择了所有含有term属性节点scheme属性内容,一共有82条之多。...3、匹配操作: 文本谓语中可以执行特殊匹配操作,功能类似于Excel中left、right以及mid函数。就是匹配文本中以什么开始、结束或者包含某些文本记录。

2.3K50

python爬虫系列之 xpath:html解析神器

选择器,通过 id、css选择器和标签来查找元素,xpath主要通过 html节点嵌套关系来查找元素,和文件路径有点像,比如: #获取 id为 tab table标签下所有 tr标签 path...这样就能保证我们总是能获得一个包含文档节点_Element对象。...xpath语法 a / b :‘/’在 xpath里表示层级关系,左边 a是父节点,右边 b是节点,这里 b是 a直接节点 a // b:两个 / 表示选择所有 a节点 b节点(可以是直接节点...//a[contains(@href, "#1233")]' //a[contains(@y, "x")]:选择有 y属性且 y属性包含 x值 a标签 总结 使用 xpath之前必须先对 html...文档进行处理 html dom树中所有的对象都是节点,包括文本,所以 text()其实就是获取某个标签下文本节点 通过_Element对象 xpath方法来使用 xpath 注意!!!

2.1K30

Python之xpath

comment(注释)   - root(根节点xpath表达式格式   xpath通过”路径表达式”来选择节点,在表现形式上与传统文件系统类似   绝对路径(absolute path)必须用...  ”/”:表示选择节点   ”//”:表示选择任意位置某个节点   ”@”: 表示选择某个属性   nodename(节点名称):表示选择节点所有节点 xpath功能函数 使用功能函数能够更好进行模糊搜索...(@id,”ma”)]‘) 选取id值包含madiv节点 and xpath(‘//div[contains(@id,”ma”) and contains(@id,”in”)]‘) 选取id值包含ma...和indiv节点 text() xpath(‘//div[contains(text(),”ma”)]‘) 选取节点文本包含madiv节点 xpath定位方法 <?...#/bookstore/book[position()<3] :表示选择bookstore前两个book元素。 #//title[@lang] :表示选择所有具有lang属性title节点

43020

关于python中xpath解析定位

爬取网站:http://jbk.39.net/chancegz/ 这里只针对个别属性值: #例如:'别名'下span标签文本,‘发病部位'下span标签文本以及‘挂号科室‘下span标签文本...//li[@class="liClass"] | //div[@class="liClass"]')) xpath基本语法 表达式 说明 article 选取所有article元素所有节点 /article...following-sibling::div[1] 前N位: preceding-sibling::div[N] 后N位: following-sibling::div[N] # 爬取i标签中包含相关检查节点兄弟...a节点(找到i节点— 找到其父节点- 找到该父节点节点a) content = tree.xpath('//i[contains(text(),"相关检查:")]/.....")]/h3 选择包含某一属性节点 //div[not(@class)] 没有class属性div //tbody/tr[not(@class or @id)] 获取当前节点是什么类型html

2K40

Xpath、Jsoup、Xsoup(我Java爬虫之二)

Xpath说起 什么是Xpath XPath是W3C一个标准。它最主要目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计。...XPath是一种表达式语言,它返回值可能是节点节点集合,原子值,以及节点和原子值混合等。...语法 选取结点 表达式 描述 / 从根节点选取 // 从匹配选择的当前节点选择文档中节点,而不考虑它们位置。 . 选取当前结点 .....:not(selector): 查找与选择匹配元素,比如: div:not(.logo) 表示包含 class=logo 元素所有 div 列表 :contains(text): 查找包含给定文本元素...,搜索区分大不写,比如: p:contains(jsoup) :containsOwn(text): 查找直接包含给定文本元素 :matches(regex): 查找哪些元素文本匹配指定正则表达式

1.3K20

XML文档节点导航与选择指南

包含200多个内置函数: XPath包含200多个内置函数,可用于处理字符串、数值、布尔值、日期和时间等。...具有XPath知识可以充分发挥XSLT强大功能XPath节点XPath中,有七种节点:元素、属性、文本、命名空间、处理指令、注释和根节点。XML文档被视为节点树,树最顶层元素称为根元素。...XPath术语节点(Node): 在XPath中,有七种节点,包括元素、属性、文本、命名空间、处理指令、注释和根节点。XML文档被视为节点树,树最顶层元素称为根元素。...后代节点(Descendant Node): 节点节点节点节点等。XPath语法XPath使用路径表达式在XML文档中选择节点。.../child::*:选择当前节点所有元素子节点。/attribute::*:选择当前节点所有属性。/child::text():选择当前节点所有文本节点节点

6500

python学习之xpath使用案例总结

*:匹配任何元素节点 8,@*:匹配任何属性节点 9,node():匹配任何类型节点 10,| :选取若干个路径 xpath谓语用法: 谓语用来查找某个特定节点或者包含某个指定节点。...()<3]:选取根节点节点最前面的两个div元素 //div[@id]:选取所有div包含id属性元素 //div[@id=’kw’]:选取所有div包含id属性等于kw元素 xpath 轴 在...:选择文本中当前节点结束标签后所有节点 namespace:选取当前节点所有命名空间节点 parent:选取当前节点节点 preceding:选取文档中当前节点开始标签之前所有节点 preceding-sibling...child::*:选取当前节点所有元素 attribute::*:选取当前节点所有属性 child::text():选取当前节点所有文本节点 child::node():选取当前节点所有节点...2 mod 1,余0 ''' #通过text()定位到标签包含文本内容位置,利用contains(text(),"文本内容")函数包含关键词文本内容,还可以直接等于文本内容,如:/div[text(

1K10

web自动化测试入门篇06 —— 元素定位进阶技巧

类】组合方式来进行元素定位对于前面介绍后代选择器来说,选择器和其区别在于:选择器只会选择直接元素,而后代选择器则可以选择所有子孙元素。...driver.find_element(By.XPATH, "//input[@name='discount']")【包含】contains() 函数用于匹配元素属性值是否包含指定字符串。...轴 —— 选择当前节点所有节点preceding-sibling 轴 —— 选择当前节点之前所有兄弟节点following-sibling 轴 —— 选择当前节点之后所有兄弟节点self 轴...contains()这个函数用来检查元素中文本内容是否包含指定字符串。...driver.find_element(By.XPATH, "//div[contains(text(), 'fill')]")这里我们使用contains来检查div元素文本内容是否包含fill。

64740
领券