前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Xpath学习笔记,持续记录

Xpath学习笔记,持续记录

作者头像
房东的狗丶
发布2023-02-17 14:52:49
8220
发布2023-02-17 14:52:49
举报
文章被收录于专栏:友人a的笔记丶友人a的笔记丶

很早之前就想研究研究,一直没有合适的时间,今天刚好没啥事,乘机瞧一瞧xpath的“庐山真面目”。

Xpath简介

XPath全称XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。起初XPath的提出的初衷是将其作为一个通用的、介于XPointer与XSL间的语法模型。但是XPath很快地被开发者采用来当作小型查询语言。

相关文档

函数手册:https://www.w3school.com.cn/xpath/xpath_functions.asp 参考文档:https://www.w3school.com.cn/xpath/index.asp

Xpath术语

1.节点

在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。

代码语言:javascript
复制
<?xml version="1.0" encoding="ISO-8859-1"?>
<!--文档节点(根节点)bookstore-->
<bookstore>
    <book>
        <!--普通元素节点title-->
        <!--属性节点lang=en-->
        <!--内容文本Harry Potter-->
        <title lang="en">Harry Potter</title>
        <author>J K. Rowling</author>
        <year>2005</year>
        <price>29.99</price>
    </book>
</bookstore>

2.节点关系

在 XPath 中,节点关系可分为:父节点、祖先节点、同胞节点、子节点、后代节点;

Xpath语法

1.基本语法

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。以下方代码为例:

代码语言:javascript
复制
<?xml version="1.0" encoding="ISO-8859-1"?>
<bookstore>
<book>
  <title lang="eng">Harry Potter</title>
  <price>29.99</price>
</book>
<book>
  <title lang="eng">Learning XML</title>
  <price>39.95</price>
</book>
</bookstore>
  • /  从当前选择的元素内选择子节点
  • // 从当前选择的元素内选择后代节点
  • . 选取当前节点。
  • .. 选取当前节点的父节点。
  • @ 选取属性。
代码语言:javascript
复制
# 选择body
./html/body
//body
/html/body
# 选择所有名为id的属性
//@id
# 选择自身名id的属性
/@id

2.谓语

代码语言:javascript
复制
# 选取属于 bookstore 子元素的第一个 book 元素。
/bookstore/book[1]	
# 选取属于 bookstore 子元素的最后一个 book 元素。
/bookstore/book[last()]	
# 选取属于 bookstore 子元素的倒数第二个 book 元素。
/bookstore/book[last()-1]
# 选取最前面的两个属于 bookstore 元素的子元素的 book 元素。	
/bookstore/book[position()<3]	
# 选取所有拥有名为 lang 的属性的 title 元素。
//title[@lang]	
# 选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。
//title[@lang='eng']	
# 选取 bookstore 元素的所有 book 元素,且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]	
# 选取 bookstore 元素中的 book 元素的所有 title 元素,且其中的 price 元素的值须大于 35.00。
/bookstore/book[price>35.00]/title	

3.通配符

代码语言:javascript
复制
*	# 匹配任何元素节点。
@*	# 匹配任何属性节点。
node()	# 匹配任何类型的节点。
/book | /css | /newBook 选取若干节点

4.XPath 轴

代码语言:javascript
复制
ancestor	#选取当前节点的所有先辈(父、祖父等)。
ancestor-or-self	#选取当前节点的所有先辈(父、祖父等)以及当前节点本身。
attribute	#选取当前节点的所有属性。
child	#选取当前节点的所有子元素。
descendant	#选取当前节点的所有后代元素(子、孙等)。
descendant-or-self	#选取当前节点的所有后代元素(子、孙等)以及当前节点本身。
following	#选取文档中当前节点的结束标签之后的所有节点。
namespace	#选取当前节点的所有命名空间节点。
parent	#选取当前节点的父节点。
preceding	#选取文档中当前节点的开始标签之前的所有节点。
preceding-sibling	#选取当前节点之前的所有同级节点。
self	#选取当前节点。

使用方法如下:

代码语言:javascript
复制
轴名称::节点测试[谓语]
# 选取元素的所有属性
//*[@id="fixed"]/aside/attribute::*
//*[@id="fixed"]/aside/@*

5.xpath运算符

参考文档:https://www.w3school.com.cn/xpath/xpath_operators.asp

6.xpath函数

count(/html//div),计算节点数量

name(/html//div[1]),节点名称

代码语言:javascript
复制
//选择不包含class属性的节点
var result = node.SelectNodes(".//span[not(@class)]");
//选择不包含class和id属性的节点
var result = node.SelectNodes(".//span[not(@class) and not(@id)]");
//选择不包含class="expire"的span
var result = node.SelectNodes(".//span[not(contains(@class,'expire'))]");
//选择包含class="expire"的span
var result = node.SelectNodes(".//span[contains(@class,'expire')]");

函数大全

https://developer.mozilla.org/en-US/docs/Web/XPath/Functions

JS使用xpath

1. 基本用法

相关文档:

https://developer.mozilla.org/zh-CN/docs/Web/XPath https://developer.mozilla.org/zh-CN/docs/Web/API/Document/evaluate

代码语言:javascript
复制
var xpathResult = document.evaluate(
  xpathExpression,
  contextNode,
  namespaceResolver,
  resultType,
  result
);
//实际例子
document.evaluate(".//h2", document.body, null, XPathResult.ANY_TYPE, null);

2.XPathResult对象

  • iterateNext(),返回一个可迭代的对象,通过iteratorNext()迭代所有元素,一旦迭代完成所有的匹配节点,iterateNext() 将返回 null。如果在迭代过程中,文档发生突变(文档树被修改),将使迭代无效,并且 XPathResult 的 invalidIteratorState 属性设置为 true,抛出 NS_ERROR_DOM_INVALID_STATE_ERR 异常。
  • snapshotItem(itemNumber) 方法用于单独访问每个节点,其中 itemNumber 是要检索的节点的索引。包含的节点总数可以通过 snapshotLength 属性访问。快照不随文档突变而改变,因此与迭代器不同,快照不会变得无效,但是它可能不对应于当前文档,例如节点可能已被移动,它可能包含不再存在的节点,或新节点可能已添加。
  • singleNodeValue 属性用于访问XPath 表达式的第一个找到的节点。如果节点集为空,这将为 null。对于无序子类型,返回的单个节点可能不是文档顺序中的第一个,但是对于有序子类型,保证以文档顺序获取第一个匹配的节点。

PHP中使用Xpath

代码语言:javascript
复制
<?php
     $xml = simplexml_load_file("test.xml");
     $result = $xml->xpath("from");
     print_r($result);
?>
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Xpath简介
  • Xpath术语
    • 1.节点
      • 2.节点关系
      • Xpath语法
        • 1.基本语法
          • 2.谓语
            • 3.通配符
              • 4.XPath 轴
                • 5.xpath运算符
                  • 6.xpath函数
                  • JS使用xpath
                    • 1. 基本用法
                      • 2.XPathResult对象
                      • PHP中使用Xpath
                      领券
                      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档