Python神技能:六张表 搞定 Xpath 语法

一、选取节点

常用的路劲表达式:

<img src="https://pic4.zhimg.com/v2-0ea5d1dba9a1cf0c04695edbcfbc248b_b.jpg" data-caption="" data-size="normal" data-rawwidth="681" data-rawheight="464" class="origin_image zh-lightbox-thumb" width="681" data-original="https://pic4.zhimg.com/v2-0ea5d1dba9a1cf0c04695edbcfbc248b_r.jpg">

二、谓语

谓语被嵌在方括号内,用来查找某个特定的节点或包含某个制定的值的节点

实例:

<img src="https://pic3.zhimg.com/v2-0396b0b40df0f73214d2bc60a9d4af3e_b.jpg" data-caption="" data-size="normal" data-rawwidth="688" data-rawheight="368" class="origin_image zh-lightbox-thumb" width="688" data-original="https://pic3.zhimg.com/v2-0396b0b40df0f73214d2bc60a9d4af3e_r.jpg">

三、通配符

Xpath通过通配符来选取未知的XML元素

<img src="https://pic3.zhimg.com/v2-795be9470f73b5554e8effa98345a51e_b.jpg" data-caption="" data-size="normal" data-rawwidth="693" data-rawheight="148" class="origin_image zh-lightbox-thumb" width="693" data-original="https://pic3.zhimg.com/v2-795be9470f73b5554e8effa98345a51e_r.jpg">

四、取多个路径

使用“|”运算符可以选取多个路径

<img src="https://pic4.zhimg.com/v2-4efc24233e9bbd84183caaab66ed3283_b.png" data-caption="" data-size="normal" data-rawwidth="688" data-rawheight="103" class="origin_image zh-lightbox-thumb" width="688" data-original="https://pic4.zhimg.com/v2-4efc24233e9bbd84183caaab66ed3283_r.jpg">

五、Xpath轴

轴可以定义相对于当前节点的节点集

<img src="https://pic3.zhimg.com/v2-d95dbad4d9badead1f3902f67b19b7c6_b.jpg" data-caption="" data-size="normal" data-rawwidth="690" data-rawheight="563" class="origin_image zh-lightbox-thumb" width="690" data-original="https://pic3.zhimg.com/v2-d95dbad4d9badead1f3902f67b19b7c6_r.jpg">

<img src="https://pic4.zhimg.com/v2-3b382478e98acaca043d56ea04ebb177_b.png" data-caption="" data-size="normal" data-rawwidth="684" data-rawheight="102" class="origin_image zh-lightbox-thumb" width="684" data-original="https://pic4.zhimg.com/v2-3b382478e98acaca043d56ea04ebb177_r.jpg">

六、功能函数

使用功能函数能够更好的进行模糊搜索

<img src="https://pic1.zhimg.com/v2-26d54ba6e9175d6f26a0974dfccf6fdc_b.jpg" data-caption="" data-size="normal" data-rawwidth="696" data-rawheight="347" class="origin_image zh-lightbox-thumb" width="696" data-original="https://pic1.zhimg.com/v2-26d54ba6e9175d6f26a0974dfccf6fdc_r.jpg">

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java3y

什么是DOM编程?(修订版)

DOM(Document Object Model)文档对象模型,是语言和平台的中立接口。。

20720
来自专栏测试驿栈

Jmeter实例(三)_图片爬虫

需要用到的元件:循环控制器+计数器+xpath提前器+函数嵌套+beanshell代码

21920
来自专栏程序员的碎碎念

Django 博客生成 Markdown 摘要的几种方式对比

在搭建博客中, 自动生成摘要是一个很普遍的需求, 今天讲的生成摘要方式均为抽取式, 并且实质仍是抽取文章前 N 个字, 真正的抽取式通常会使用 TextRank...

15320
来自专栏古时的风筝

web scraper 抓取网页数据的几个常见问题

相关文章: 最简单的数据抓取教程,人人都用得上 web scraper 进阶教程,人人都用得上

28620
来自专栏逆向技术

Java开发知识之XML文档使用,解析

XML是一个可扩展的标记语言.(eXTENsible Markup language XML) 很类似于是HTML. HTML是有自己固定的标签,XML是自己定...

12420
来自专栏FREE SOLO

Java简单面试题(XML)

包括web开发人员的Java面试在内的各种面试中,XML面试题在各种编程工作的面试中很常见。XML是一种成熟的技术,经常作为从一个平台到其他平台传输数据的标准。...

16820
来自专栏程序员的知识天地

Python 爬虫网页内容提取工具xpath

上一节,我们详述了lxml.html的各种操作,接下来我们熟练掌握一下XPath,就可以熟练的提取网页内容了。

28910
来自专栏ATYUN订阅号

如何用Python抓取最便宜的机票信息(上)

这个项目的目标是为一个特定的目的地建立一个web scraper,它将运行和执行具有灵活日期的航班价格搜索(在您首先选择的日期前后最多3天)。它保存一个包含结果...

36820
来自专栏Python爬虫与数据挖掘

网页结构的简介和Xpath语法的入门教程

相信很多小伙伴已经听说过Xpath,之前小编也写过一篇关于Xpath的文章,感兴趣的小伙伴可以戳这篇文章如何利用Xpath抓取京东网商品信息以及Pyth...

10040

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励