首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >获取所有节点的XPATH

获取所有节点的XPATH
EN

Stack Overflow用户
提问于 2011-04-13 09:02:11
回答 1查看 64.6K关注 0票数 28

有没有库可以为我提供HTML页面中所有节点的XPATH?

EN

回答 1

Stack Overflow用户

发布于 2015-02-18 04:31:43

如果这对其他人有帮助,如果您使用的是python/lxml,那么首先需要有一个树,然后用Dimitre在上面列出的XPATH路径查询该树。

要获取树,请执行以下操作:

代码语言:javascript
复制
import lxml
from lxml import html, etree

your_webpage_string = "<html><head><title>test<body><h1>page title</h3>"
bad_html = lxml.html.fromstring(your_webpage_string)
good_html = etree.tostring(root, pretty_print=True).strip()
your_tree = etree.fromstring(good_html)
all_xpaths = your_tree.xpath('//*') 

在最后一行,将'//*‘替换为您想要的任何xpath。all_xpaths现在是一个如下所示的列表:

代码语言:javascript
复制
[<Element html at 0x7ff740b24b90>,
 <Element head at 0x7ff740b24d88>,
 <Element title at 0x7ff740b24dd0>,
 <Element body at 0x7ff740b24e18>,
 <Element h1 at 0x7ff740b24e60>]
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/5643323

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档