问获取所有节点的XPATH
EN

Stack Overflow用户

提问于 2011-04-13 09:02:11

回答 1查看 64.6K关注 0票数 28

有没有库可以为我提供HTML页面中所有节点的XPATH？

parsing

xpath

html

回答 1

Stack Overflow用户

发布于 2015-02-18 04:31:43

如果这对其他人有帮助，如果您使用的是python/lxml，那么首先需要有一个树，然后用Dimitre在上面列出的XPATH路径查询该树。

要获取树，请执行以下操作：

import lxml
from lxml import html, etree

your_webpage_string = "<html><head><title>test<body><h1>page title</h3>"
bad_html = lxml.html.fromstring(your_webpage_string)
good_html = etree.tostring(root, pretty_print=True).strip()
your_tree = etree.fromstring(good_html)
all_xpaths = your_tree.xpath('//*')

在最后一行，将'//*‘替换为您想要的任何xpath。all_xpaths现在是一个如下所示的列表：

[<Element html at 0x7ff740b24b90>,
 <Element head at 0x7ff740b24d88>,
 <Element title at 0x7ff740b24dd0>,
 <Element body at 0x7ff740b24e18>,
 <Element h1 at 0x7ff740b24e60>]

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/5643323

复制

相似问题

问获取所有节点的XPATH
EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取所有节点的XPATHEN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问获取所有节点的XPATH
EN