文章/答案/技术大牛

发布

社区首页 >问答首页 >用于选择具有子节点的父节点的xpath表达式

问用于选择具有子节点的父节点的xpath表达式
EN

Stack Overflow用户

提问于 2012-01-25 18:26:44

回答 1查看 537关注 0票数 0

目前，我使用YQL使用xpath提取Wikipedia的内容。

我目前使用的xpath表达式是\\p .This表达式，它选择所有段节点，去掉所有子节点，如<a>、<sup>、<strong>等。

正因为如此，我得到了维基百科足球页面的输出，如下所示。链接在这里

在此输出中，删除链接。

来自维基百科，免费的百科全书 .For其他用途，请参阅或者足球，足球，，和.Some的许多不同的比赛被称为足球。从左上角到右下角：所有涉及，在不同程度上，一个球与脚得分a。在世界范围内最受欢迎的运动是，通常被称为“足球”或“足球”。不合格的，该词适用于任何形式的足球是最受欢迎的地区背景下出现，包括，，，和其他相关的游戏。足球的这些变体被称为足球的“密码”。.....................and more

预期产出

来自维基百科，免费的百科全书有关其他用途，请参见足球(消歧)。一些不同的比赛被称为足球。从左上角到右下角：Association足球或足球、澳大利亚规则足球、International rules 、橄榄球联盟、橄榄球联盟E 219和E 120美式足球E 221。 足球在不同程度上都涉及到用脚踢来进球。在世界范围内最受欢迎的运动是联合足球，通常被称为“足球”或“足球”。不合格的足球一词适用于在该词出现的地区范围内最受欢迎的任何一种足球形式，包括美国足球、澳大利亚规则足球、加拿大足球、Gaelic足球、橄榄球联盟、橄榄球联盟1以及其他相关比赛。足球的这些变体被称为足球的“密码”。

(更大胆的词是有链接的)

那么如何提取段落及其子节点呢?？我对xpath不熟悉。

xml

dom

xpath

yql

html

回答 1

Stack Overflow用户

发布于 2012-01-25 18:35:37

正确的答案是//p/descendant-or-self::*，以便有父节点和子节点。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/9008121

复制

相似问题

问用于选择具有子节点的父节点的xpath表达式
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于选择具有子节点的父节点的xpath表达式EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用于选择具有子节点的父节点的xpath表达式
EN