首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >提取同级节点之间的< href> html文本

提取同级节点之间的< href> html文本
EN

Stack Overflow用户
提问于 2022-04-13 20:46:58
回答 1查看 21关注 0票数 0

我试图在下表中的括号节点之间提取包含简略学历信息(例如MA、BA)的文本。我可以使用xpath提取所有节点(包括括号),对它们进行迭代,并添加一些逻辑,但我很好奇是否有一种更有效的方法来提取括号之间的文本。

xpath("//tr/td@class='infobox-data'//following-sibling::node()")

代码语言:javascript
运行
复制
<table>
    <tbody>
        <tr>
            <th scope="row" class="infobox-label">
                <a href="/wiki/Alma_mater" title="Alma mater">Alma mater
                </a>
            </th>
            <td class="infobox-data">
                <a href="/wiki/University_of_Alberta" title="University of Alberta">University of Alberta
                </a>
                " ("
                <a href="/wiki/Bachelor_of_Arts" title="Bachelor of Arts">BA
                </a>
                ")"
                <br>
                <a href="/wiki/Hertford_College,_Oxford" title="Hertford College, Oxford">Hertford College, Oxford
                </a>
                " ("
                <a href="/wiki/Master_of_Arts_(Oxford,_Cambridge,_and_Dublin)" title="Master of Arts (Oxford, Cambridge, and Dublin)">MA
                </a>
                ","
                <a href="/wiki/Bachelor_of_Civil_Law" title="Bachelor of Civil Law">BCL
                </a>
                ")"
            </td>
        </tr>
    </tbody>
</table>
EN

回答 1

Stack Overflow用户

发布于 2022-04-13 20:57:35

代码语言:javascript
运行
复制
//text()[contains(.,')')]/preceding-sibling::a[1]/normalize-space(text())
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71863688

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档