我想把html解析成一个dom树,然后找到所有不在<a>标记内的文本,所以我用谷歌搜索了一下,找到了"PHP Simple HTML DOM Parser“。它似乎可以帮助我将HTML DOM解析为DOM树。我希望找到不在<a>标记内的文本,但我只能找到在<a>标记内的元素。*ps:它还不支持CSS3 not选择器。谢谢。有这方面的经验吗?谢谢。
我想使用Python的xml.etree.ElementTree模块解析一个xml文档。但是,我希望生成的tree对象中的所有元素都有一些我定义的类方法。这建议创建我自己的Python的element类的子类,但是我在告诉解析器在解析时使用我自己的element子类而不是内置的类时遇到了麻烦。例如,假设我希望树中的节点有一个名为custommethod()的新方法。为此,我创建了一个元素子类:
class MyElement(xml.etree.ElementTree.现在,当我使用以下