我找到了这篇文章:,它是有效的,但通过使用DOM解析器,我得到了一个html声明和额外的主体元素。
这导致了一些字符编码问题。我可以通过修改代码在loadHTML期间强制utf-8来解决这个问题,然后在返回内容之前,我做了一些str_replace来去掉doctype、html、head和body元素。DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN" "http:&
我正在使用HTML,我有一个scnerio,其中我必须从没有按钮标记的html文档中获取一些html节点的集合。除此之外,我需要完整的html元素集合。例如,我的html文档可能如下所示
<p> <button class='testButton'> this is first button节点集合。目前,我