问什么是在C＃中解析HTML的最佳方式？
EN

Stack Overflow用户

提问于 2018-03-15 04:19:58

回答 2查看 0关注 0票数 0

正在找一个库/方法来解析一个html文件，它比通用的xml解析库有更多的html特性。

回答 2

Stack Overflow用户

发布于 2018-03-15 13:03:21

Html敏捷包

这是一个敏捷的HTML解析器，它构建了一个读/写DOM，并支持普通的XPATH或XSLT（实际上，不需要理解XPATH或XSLT就可以使用它，不用担心...）。它是一个.NET代码库，允许解析“离开网页”的HTML文件。解析器对格式错误的HTML非常宽容。但是对于HTML文档（或流）的对象模型与提出System.Xml非常相似。

票数 0

Stack Overflow用户

发布于 2018-03-15 13:29:13

可以使用TidyNet.Tidy将HTML转换为XHTML，然后使用XML解析器。

另一种选择是使用内置引擎mshtml：

using mshtml;
...
object[] oPageText = { html };
HTMLDocument doc = new HTMLDocumentClass();
IHTMLDocument2 doc2 = (IHTMLDocument2)doc;
doc2.write(oPageText);

这允许使用类似javascript的函数，如getElementById（）

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/-100003187

复制

相似问题

问什么是在C＃中解析HTML的最佳方式？
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是在C＃中解析HTML的最佳方式？EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问什么是在C＃中解析HTML的最佳方式？
EN