问HTMLAgilityPack剥离html
EN

Stack Overflow用户

提问于 2011-01-19 02:17:03

回答 1查看 1.1K关注 0票数 2

我相信这个问题以前已经问过了，我以前也看过，但我找不到答案，或者我只是做错了什么。

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
                doc.LoadHtml(indivdualfix[0]);             
                HtmlWeb hwObject = new HtmlWeb();
                HtmlAgilityPack.HtmlDocument htmldocObject = hwObject.Load(indivdualfix[0]);
                HtmlNode body = htmldocObject.DocumentNode.SelectSingleNode("//body");
                body.Attributes.Remove("style");
                foreach (var a in body.Attributes.ToArray())
                    a.Remove();
                string bodywork = body.InnerHtml.ToString();

字符串体仍然返回所有的html编码。我可能遗漏了一些非常小的东西。需要做什么，以消除所有的html编码基本上。

回答 1

Stack Overflow用户

发布于 2011-01-19 02:19:36

使用body.InnerText而不是body.InnerHtml

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/4727547

复制

相似问题

问HTMLAgilityPack剥离html
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问HTMLAgilityPack剥离htmlEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问HTMLAgilityPack剥离html
EN