首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >HTMLAgilityPack剥离html

HTMLAgilityPack剥离html
EN

Stack Overflow用户
提问于 2011-01-19 02:17:03
回答 1查看 1.1K关注 0票数 2

我相信这个问题以前已经问过了,我以前也看过,但我找不到答案,或者我只是做错了什么。

代码语言:javascript
运行
复制
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
                doc.LoadHtml(indivdualfix[0]);             
                HtmlWeb hwObject = new HtmlWeb();
                HtmlAgilityPack.HtmlDocument htmldocObject = hwObject.Load(indivdualfix[0]);
                HtmlNode body = htmldocObject.DocumentNode.SelectSingleNode("//body");
                body.Attributes.Remove("style");
                foreach (var a in body.Attributes.ToArray())
                    a.Remove();
                string bodywork = body.InnerHtml.ToString();

字符串体仍然返回所有的html编码。我可能遗漏了一些非常小的东西。需要做什么,以消除所有的html编码基本上。

EN

回答 1

Stack Overflow用户

发布于 2011-01-19 02:19:36

使用body.InnerText而不是body.InnerHtml

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/4727547

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档