在使用HtmlAgilityPack显示节点内容时遇到问题 - 腾讯云开发者社区

文章/答案/技术大牛

发布

4回答

删除HtmlAgilityPack中无用的TextNodes

、、

我正在使用HtmlAgilityPack抓取一些网站。问题是，它似乎坚持在大多数地方插入TextNodes，这些地方要么是空的，要么是包含大量\n、空格和\r的地方。当我计算子节点时，它们往往会给我带来问题，因为firebug不会显示它们，但HtmlAgilityPack会显示它们。有没有办法告诉HtmlAgilityPack停止这样做，或者至少清除这些文本节点？(不过我想保留一些有用的东西)。在这里，注释和脚本标记

浏览 0提问于2012-07-05得票数 5

1回答

在使用HTMLAgilityPack按特定顺序插入节点时遇到问题

、、、

下面是我正在使用的HTML字符串：我试图通过添加以下内容来纠正这一情况： <head> //htmlNode.PrependChild(htmlBody);这段代码给了我这个--正如你看到的，<body>在错误的地方

浏览 4提问于2014-08-07得票数 0

回答已采纳

1回答

将HTML解析为父-子对象C#

、、、、

这是我所能做的代码，但是没有添加到对象中，除了Fizzler，在本例中还有其他解析器可以完成。

浏览 3提问于2014-04-11得票数 0

回答已采纳

1回答

相当于webBrowser1.Document.GetElementById("rd0").InnerHtml；的HtmlAgilityPack

、、、

当我使用webBrowser1.Document.GetElementById("rd0").InnerHtml时，我得到了<div style="color:rgb(138,66,0)">69.8F </div></td>，然后我把它拆分成只有69.8F 我在尝试使用HtmlAgilityPack时遇到问题。我似乎无法深入到元素来捕获69.8华氏度为了只捕获元素的值，与w

浏览 24提问于2021-08-02得票数 0

1回答

HtmlAgilityPack DocumentNode.ChildNodes返回空节点

、、

我在Java中使用了Jsoup，而HtmlAgilityPack ( HAP )是.NET的一个很好的对应物，在爬取了这个的一个示例产品后，我注意到HAP返回的是空的html节点。当我查看该站点时，它们不是原始html的一部分。该节点只包含像"\n\t\t\t\t"这样的格式化符号。Jsoup没有显示这种行为，所以我很好奇HAP在那里做什么。我如何检索我的节点的一个小代码示例： using Fizzler.Syst

浏览 58提问于2018-06-06得票数 -1

1回答

如何在Solr中突出显示包含html的字段中的查询项

我希望能够从其中返回高亮显示的片段，但是去掉了html。取下面被索引的文本：如果搜索“words”，可能会得到以下突出显示片段在应用高亮显示之前，我想删除html。我尝试过不同的突出显示组件，但还没有看到任何能起作用的属性。 --我需要在索引之前去掉HTML吗？，还是还有其他技术？目前，我正在使用HTM

浏览 2提问于2015-02-04得票数 3

回答已采纳

2回答

来自IXmlNode的SelectNodes返回空XmlNodeList

、、、、

(我使用的是Windows.Data.Xml.Dom的XmlDocument )遍历子节点不是一个选项，因为稍后我有一些像这样的XPaths字符串：/div/div/div/div[1]/div[2]

浏览 0提问于2016-07-07得票数 0

1回答

将html流从c# when浏览器加载到htmlagilitypack时编码错误

、

我有一个winform应用程序来显示一个html网页。当用户单击一个按钮时，我希望从html代码中获取一些节点。在我的webBrowser里，一切都很好。当我试图从一个特定的节点(编码是希腊语)解码类时，就会出现错误的编码。代码：document.Load(webBrowser1我还试图通过添加希腊语

浏览 2提问于2019-06-08得票数 1

1回答

如何在HTML中编码特殊字符但排除标记

、、

我试图将HTML页面转换为包含正确命名实体的HTML页面，将引号、双引号转换为实体。我尝试了下面的代码，它可以工作，但编码HTML标记，我想不谈。有什么办法吗？{ using (StringWriter sw = new StringWriter()) var x = new HtmlTextWriter(sw); result = sw.ToSt

浏览 4提问于2015-02-03得票数 2

回答已采纳

1回答

尝试使用HtmlAgilityPack

、

我在尝试安装HtmlAgilityPack.dll 1.4版时遇到问题。我已经将这些文件复制到我的windows\system32文件夹中，并在run中尝试了regsvr32 htmlagilitypack.dll。它似乎是一个通用库，很多人都在使用，所以dll不会被破坏。我该如何解决这个问题？

浏览 0提问于2010-12-21得票数 1

回答已采纳

2回答

HtmlAgilityPack -使标记与输入的标记完全相同

、、

是否有一种方法可以将HtmlAgilityPack设置为与输入的标记完全相同？我的问题是我允许用户在他们的网站上设置数据输出的html布局。它们使用的格式类似于ASP.NET的中继器控件。Alternate Item Markup</div> </tr></table> 当我将其加载到HtmlAgilityPack中<e

浏览 1提问于2013-08-14得票数 0

回答已采纳

2回答

C# Node.InnerHTML不正确，如何正确拉案

、、

我使用的是HTMLAgilityPack，我使用的是标准操作过程，用于加载文档并选择节点。但是，当我查看节点时，所有的aspx控件都是小写的。是否有一种方法可以在propercase中获得它，例如，当我查看<asp:RequiredFieldValidator时，它作为<asp:requiredfieldvalidator返回。HtmlAgilityPack.HtmlDocument doc = new HtmlA

浏览 2提问于2013-09-03得票数 2

回答已采纳

3回答

基于HtmlAgilityPack.HtmlNode的Gettig元素

、、、

我使用HtmlAgilityPack解析webbrowser控件的html文档。我能够找到我想要的HtmlNode，但是在获得HtmlNode之后，我想在WebbrowserControl.Document中重新设置相应的HtmlElement。实际上，HtmlAgilityPack解析一个活动文档的脱机副本，而我希望访问webbrowser控件的活动元素，以访问一些呈现的属性，如currentStyle或runtimeStyle HtmlAgilityPack.HtmlDocumentdoc = new

浏览 3提问于2014-04-03得票数 2

回答已采纳

1回答

c# htmlagility，页未找到

、

我试着用Htmlagility C#加载以下网站的页面源，它总是返回"Page“，但是当我在普通浏览器(chrome)中打开它时，它会显示所有内容。HtmlAgilityPack.HtmlWeb web = new HtmlWeb(); HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument

浏览 1提问于2018-11-24得票数 0

回答已采纳

1回答

检索时区/本地时间

、

这个功能是在某个地方构建的吗?或者有没有好的资源/类我已经开发好了？谢谢。

浏览 3提问于2012-05-11得票数 1

回答已采纳

1回答

确定html节点的样式

、、、、

html代码主要是带有文本节点、段落、跨度等的表格。文件不包含javascript或表现出任何其他动态行为。但是他们所拥有的是CSS样式。有没有办法用htmlagilitypack来确定在CSS部分声明的html节点的样式？据我所知，htmlagilitypack在创建DOM时不会解析CSS。对，是这样?如果htmlagilitypack不能解析CSS样式，最好的工具是什么？我应该用Selenium代替吗？

浏览 19提问于2019-01-07得票数 0

回答已采纳

1回答

C# HtmlAgilityPack* -刮擦*

、

我想使用HtmlAgilityPack从GSMArena.com中抓取内容，具体来说，我想刮掉手机的技术规格。 i想要擦拭重量、尺寸等问题：节点路径在几乎所有模型之间都是不同的。例如，如果我想刮掉产品的重量，有没有办法告诉HTMLAgilityPack搜索一个标记，然后转到它后面的TD，然后刮掉TD的内部文本？

浏览 0提问于2014-12-03得票数 0

回答已采纳

1回答

如何获取/抓取HTML文本和图像到Windows phone？

、、

请详细说明，我是新来的HTMLAgilityPack。谢谢。 

浏览 1提问于2013-08-16得票数 0

1回答

HtmlAgilityPack从页面中的所有div中提取文本，而不仅仅是从代码中指定的一个div中提取文本

、

我对HtmlAgilityPack的xpath表达式有一种奇怪的行为。我试图使用HtmlAgilityPack来提取声明为<div class='cont'>的div中的所有值，然而，当我使用下面的代码时，我只是获得了<div class='cont'>和<div class下面是重现它的完整代码：using System.Xml.XPath; using HtmlAgilityPack;

浏览 1提问于2012-06-19得票数 0

1回答

HTMLAgilityPack.HtmlNode不包含删除的定义

、

我正在尝试使用下面的方法删除空节点。但我得到的错误是说"HTMLAgilityPack.HtmlNode不包含删除的定义...“。除了“使用HTMLAgilityPack”之外，我应该引用什么来使用HtmlAgilityPack的Remove方法。{ }

浏览 0提问于2013-02-19得票数 0

回答已采纳

点击加载更多

删除HtmlAgilityPack中无用的TextNodes

在使用HTMLAgilityPack按特定顺序插入节点时遇到问题

将HTML解析为父-子对象C#

相当于webBrowser1.Document.GetElementById("rd0").InnerHtml；的HtmlAgilityPack

HtmlAgilityPack DocumentNode.ChildNodes返回空节点

如何在Solr中突出显示包含html的字段中的查询项

来自IXmlNode的SelectNodes返回空XmlNodeList

将html流从c# when浏览器加载到htmlagilitypack时编码错误

如何在HTML中编码特殊字符但排除标记

尝试使用HtmlAgilityPack

HtmlAgilityPack -使标记与输入的标记完全相同

C# Node.InnerHTML不正确，如何正确拉案

基于HtmlAgilityPack.HtmlNode的Gettig元素

c# htmlagility，页未找到

检索时区/本地时间

确定html节点的样式

C# HtmlAgilityPack* -刮擦*

如何获取/抓取HTML文本和图像到Windows phone？

HtmlAgilityPack从页面中的所有div中提取文本，而不仅仅是从代码中指定的一个div中提取文本

HTMLAgilityPack.HtmlNode不包含删除的定义

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐