使用HtmlAgilityPack抓取img src值

文章/答案/技术大牛

发布

1回答

、

我正在尝试使用下面的HtmlAgilityPack来获取img src的值，但这返回了找不到对象的错误。我在这里做错了什么？htmlDoc.DocumentNode.SelectSingleNode("//div[@clsss='a-column a-span3 a-spacing-micro imageThumb thumb']/img").Attributes["src"].V

浏览 26提问于2021-04-27得票数 0

回答已采纳

1回答

在c#中重命名html文件的属性

、、

在字符串变量中有一个HTML，它包含一些<img>标记。我想将src属性替换为data-realsrc属性，并将loading.gif放在src属性中。例如，如果这是一个<img>标记：我想把它改为： <img data-realsrc="Hello.jpg" src="loading.gif"

浏览 1提问于2012-08-27得票数 0

回答已采纳

1回答

如何使用HtmlAgilityPack从网站获取单个图像？

、、、

我试图用HtmlAgilityPack搜索一个商店，我得到了产品名称，价格，库存，但我缺乏形象。我搜索了如何使用Agility Pack获取图片，但我找到的只是如何从网站获取所有图片，而不是一个。我尝试选择图像所在的单个节点，执行如下操作：var imgNode = doc.DocumentNode.SelectSingleNode("//div[@class = 'featured']");通过这样做，src值等于整个img id html元素

浏览 19提问于2021-06-11得票数 0

回答已采纳

2回答

使用正则表达式..Only赋值计算alt标记时出现错误，调用

、

在使用正则表达式对alt标记进行计数时出现错误-仅赋值、调用、递增、递减和新对象表达式可用作语句；应为 MatchCollection ImgAltTag= Regex.Matches(strIn, "<img[^>]*alt=['"].+['"]", RegexOptions.IgnoreCase | RegexOptions.Multiline);示例img标签 &l

浏览 3提问于2015-11-10得票数 0

1回答

用HtmlAgilityPack检测图像src中的数据URI

、、

如果它是一个引用的文件，那么我base64对它们进行编码并用它替换src。现在，我依赖Regex为我做检测，但是由于我使用的是HtmlAgilityPack，所以我想知道我是否可以用HtmlAgilityPack实现同样的目标？我想这样做，这样我就不必在目前已经使用HtmlAgilityPack的情况下维护Regex了。因此，现在我正在通过RegEx检测数据uri，如下所示：{ var myHtml = @"<html><he

浏览 10提问于2016-04-08得票数 2

回答已采纳

2回答

使用HTML Agility Pack进行HTML抓取

、、、

谁能告诉我使用下面提到的HTMLAgilityPack从html获取内容的最好方法。<input type="hidden" id="y" name="y" value='0&#x

浏览 0提问于2011-12-01得票数 0

回答已采纳

1回答

如何从长内容中解析特定文本？

、

在某些地方的某个地方有这样的文字： string firstTag

浏览 0提问于2014-07-02得票数 0

回答已采纳

1回答

c# HtmlAgility包-无法获取图像源

、

我正在尝试学习如何从URL获取所有的img src。但是，我代码中的imgs变量始终是null。我做错了什么？static void Main(string[] args) HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocumentimgs = doc.DocumentNode.SelectNodes("//img"); {

浏览 0提问于2011-07-14得票数 0

回答已采纳

2回答

即使我想使用HtmlAglityPack解析HTML字符串，我也会使用HtmlDocument吗？

、、

我尝试从HTML字符串(实际上是post数据)中提取img标记的第一个实例。htmlDoc = new HtmlAgilityPack.HtmlDocument(); HtmlAgilityPack.HtmlNodeimageNode = htmlDoc.DocumentNode.SelectSingleNode("//img"); else

浏览 2提问于2009-07-07得票数 4

回答已采纳

1回答

解析背景图片的css

、

我的任务是做一个网络抓取项目。我们正在将大量的静态内容放入CMS中。Regex r = new Regex(@"url\(.*\)"); {

浏览 0提问于2011-06-21得票数 2

1回答

正则表达式: html的多行问题

、、

我正在使用C#中的网站和正则表达式。我有这样的情况： <img src="thumbnail"></a> (?i)<a([^>]+)>\W.*</a> 标志:

浏览 1提问于2012-05-17得票数 0

回答已采纳

1回答

HtmlAgilityPack c#拍摄多张图片和链接

、、、

doc.LoadHtml("http://www.unnu.com/popular-music-videos"); MessageBox.Show("chegou"); foreach (HtmlNode linkNode in doc.DocumentNode.SelectNodes("@//img[@<em

浏览 0提问于2013-06-29得票数 0

回答已采纳

2回答

使用HtmlAgilityPack抓取url内容会产生错误

、、、

我使用HtmlAgilityPack从url抓取文本，它对大多数网站都很有效，有些网站今天就开始返回错误。不知道为什么我会收到这个错误，因为它使用这个网站url以前的示例url： where x.Name.ToLower() == "img"

浏览 0提问于2018-09-12得票数 1

回答已采纳

2回答

使用Regex实现图像标签的src

、

我需要找到第一个img标记的src，方法是对下面的字符串使用regex。怎么做？+2013-11-12+at+10.03.25+AM.png" imageanchor="1" style="margin-left: 1em; margin-right: 1em;"><imgborder="0" height="257" src="http://1.bp.blo

浏览 2提问于2014-02-12得票数 1

回答已采纳

3回答

通过LINQ获取属性值

、、

HTML源如下所示我使用以下LINQ查询来获取SRC值(图像链接) .Where(node => node.At

浏览 2提问于2014-02-07得票数 0

回答已采纳

1回答

在mvc4中，从不同目录返回html文件。

、、、

表示如何使用来自不同目录的图像返回html页面。

浏览 3提问于2014-12-24得票数 0

回答已采纳

1回答

使用html敏捷包从c#中的html中提取图像url，并将它们写入xml文件中。

、、

我使用以下代码从html中提取图像，但我不知道如何修改它。WebClient x = new WebClient(); document.Load(source); f

浏览 3提问于2012-11-18得票数 5

回答已采纳

1回答

如何使用xpath提取链接

、

www.explosm.net/comics/3104/)，它会自动用它找到的第一个链接保存一个字符串，给出xpath (//*[@id="maincontent"]/div[2]/div[2]/div[1]/img我已经尝试了HtmlAgilityPack和WebBrowser类，但是我找不到任何东西来帮助我理解要做什么以及如何做。任何帮助都将不胜感激。

浏览 0提问于2013-03-10得票数 2

回答已采纳

1回答