使用bs4从网站上抓取图像时出现问题

，可能是以下几个方面导致的：

网站结构变化：网站的HTML结构可能会发生变化，导致之前编写的抓取代码无法正确定位到图像的位置。解决方法是检查网站的HTML结构变化，并相应地修改抓取代码。
图像链接问题：有些网站的图像链接可能是相对路径，而不是完整的URL地址。在使用bs4抓取图像时，需要将相对路径转换为完整的URL地址。可以通过拼接网站的基础URL和图像链接的相对路径来实现。
网络请求限制：有些网站可能会对频繁的网络请求进行限制，例如设置了反爬虫机制或者需要登录才能访问图像。解决方法是模拟浏览器行为，例如设置User-Agent头部信息、使用代理IP等方式来规避限制。
图像加载方式：有些网站的图像是通过JavaScript动态加载的，而不是直接嵌入在HTML中。在使用bs4抓取这类图像时，需要分析网站的JavaScript代码，找到图像加载的逻辑，并模拟执行相应的JavaScript代码来获取图像链接。

总结起来，解决使用bs4从网站上抓取图像时出现问题的关键是理解网站的结构和图像加载方式，并相应地调整抓取代码。在腾讯云的产品中，可以使用云爬虫（https://cloud.tencent.com/product/ccs）来进行网站数据的抓取和处理，以便更好地应对各种抓取问题。

使用bs4从网站上抓取图像时出现问题

、

嘿，我好像不能从这个网站上抓取图片 https://www.nike.com/gb/w/new-mens-shoes-3n82yznik1zy7ok 我正在使用下面的代码 product.find('

浏览 11提问于2021-01-02得票数 0

回答已采纳

2回答

Python刮刀无法刮动img src

、、、、

我无法从www.kissmanga.com网站上抓取图片。我使用的是Python3和RequestandBeautiful外地库。刮过的图像标签为空白"src“。SRC：import requests url = "http:'div',{"id": "divImage"}

浏览 3提问于2015-07-15得票数 1

回答已采纳

1回答

当我可以看到元素存在时，BeautifulSoup返回none

、、

我试着抓取这个reddit网站上图像的链接来练习，但是每当我使用BS4 ()来查找对象的类时，find似乎都返回none。有什么帮助吗？from bs4 import BeautifulSoup as soup page = requests.get("https://www.reddit.com/r/wallpaper/comments

浏览 2提问于2021-11-13得票数 0

2回答

无法在Python中的Beautiful Soup中抓取div标签，

、

我正在尝试下载官方网站上所有的精灵宝可梦图片。我这样做的原因是因为我想要高质量的图像。下面是我写的代码。from bs4 import BeautifulSoup as bs4request = requests.get('https://www.pokemon.com/us/pokedex/')print(soup

浏览 32提问于2020-10-24得票数 3

回答已采纳

2回答

从网站抓取链接时出现403错误python

、、、、

我试图从链接列表中抓取链接(所有链接都指向同一网站上的不同页面)，但我一直运行403错误。下面是我试图抓取的一个链接的示例 getarticles = [] import urllib.request get

浏览 12提问于2019-01-14得票数 0

2回答

如何从外部网站重建图像预览？

、、、、

类似于Facebook的用户界面，我正在尝试从外部链接的网站生成预览图像。因此，当用户输入他正在链接的url时，UI将默认地扫描该站点的img并抓取预览拇指。这项技术有一个特定的名称吗？

浏览 1提问于2011-01-02得票数 5

回答已采纳

1回答

如何阻止BeautifulSoup将HTML实体解码为符号

、、

我试图得到一个给定网站上的所有链接，但被一些关于HTML实体的问题卡住了。下面是我使用BeautifulSoup抓取网站的代码： from bs4 import BeautifulSoup . .print(pageLinks) 当代码看到这种元素时，它就会出现问题： <a href="./page?id=123&sect=2">Link</a> 它将&sect

浏览 22提问于2020-08-10得票数 2

回答已采纳

0回答

抓取包含：：之前的网页

、、、

我的问题是什么时候使用bs4抓取不能像::before这样抓取的内容。我想知道公司在一个页面中对哪些可持续发展目标做出了贡献。，但是复选标记在源代码中是不可见的。我应该做什么，或者我可以用什么来从网站上抓取它？

浏览 2提问于2017-11-30得票数 0

回答已采纳

1回答

Web抓取交互式地图坐标

、、

我在为如何从网站上抓取交互式地图或坐标而苦苦挣扎，这个想法是刮起大约100个地图位置，并绘制出一个地图图。

浏览 8提问于2022-01-17得票数 0

回答已采纳

1回答

使用BeautifulSoup从HTML文件中删除元素

、、

我对网络抓取的世界非常陌生，我正在尝试从一个网站上抓取鞋子的名字。当我在网站上使用inspect时，有一个div标签，基本上整个网页都在里面，但当我打印出html代码时，div标签完全是空的！下面是我当前的代码： from bs4 import BeautifulSoupimport time html_filehtml_file, 'lxml')

浏览 41提问于2021-09-23得票数 1

回答已采纳

1回答

如何抓取图像并保存到文件

、、

我不确定如何将抓取的图像保存到桌面上的文件中。我正在尝试从代码中列出的站点下载图像，但我只知道像导入BeautifulSoup和Request这样的基础知识。我不明白每件事意味着什么。from bs4 import BeautifulSoup soup = BeautifulSoup(response,

浏览 14提问于2019-09-05得票数 0

1回答

使用Python和BeautifulSoup抓取多个页面-网站url不起作用

、、、

我的python代码成功地从https://www.groupeactual.eu/offre-emploi中抓取文本并将其保存到csv文件中。然而，在上面的网站上有多个页面可用，我希望能够在其中刮。例如，使用上面的url，当我单击指向"page 2“的链接时，整个url会发生变化，但当我在代码中使用该url时，我会得到来自page 1的结果。如何更改我的代码以从所有列出的可用页面中抓取数据？

浏览 16提问于2020-07-17得票数 1

1回答

从Tableau公共仪表板中抓取数据

、、、

我对从网站上抓取数据的世界非常陌生，不知道如何从使用Tableau Public的网站上抓取数据网址：https://showmestrong.mo.gov/data/public-health/我试过在Python、requests和BeautifulSoup中使用，但不知道如何工作。import requestsimp

浏览 17提问于2020-09-30得票数 1

回答已采纳

1回答

如何从python抓取的URL列表中抓取数据？

、、、

我正在尝试使用Orange中的BeautifulSoup4从同一网站抓取的URL列表中抓取数据。当我手动设置URL时，我已经成功地从单个页面中抓取了数据。from urllib.request import urlopenimport requestsimport reURL列表 from urllib.request import urlopen

浏览 21提问于2021-07-23得票数 1

回答已采纳

1回答

BeatuifulSoup解析逻辑-在运行代码之前检查图像是否存在

、、

我正在使用scraperapi.com和Bs4从网站中抓取urls，当它找不到特定的元素时，它会使整个代码崩溃有问题的这一行是我用来提取图像src的这行 image = soup.find('img')['src'] 我知道在抓取它之前，我需要添加一个检查，看看它是否存在，例如 return image[src] but it doesn't se

浏览 4提问于2020-11-17得票数 0

1回答

如何使用Python对图表进行web抓取？

、、、、

我正在尝试使用Python3将这个网站上的图表从web上抓取到一个.csv文件中：Tuesday, October 25Wednesday, October 2610:30 PM Rockets/Lakers ESPNfrom bs4 import B

浏览 13提问于2020-05-22得票数 1

回答已采纳

1回答

如何使用外部应用程序从移动应用程序中刮取数据？

、、、、

我正在尝试从移动应用程序(Pokemon HOME)中抓取数据。该应用程序显示使用统计数据和其他有用的统计数据，我想刮。我想用python在我的电脑上刮这个。任何帮助都是非常有益的。即使是关于资源的建议，我也可以自己学习如何做到这一点。谢谢!

浏览 4提问于2020-07-09得票数 0

2回答

关于RSS提要的查询-我的服务器中的数据加载

、、、

我从不同的网站抓取RSS馈送，并在我的网站中显示像标题，标题链接，相关图像和简短描述的内容。我正在生成的RSS饲料的标题，标题链接，相关的图像和简短的描述在我的网站上为用户抓住他们相同的细节。现在，在我的RSS提要中，我从原始源抓取图像。不是从我的网站上。我正在使用Feedburner发布提要。现在我的问题是，当我从原始源获取图像时，我的服务器带宽是否会减少，还

浏览 1提问于2011-03-30得票数 1

1回答

我试图从网站上的一个表中获取一些信息--特别是，我想从“按姓氏代表目录”表中获得有关代表的信息。到目前为止，我能够从站点下载HTML并将其写入文件，但是当使用bs4解析和抓取我想要的特定表时，它只是抓取每个表的第一行。没有抓取其余的行。html.parser') table = soup.select('table[title="Representative Directory By Last Name&

浏览 4提问于2017-04-29得票数 0

回答已采纳

1回答

无法抓取“src”标签以获取“美丽汤”图像

、、

我目前正在做一个网络刮刀，从我学校的报纸网站上下载信息，重新上传到我们即将到来的新网站。目前，我正在测试如何使用bs4从网页下载图像。但是，正如我在下面的代码中解释的那样，我无法找到该图像的“src”标记，也就是url，以便下载该图像。import requests, bs4 url = 'https://www.behrendbeacon.com/parkingconcernsaddress

浏览 0提问于2018-12-17得票数 1

回答已采纳

点击加载更多