使用BeautifulSoup从亚马逊抓取整个类别的产品

、、

我已经为亚马逊编写了一个函数，给出了一个URL，它为我提供了产品的标题、价格和评级。如果我给它一个字符串格式的URL，效果会很好。我想使用这个功能，比如说它叫做AmazonCrawler，以便从网站上抓取一个完整的产品类别，而不仅仅是一个产品。我该怎么做呢？编辑：这里有一个我想要抓取的示例页面：Amazon TV Category。javascript'> window.ue_ihb = (window.ue_ihb || windo

浏览 26提问于2021-03-31得票数 0

回答已采纳

2回答

在使用bs4进行web抓取时，总是得到无结果

、、、

我刚开始学习网络抓取，我决定为列出的产品名称做亚马逊的网络抓取。因此，我启动了chrome dev工具，并单击了amazon产品名称上的inspect，然后记录了这个类，在本例中，这个类的名称是'a-link-normal‘。问题是我得到的结果是无。这是代码-import requests source = requests.get('

浏览 7提问于2020-08-29得票数 1

3回答

python请求&漂亮汤机器人检测

、、、、

我试图使用请求&漂亮的汤来抓取页面的所有HTML元素。我正在使用ASIN (亚马逊标准标识号)来获取页面的产品细节。我的代码如下：import requestsrespo

浏览 1提问于2018-08-29得票数 2

回答已采纳

2回答

尝试获取所有的href属性

、

我正在尝试从亚马逊类别网站()抓取所有的urls。但是我只能获取任何类别的第一个url，例如从"Amazon video“获取"All video”，"Fire TV“amazon fire tv，等等。这是我的代码：import requests url = "https://www.amazon.es/gp/site-directory/ref=na

浏览 14提问于2017-03-14得票数 1

1回答

用BeautifulSoup在Python中抓取不同网站的价格跟踪器

、、

我是Python的初学者，并且已经开始在Python中进行web抓取。目前，我正在尝试建立一个价格跟踪器的在线商店，如亚马逊。我能够用BeautifulSoup和requests从亚马逊抓取文本，如产品的价格和名称，收集这些数据后，我可以将价格与用户设置的门槛价格进行比较。我有一个我想使用我的价格跟踪器的其他在线商店/网站的列表，例如Footlocker。由于每个网站都有不同的html结构，有没有一种方法可以编写一个简单的Beauti

浏览 16提问于2021-01-09得票数 1

2回答

使用Python的BeautifulSoup上的属性错误(web抓取)

、、、

我遵循了一篇关于使用Python进行web抓取的教程，到目前为止，我已经掌握了以下内容：from bs4 import BeautifulSoup page = requests.get(URL,headers=headers) soup = BeautifulSouppage.text, 'html.pa

浏览 13提问于2019-11-11得票数 1

回答已采纳

2回答

BeautifulSoup不会从网页中抓取任何内容

、、

我正在做一个网络抓取项目。在这个项目中，我试图在亚马逊的一个特定页面上刮掉所有的产品链接。这个过程将重复所需的次数，并从亚马逊抓取多个页面。nb_sb_noss' soup = BeautifulSoup我正在使用用户代理来使抓取成为可能。我的问题是这段代码并不总是在运行。有时它

浏览 8提问于2020-05-29得票数 0

2回答

xpath如何打印多个元素

、、

我正在尝试使用HTMLSession和xpath在亚马逊的第一个产品页面上抓取产品标题。from requests_html import HTMLSession session =qid=1605730376&ref=sr_pg_1') >{'title': 'Echo Dot (3rd Gen) - Smart speak

浏览 12提问于2020-11-21得票数 0

回答已采纳

1回答

用BeautifulSoup* - HTML不同格式从CSS类链接中提取标题*

、

我刚开始使用BeautifulSoup进行网络抓取，并遇到了以下问题:我试图从论坛上抓取帖子，我想提取帖子的标签。下面是标记类的HTML代码：这种格式在整个表单中是一致的。

浏览 5提问于2021-06-08得票数 0

回答已采纳

1回答

BeautifulSoup不工作，而网络抓取亚马逊

、、

我刚开始使用网络抓取，我正尝试在亚马逊上使用基本技能。我想做一个代码，以寻找前10名的“今日最伟大的交易”与价格，评级和其他信息。每次我尝试使用find()和指定类找到特定的标记时，它都会说'None‘。然而，实际的HTML有这个标记。在手动扫描时，我发现一半的代码没有显示在输出终端中。下面是我正在尝试的代码：import requests source = requests.get(

浏览 2提问于2019-05-08得票数 0

1回答

为什么我在web抓取时得到的是一个空列表而不是一个包含元素的列表

、、、

://www.theguardian.com/world/2020/oct/25/covid-world-map-countries-most-coronavirus-cases-deaths中的表中抓取国家名称作为一个列表代码如下： import requests webpage = requests.get("https://www.theguardian.com/world/

浏览 8提问于2020-10-27得票数 0

9回答

BeautifulSoup和Scrapy crawler有什么区别？

、、、

我想做一个网站，显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么？我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

2回答

如何抓取没有页数的url

、、

我正在抓取一个网页，其中有一个没有页面，我如何才能抓取这些页面，以获得我想要的信息。假设我正在抓取一个URL ，这个页面有两个页面，我如何抓取这些总页面并得到总的产品列表。到目前为止我所做的是:我从他们那里抓取一个url，我通过正则表达式抓取一个特定的url，并试图从那个url中找到他们的链接，其他页面中没有包含链接产品名称的信息。我想要从所有页面中获取产品名称。我的代码： from bs4 import B

浏览 1提问于2016-02-28得票数 0

1回答

只有在逐行手动执行代码时才能正常工作

、、、

我对编码、Python和web抓取非常陌生。我正试着在亚马逊搜索结果页面上搜索产品价格。当我将这段代码作为一个块运行时，price返回0个元素。from bs4 import BeautifulSoupurl = 'httpscrystal+chandelier&qid=1596736254&ref=sr_pg_1'htm

浏览 11提问于2020-08-07得票数 0

1回答

抓取arcteryx网站时，查找所有产品的类或id是什么？

我正在尝试抓取arcteryx网站，以便获得csv格式的男士产品列表。我在浏览网站上的html时遇到了麻烦。更具体地说，我在加载所有产品时遇到问题，因为我似乎找不到使用哪个类或id来提取使用find_all的所有产品。任何建议都将不胜感激。import requestsfrom csv import writer response = requests.get("https:&#

浏览 2提问于2020-05-05得票数 0

2回答

使用BeautifulSoup抓取产品名称

、、

我正在使用BeautifulSoup (BS4)构建一个抓取器工具，它允许我从位于“h1”标签之间的任何TopShop.com产品页面中提取产品名称。我不明白为什么我写的代码不能工作！from urllib2 import urlopenimport re ProductPage

浏览 0提问于2013-02-15得票数 0

回答已采纳

1回答

通过Amazon检测卖方类型

、

我的意思是三种可能的类型-亚马逊，商人和FBA (由亚马逊实现)。谢谢!

浏览 0提问于2016-03-27得票数 0

回答已采纳

4回答

从不同深度的链接中解析产品名称的问题

、、、

下面的脚本可以从大多数链接中获得产品名称(通过漫游类别链接生成，然后通过子类别链接生成)。脚本可以解析在单击位于每个类别右侧的子类别链接，这些标记在下面的图像中可见，然后解析目标页面中的所有产品名称。目标页面。 import requestsfrom bs4 import BeautifulSoup<

浏览 2提问于2018-08-28得票数 11

回答已采纳

1回答

浏览零售商网站上的每一件商品

、、、、

我们试图在Forever 21的网站上抓取每个类别的每一种产品。给定一个产品页面，我们知道如何提取所需的信息，并且给定一个类别，我们可以提取每个产品。然而，我们不知道如何在每个产品类别中爬行。下面是我们针对给定类别和获取每种产品的代码：from bs4 import BeautifulSoup#import re params =http://www.forever21.

浏览 0提问于2016-11-04得票数 1

2回答

如何在收到来自xml解析的无响应后继续

、、

我正在寻找亚马逊产品的价格，使用带有瓶颈的API并使用BeautifulSoup解析xml。我有一个预定义的产品列表，代码遍历这些产品。这是我的密码：import lxmlamazon = BN.Amazon('soup.LowestUsedPrice.Amount.string newprice=soup.L

浏览 5提问于2016-02-08得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在使用bs4进行web抓取时，总是得到无结果

python请求&漂亮汤机器人检测

尝试获取所有的href属性

用BeautifulSoup在Python中抓取不同网站的价格跟踪器

使用Python的BeautifulSoup上的属性错误(web抓取)

BeautifulSoup不会从网页中抓取任何内容

xpath如何打印多个元素

用BeautifulSoup* - HTML不同格式从CSS类链接中提取标题*

BeautifulSoup不工作，而网络抓取亚马逊

为什么我在web抓取时得到的是一个空列表而不是一个包含元素的列表

BeautifulSoup和Scrapy crawler有什么区别？

如何抓取没有页数的url

只有在逐行手动执行代码时才能正常工作

抓取arcteryx网站时，查找所有产品的类或id是什么？

使用BeautifulSoup抓取产品名称

通过Amazon检测卖方类型

从不同深度的链接中解析产品名称的问题

浏览零售商网站上的每一件商品

如何在收到来自xml解析的无响应后继续

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐