BeautifulSoup抓取多个链接

文章/答案/技术大牛

发布

1回答

、、

我想使用BeautifulSoup抓取这个website，首先提取每个链接，然后一个接一个地打开它们。一旦他们被打开，我想刮公司的名称，它的股票代码，股票交易和提取多个PDF链接时，他们是可用的。为了实现这一点，我首先尝试这样做： import requestsimport re url = base + link

浏览 18提问于2021-04-11得票数 0

回答已采纳

2回答

美丽的汤用Python 3抓取多个URL

、、、、

下面的代码运行良好，但我需要抓取多个网址，我不知道如何真正…基本上，我试图从一个搜索链接获得一个重定向链接data = response.text # Passing the source code to BeautifulSoupto create a

浏览 0提问于2018-05-09得票数 2

2回答

使用Beautiful Soup在Web上浏览链接

、、

我正在尝试抓取一个博客"“，并抓取其中的所有链接，以在每个抓取的链接中查找与人工智能相关的信息。我已经尝试了以下代码的各种变体，但似乎都没有多大帮助。import requests from bs4 import Beau

浏览 21提问于2019-08-11得票数 1

回答已采纳

1回答

使用Python和BeautifulSoup抓取多个页面-网站url不起作用

、、、

我的python代码成功地从https://www.groupeactual.eu/offre-emploi中抓取文本并将其保存到csv文件中。然而，在上面的网站上有多个页面可用，我希望能够在其中刮。例如，使用上面的url，当我单击指向"page 2“的链接时，整个url会发生变化，但当我在代码中使用该url时，我会得到来自page 1的结果。如何更改我的代码以从所有列出的可用页面中抓取数据？我的代码： from bs4 import BeautifulSoup

浏览 16提问于2020-07-17得票数 1

2回答

无法从DuckDuckGo搜索结果中抓取链接

、、、

我想从DuckDuckGo搜索结果中抓取第一个链接。我不知道为什么BeautifulSoup不抓取包含div的结果。请看屏幕截图，突出显示的HTML语法是我想要抓取的：我找到了一个答案，DuckDuckGo使用javascript搜索结果，beautifulSoup不能抓取javascript，但在StackOverflow上的其他帖子中，我发现人们可以从搜索结果中抓取链接。但如果我使用谷歌而不是DuckDuckGo，我就能够

浏览 6提问于2021-04-02得票数 0

1回答

使用BeautifulSoup和请求抓取多个分页链接

、、、、

我正在试着从上抓取所有的产品。我已经成功地抓取了给定页面上的所有产品，但我在迭代所有分页链接时遇到了麻烦。理想情况下，我希望让爬虫继续点击next，直到抓取了所有页面上的所有产品。我该怎么做呢？非常感谢您的任何意见page_array= [] html = re

浏览 1提问于2015-02-19得票数 3

1回答

如何更好地循环到我的Web scraper中？

、、、

我试图通过抓取页面上每个项目的链接来抓取网站搜索页面，之后抓取的链接被再次解析，某些信息也被从这个链接中抓取。rn的问题是，如果初始链接已经被抓取，我想遍历每个链接并从中抓取数据，但目前它只抓取链接列表中的第一个值。我想问题出在我的for循环上。这是我当前的代码。{"Accept-Language": "en-US, en;q=0.

浏览 17提问于2020-05-28得票数 0

3回答

Web抓取:用Python抓取多个Web

、、

from bs4 import BeautifulSoupforpage=' + str(pg) for paragraph in soup.find_all('p'):print(paragraph.text) 我想从

浏览 1提问于2019-01-13得票数 3

回答已采纳

1回答

如何从python漂亮汤的网站上抓取url？

、、、

我试着从一个特定的链接中抓取一些url，我使用了美容汤来抓取这些链接，但我无法抓取这些链接。这里我附上了我用过的代码。实际上，我想从"fxs_aheadline_tiny“类中抓取urlsfrom bs4 import BeautifulSoup url = 'https://www.fxstreet.com=FxsIndexPro&p=0&dFR%5BTags

浏览 25提问于2020-02-18得票数 1

2回答

Webscraping HTML-包括所有链接内的标记

、、、

我正在使用Python3.5的BeautifulSoup，并且我试图抓取所有h-tags的网站(所以所有的h1、h2..等等)。我的问题是让程序在网站上打开其他链接来抓取它们的标签。因此，假设我有一个网站，它有一个导航菜单，其中包含一些链接，这些链接贯穿整个网站，并且都包含某种类型的h标记。我该如何抓取我所选网站上的所有内容呢？这是我到目前为止用来抓取特定url中的h1-tag的代码：from bs4 import <

浏览 0提问于2016-04-19得票数 2

1回答

Python BeautifulSoup* -如何在<td>中的值中爬行链接<a>*

、、

我正在学习网络抓取，并试图从下面的链接网络抓取数据。有没有办法让我从每个td的链接以及爬行？这是我迄今为止所做的。from urllib.request import urlopenurl = "http://eecs.qmul.ac.uk/postgraduate/programmes/"soup =

浏览 3提问于2021-12-05得票数 1

回答已采纳

2回答

Python Beautiful Soup检索多个信息网页

、、、

所以我正在尝试学习抓取，想知道如何获得多个网页的信息。我在上用过它。我想检索所有的球队，然后进入每个球队的链接，这显示了花名册，然后检索每个球员的信息和在他们的个人链接他们的统计数据。到目前为止，我所拥有的是：from bs4 import BeautifulSoup

浏览 0提问于2015-04-20得票数 2

4回答

使用Python抓取代码中的第一个链接

、

你好，这是我想要从使用BeautifulSoup抓取第一个链接的代码。视图-来源：我正在尝试使用Python来实现这一点。我使用这个代码，但是它抓取了所有的链接，我只想抓取第一个链接 with open('binanceblog1.html', 'w') as ar

浏览 33提问于2019-03-28得票数 0

1回答

Web通过python抓取问题，不能读取html文件吗？

、、

web抓取Python已经有一段时间了，最近我遇到了这个问题。BeautifulSoup似乎无法读取html文件。例如，我正试着从这个网站上抓取from bs4 import BeautifulSoupurl_episode = 'https://www.thetvdb.cominitial-d/episodes/4889010'getdetail_episode = req

浏览 1提问于2020-04-06得票数 0

2回答

如何抓取没有页数的url

、、

我正在抓取一个网页，其中有一个没有页面，我如何才能抓取这些页面，以获得我想要的信息。假设我正在抓取一个URL ，这个页面有两个页面，我如何抓取这些总页面并得到总的产品列表。到目前为止我所做的是:我从他们那里抓取一个url，我通过正则表达式抓取一个特定的url，并试图从那个url中找到他们的链接，其他页面中没有包含链接产品名称的信息。我想要从所有页面中获取产品名称。我的代码：

浏览 1提问于2016-02-28得票数 0

1回答

在Python中抓取多个页面

、、、

我正在尝试抓取一个包含12个链接的页面。我需要打开这些链接中的每一个，并刮掉它们的所有标题。当我打开每个页面时，我面对的是每个链接中的多个页面。但是，我的代码只能抓取这12个链接中的第一个页面通过下面的代码，我可以打印主页上存在的所有12个链接URL。url = 'http://mlg.ucd.ie/modules/COMP41680/assignment2/index.html&

浏览 22提问于2021-04-06得票数 1

回答已采纳

1回答

Python :如果满足特定条件，如何使用不同的抓取页面重复“bs4”循环？

、、

我正在尝试创建一个for循环，一旦它到达抓取的页面中的最后一个search_result属性，它将重复该循环，但会使用新抓取的网页的数据。在for循环到达最后一个属性后，它将在网页上查找链接，并对新抓取的网页重复该循环。from bs4 import BeautifulSoup s

浏览 7提问于2019-08-16得票数 1

回答已采纳

2回答

为什么我不能访问tbody中的信息？

、

这是websiteI的源代码，我正在用BeautifulSoup做网页抓取，但在tbody中找不到tr；在网站的源代码中，tbody中实际上有tr；但是find_all函数只能返回头部的tr。我正在抓取的链接：```from bs4 import BeautifulSoup```type(soup) ```print(tr

浏览 0提问于2019-06-18得票数 1

2回答

Python，Web抓取条形图

、、

我目前正在尝试从这个页面上抓取条形图/图表，但我不确定需要哪些特定的BeautifulSoup功能来提取这些类型的条形图。此外，如果任何人有链接到哪些BeautifulSoup功能用于抓取哪些类型的图表/图形，将不胜感激。以下是我到目前为止所拥有的代码import requests dp = 'https://www.statista.

浏览 24提问于2020-05-26得票数 0

回答已采纳

2回答

BeautifulSoup不抓取动态内容

、、、

我的问题是，我想从这个页面获取相关链接：import urllib2url = "http://support.apple.com

浏览 2提问于2013-04-07得票数 1

点击加载更多