为什么这个find_all方法(BeautifulSoup4)不能正确地返回所有URL？

find_all方法是BeautifulSoup4库中的一个函数，用于在HTML或XML文档中查找符合指定条件的所有元素。它的返回结果是一个列表，包含了所有符合条件的元素。

然而，find_all方法可能不能正确地返回所有URL的原因有以下几种可能性：

选择器条件不正确：find_all方法接受一个选择器作为参数，用于指定要查找的元素条件。如果选择器条件不正确，就无法正确地返回所有URL。例如，如果选择器条件是a，那么只会返回所有的链接元素，而不是链接的URL。
页面结构复杂：如果页面的结构非常复杂，包含了多层嵌套的元素，那么find_all方法可能无法正确地找到所有URL。这可能是因为选择器条件不够具体，或者页面结构不规范导致的。
动态加载内容：如果页面使用了JavaScript等技术进行动态加载内容，那么find_all方法可能无法正确地找到所有URL。这是因为find_all方法只能处理静态的HTML或XML文档，无法处理动态加载的内容。

为了解决这个问题，可以尝试以下几种方法：

使用更具体的选择器条件：根据页面的结构和需求，使用更具体的选择器条件来查找URL。例如，如果要查找所有<a>标签中的URL，可以使用选择器条件a[href]。
使用其他方法：BeautifulSoup4库还提供了其他一些方法，如find、find_parents、find_next_sibling等，可以根据具体情况选择合适的方法来查找URL。
使用其他库：如果BeautifulSoup4无法满足需求，可以尝试使用其他的解析库，如lxml、pyquery等，它们也提供了类似的查找功能。

总结起来，find_all方法不能正确地返回所有URL可能是由于选择器条件不正确、页面结构复杂或动态加载内容等原因导致的。解决这个问题可以尝试使用更具体的选择器条件、其他方法或其他解析库来查找URL。

页面内容是否对你有帮助？

有帮助

没帮助

为什么这个find_all方法(BeautifulSoup4)不能正确地返回所有URL？

、、

我在使用BeautifulSoup4时遇到问题。页面(https://www.gov.br/pt-br/servicos/infrabr)上的每个链接，这是我的代码： for a in soup.find(class_='col-servico').find_alltitle="" data-tippreview-enabled="false" data-tippreview-image="" data-tippreview-t

浏览 37提问于2021-09-19得票数 0

回答已采纳

3回答

如何使用BeautifulSoup和Python从<div>标签中的<a href>标签中获取信息？

、

SiteId=1&Product=8768400131的链接)；然而，我一直在尝试弄清楚是否有一种方法可以在"href“属性中获得链接，而不需要在”‘’上显式搜索‘class=’。我想我的第一个问题应该是这是否是查找这些信息的最好方法(class="on“似乎太通用了，将来可能会失效，尽管我的CSS和HTML技能并不是那么好)。我尝试了许多组合的find、findAll、findAllnext等方法，但我不能很好地使其工作。我对它进行了无数次的重新排列和更改)： productLinks

浏览 2提问于2011-12-18得票数 10

1回答

美丽的汤找不到CSS选择器

、、

我使用SelectorGadget ()来标识我在这个站点寻找的选择器： .op-bovada.\lv由它返回。然而，这是行不通的，也不能转义反斜杠。我尝试了多种变体，以及在网上搜索，但没有任何运气。

浏览 0提问于2018-12-01得票数 0

回答已采纳

4回答

BS "find_all“方法不匹配所有目标

、

当我在这个页面上使用find_all方法时，漂亮的汤并不能找到所有的目标。此代码：返回1，但有4。是汤的网址。

浏览 0提问于2019-04-03得票数 0

2回答

为什么美丽汤find_all没有返回完整的结果？

find_all('li')函数只返回4个结果(直到result_3)，我认为这很奇怪，因为当我在浏览器中查看网页时，我会看到12个结果。当我打印parsed_html时，我看到它包含到result_23的所有部分。为什么find_all不返回所有24个对象？下面是我的代码片段。from BeautifulSoup import bsoup from bs4 import BeautifulSoup a

浏览 5提问于2017-01-22得票数 1

回答已采纳

5回答

使用Python和BeautifulSoup基于属性解析a标记

、、、、

a.text pl = soup.findAll('a',{'class': 'playerLink'}, {'subtype':0}) 这两种方法都不起作用我的问题是，这个类在所有情况下都是'playerLink‘，所以这个子类型是我区分它的唯一方法。我对BS非常陌生，所以我不太擅长处理标签和属性。

浏览 0提问于2013-12-06得票数 2

回答已采纳

1回答

绝地- Python自动完成(提示)没有显示方法或建议

、、、

但是，在本例中，我将它用于BeautifulSoup4。的主要问题是，当在文件上执行多个点(.)方法时，没有正确地显示完成，而完成器必须首先看到它，就像.find_all方法一样，然后它会提示它(然而，这似乎是来自崇高文本3本身的自动完成)。在寻找其他“更深”的自动完成方法时，情况也是如此。到目前为止，我已经尝试过调整Jedi..settings文件中的所有设置。注意：这个并不是特定于崇高文本3的，对于Atom和类似的IDE也是如此。

浏览 1提问于2019-10-28得票数 4

1回答

如何使用自定义函数从-html元素中提取文本？

、、、

我试图从特定的url中提取第一个a元素的table文本子元素。from bs4 import BeautifulSoupimport requests all_other_hea

浏览 1提问于2021-03-07得票数 0

回答已采纳

1回答

在模板上使用模板别名

、、

给出了find_all函数的两个函数签名，该函数将vector of iterators返回给给定container中的所有给定值。T>template<typename C, typename V>这两种方法都可以这样使用： string m {"Mary had a little

浏览 3提问于2021-01-08得票数 8

回答已采纳

1回答

解析http返回断开的链接

、、、、

我正在尝试解析来自一些电报频道的图像，例如，图像在这个块"img class="tgme_page_photo_image“src="上。“但每次方法返回不同的无效链接时，为什么会发生这种情况?我使用的是Python3.6、urllib、beautifulsoup4import urllib.request response

浏览 0提问于2017-10-18得票数 1

2回答

方法中的访问父对象

、、、、

我有一个问题，我甚至不能正确地命名。情况就是这样。Entries -> has_many -> Uploads为了显示所有上传的条目，我在视图文件中使用了以下代码：{ foreach( $entry->upload->find_all(

浏览 2提问于2011-01-27得票数 2

回答已采纳

2回答

AttributeError：'ResultSet‘对象没有属性'find_all’- pd.read_html

、、、

我已经看过这个网站的例子，以及其他，但没有直接处理我的问题。/nhl/statistics/player/_/stat/points/sort/points/year/2015/seasontype/2' #rows = table.find_all('tr')

浏览 2提问于2016-12-09得票数 1

回答已采纳

3回答

Kohana 3 ORM as_array返回阵列ORM

、、、

通过查看源代码，我可以很容易地通过使用下面的修补程序进行黑客攻击来修复这个问题。，它将把给定的记录作为数组返回。如果与ORM::find_all一起使用，将返回所有记录的数组。('id'，‘username’)；不知道这是不是故意的，如果是，为什么？如果我想要创建一个关联数组的数组，那么有什么更好的方法来解决这个问题呢？

浏览 4提问于2010-10-31得票数 4

2回答

Kohana 3.3中的未知列错误

、

','LEFT') ->on('users.business_id','=','business.id') 错误是说-我可以修复这个<

浏览 2提问于2013-01-17得票数 0

2回答

在元组列表中查找所有元组

、、、

对于这个函数，我们应该编写一个包含两个输入的函数:一个表示键值对的元组列表和一个包含要搜索的键的列表。然后，函数应该在整个列表中搜索这些键的所有出现情况并返回它们。目前，我尝试了这种方法： AllFindings = [], fun(Key) -> listsfail，而且我也不确定这是否能够以我想要的方式工作，因为它需要变量AllFindings来更改它的值)，或者我需要一种

浏览 3提问于2020-05-01得票数 1

回答已采纳

1回答

只对一个HTML类使用get_text() - Python，BeautifulSoup

、

我试图应用于 BeautifulSoup，但总是收到相同的错误消息或该标记中的所有项。code.pyfrom bs4 import BeautifulSoupimport re 在结果中，我只需要

浏览 0提问于2018-10-20得票数 1

回答已采纳

1回答

Python语言中BS4 find_all()语句中的过滤函数问题

、、、、

我的印象是，find_all()将bs4标记元素传递给函数，在该函数中，您可以对BS4标记元素执行任何操作。这似乎不是真的。我得到一个字符串，显然我所有的BS4标记元素操作都会抛出一个异常。两个问题： find_all()传递给函数的到底是什么?如何使用参数？除了函数之外，如何才能实现所需的functionality?

浏览 103提问于2018-07-09得票数 -1

2回答

删除在python中使用相同类引用的图像源？

、、、

349" href="/fc-barnsley/transfers/verein/349/saison_id/2018">Barnsley FC</a></h2></div> 所以您可以看到，如果我只尝试find_all("a"，"class"："vereinprofil_tooltip"})，它不能正常工作，因为它也返回

浏览 6提问于2020-05-27得票数 0

回答已采纳

1回答

意外的AttributeError发生了，尽管它不应该发生

、

，这意味着应该调用find_all方法的table是None，因此它不能调用None不存在的方法。我不确定传递给parse_table的参数是None，这是从get_data(URL)返回的值。我怎么看得出来？如果不是None，则返回table，稍后将其用作parse_table的参数-此时table.find_all('tr')应按预期工作。如果出了问题，table是None怎么办？当涉及到下载的版本，我不能得到任何错误出现。当

浏览 14提问于2021-04-13得票数 0

回答已采纳

3回答

如何在python中迭代跳过TypeError，AttributeError和IndexError？

、、

现在我被堆叠了，因为我不能循环通过一个对象。代码如下：from bs4 import BeautifulSoup raw_data=requests.get(url) soup=BeautifulSouptable= so

浏览 0提问于2014-10-18得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么这个find_all方法(BeautifulSoup4)不能正确地返回所有URL？

相关·内容

为什么这个find_all方法(BeautifulSoup4)不能正确地返回所有URL？

如何使用BeautifulSoup和Python从<div>标签中的<a href>标签中获取信息？

美丽的汤找不到CSS选择器

BS "find_all“方法不匹配所有目标

为什么美丽汤find_all没有返回完整的结果？

使用Python和BeautifulSoup基于属性解析a标记

绝地- Python自动完成(提示)没有显示方法或建议

如何使用自定义函数从-html元素中提取文本？

在模板上使用模板别名

解析http返回断开的链接

方法中的访问父对象

AttributeError：'ResultSet‘对象没有属性'find_all’- pd.read_html

Kohana 3 ORM as_array返回阵列ORM

Kohana 3.3中的未知列错误

在元组列表中查找所有元组

只对一个HTML类使用get_text() - Python，BeautifulSoup

Python语言中BS4 find_all()语句中的过滤函数问题

删除在python中使用相同类引用的图像源？

意外的AttributeError发生了，尽管它不应该发生

如何在python中迭代跳过TypeError，AttributeError和IndexError？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐