BeautifulSoup返回一个奇怪的值

BeautifulSoup是一个用于解析HTML和XML文档的Python库。当使用BeautifulSoup解析HTML或XML文档时，有时会遇到返回奇怪值的情况。这可能是由于以下原因导致的：

解析文档出现错误：如果文档中存在不规范的标签、嵌套错误等问题，BeautifulSoup可能无法正确解析文档，从而返回奇怪的值。在这种情况下，建议检查文档的结构和内容，并确保文档的正确性。
使用错误的解析器：BeautifulSoup支持多种解析器，例如HTML解析器、XML解析器等。如果使用了错误的解析器，可能导致解析结果不符合预期。建议根据文档类型选择适当的解析器，例如对于HTML文档可以选择使用"html.parser"解析器。
选择了错误的元素或属性：有时候我们可能期望返回的是某个特定元素或属性的值，但由于选择器错误，返回了与预期不符的值。建议仔细检查选择器的语法和使用方法，确保正确选择所需的元素或属性。

在处理BeautifulSoup返回奇怪值的情况时，可以采取以下措施：

检查文档结构和内容，确保文档的正确性。
选择适当的解析器，根据文档类型选择合适的解析器。
仔细检查选择器的语法和使用方法，确保正确选择所需的元素或属性。
如果问题仍然存在，可以尝试使用其他解析库或方法进行解析，以排除可能的解析问题。

腾讯云相关产品：腾讯云提供了一系列云计算相关的产品和服务，其中包括：

云服务器（CVM）：提供弹性、稳定的云服务器实例，可满足不同规模和需求的业务。
云数据库MySQL版：提供高性能、可扩展的云数据库服务，支持MySQL。
云原生应用平台（TKE）：帮助用户快速构建、管理和扩展容器化应用。
云存储（COS）：提供高可靠、低成本的对象存储服务，适用于海量数据存储和访问。
腾讯云人工智能平台：提供多种人工智能服务和工具，如图像识别、语音合成等。
物联网平台：提供完整的物联网解决方案，支持设备管理、数据采集和应用开发。
移动开发平台：提供移动应用开发和管理的云服务，包括推送、分析等功能。

以上是腾讯云的一些产品，适用于不同的云计算应用场景。具体产品详情和介绍可以参考腾讯云官方网站：腾讯云。

BeautifulSoup返回一个奇怪的值

、

下面是我的代码： from bs4 import BeautifulSoupimport openpyxl pris =

浏览 14提问于2019-03-02得票数 0

1回答

BS4‘元素’到底是什么，元素是如何计算的，由哪个解析器来决定？显然很迷惑

、、、

我现在被一些我认为我理解的东西弄糊涂了，但事实证明我一直认为这是理所当然的。人们经常会遇到这种类型的for循环： from bs4 import BeautifulSoup as bssoup = bs(mystring,'html.parser') [do something with elem] 我没有注意到的是，elem实际上是什么，直到我遇到

浏览 15提问于2019-05-08得票数 1

回答已采纳

2回答

Python机械化中的BeautifulSoup错误

、、、

我在我的Mac上安装了BeautifulSoup，使用的是easy_install，没有任何错误，我也可以完美地运行test.py文件。但是，当我试图在另一个文件中使用BeautifulSoup时，我会得到以下错误： File "/Users/Conor/DesktopBeautifulSoup 我在第54行中只有from BeautifulSoup imp

浏览 1提问于2011-10-15得票数 1

回答已采纳

1回答

美丽的汤findAll不包括所有的div

、、、

from bs4 import BeautifulSoup soup = BeautifulSoup(open(html))其中，文件index.html是此的源代码。我的代码显示只找到了一个div标记。但更奇怪的是，findAll('a')返回了一个巨大的</e

浏览 2提问于2014-12-07得票数 0

1回答

BeautifulSoup返回空值

、、

我不知道它为什么会返回空值。以下是我的代码：links = [] soup = BeautifulSoup(url.text, 'lxml') articles = soup.find_all('a', cla

浏览 3提问于2022-01-24得票数 -1

回答已采纳

1回答

“美丽汤”返回的值与html中的值不同。

、

BeautifulSoup返回的值与显示在HTML代码上的值不同：<div class="fieldMileage">132 000km</div>from bs4 import BeautifulSoup URL_a

浏览 1提问于2018-05-15得票数 0

回答已采纳

2回答

Python模块“twill”--变量赋值期间的HTML泛洪

、、

我正在使用Python中的Twill模块创建一个简单的命令行程序，用于从网站收集和解析信息(非常通用)。我想使用Twill的show()命令将HTML输出赋给一个变量，以便通过我的解析命令运行页面，但是每次我把它赋给一个变量...我在命令行上收到了大量的HTML (就这一点而言，是空闲的)。我只想分配给你进一步的操作。为什么变量赋值会导致打印发生

浏览 6提问于2011-04-29得票数 2

1回答

在mac上使用python3安装和导入beautifulsoup4

、、、

我为在我的macbook上安装beautifulsoup4而疯狂，我的macbook上安装了Python3.x。我设法通过在控制台输入"python3 setup.py install“来安装漂亮的汤。beautifulsoup4==4.4.0但是当我在Python语言中运行“导入bs4”时，它总是告诉我4..4.0版本的beautifulsoup</e

浏览 4提问于2015-07-10得票数 1

4回答

将web数据传递到“美丽汤”-空列表中

、、、、

我已经重新检查了我的代码，并查看了打开URL将web数据传递给Beautiful的类似操作，由于某种原因，我的代码没有返回任何内容，尽管它的形式是正确的：<urllib3.response.HTTPResponse object at 0x00000000032EC390> >>>

浏览 3提问于2014-07-31得票数 7

回答已采纳

1回答

简单示例BeautifulSoup* Python*

、

我在用BeautifulSoup做一个简单的例子，但我得到了奇怪的结果。下面是我的代码：print soup.prettify()print stuff[] 不确定发生了什么，因为当我在屏幕上打印soup

浏览 0提问于2013-05-22得票数 1

回答已采纳

1回答

基于BeautifulSoup的HTML性能及可读性改进

、、、、

这个函数将一个JSON文件(可能包含任何JSON格式的内容，因为我刮了数百个随机页面)作为参数，并返回一个字典列表，其中根据使用BeautifulSoup和regex模式提取标题，将URL映射到相应的标题我正在寻找关于性能可读性和清晰度的建议。在我的第一次迭代之后，我改进了代码，结果如下：from tqdm import tqdmfrom bs4 import BeautifulSoup

浏览 0提问于2017-06-29得票数 3

回答已采纳

2回答

为什么我不能使用标准代码从网页中提取链接？

、、、、

我正在从事一个项目，目前需要从拍卖行网页提取所有链接。然而，下面提供的标准代码只适用于其中一个()。对于苏富比拍卖行，代码不返回任何内容()，对于佳士得拍卖行，它返回您无法使用的奇怪链接，因为它们会导致错误()。from bs4 import BeautifulSoup, SoupStrainer url = "https://www.sothebys.com/en/r

浏览 0提问于2020-06-08得票数 0

1回答

我正在练习在工作页面上使用BeautifulSoup进行刮擦，但是由于一些奇怪的原因，我的打印本正在返回“无”，有什么想法吗？提前感谢！from bs4 import BeautifulSoupimport csv url = 'https://jobgether.com/es/oferta/63083ece6d137a0ac6e701e6-part-time-business-psychol

浏览 7提问于2022-09-05得票数 0

回答已采纳

3回答

Python使用BeautifulSoup和findAll的不同结果

、

我正在尝试使用“BeautifulSoup”属性来解析一些嵌入到HTML中的文本。在玩"find“和"findAll”时，我注意到一些奇怪的事情，我不明白为什么它会这样……import BeautifulSoup doc = "<html><head><title>Page title</title><title>Author name</title><&

浏览 0提问于2012-03-22得票数 3

1回答

如果<p>的结束标记为<\\/p>，如何获取其值列表

、

这很奇怪。我试图从一个<p>的标签结尾是<\\/p>而不只是</p>的网站上抓取。显然，每次我调用soup.find_all('p')时，它都不会返回任何值。当我尝试使用a或div时，没有任何问题，因为这两种标签都是结构良好的标签，分别带有</a>和</div>结束标签。我对如何解决这个问题一无所知。from urllib.request import

浏览 0提问于2018-06-10得票数 1

0回答

BeautifulSoup.find_all()方法不能与命名空间标记一起使用

、、、

今天，我在使用BeautifulSoup时遇到了一个非常奇怪的行为。让我们来看看一个非常简单的html代码片段：我正在尝试使用BeautifulSoup('ix:nonfraction') >>> &l

浏览 2提问于2017-06-21得票数 9

回答已采纳

2回答

BeautifulSoup‘NoneType ()’返回find值

、、、、

我刚刚开始尝试用Python编写一个价格跟踪器，并且已经遇到了一个我不理解的错误。Error happens here getPrice() 我看到这个部分soup.find(id="priceblock_ourprice")返回一个值'None‘，因此返回AttributeError。我不明白为什么它返回一个'None‘值

浏览 20提问于2020-06-28得票数 1

回答已采纳

1回答

BeautifulSoup返回多个Div值

、

任何帮助都是非常感谢的！'})上面是我有问题的代码片段。每次我运行我的程序，当我只想要一个的时候，它会返回15个div。我知道它正在遍历每个url项并返回我的所有值，但我不知道如何一次只显示一个页面的结果。import requestsfrom bs4 import BeautifulSoup head

浏览 6提问于2022-09-18得票数 0

2回答

无法计算出美丽汤对象的编码

、

我一直在用“美丽汤：”打印这个网站的文本import urllib.request URL = urllib.request.urlopen("

浏览 5提问于2016-11-20得票数 0

回答已采纳

1回答

BeautifulSoup不返回任何值

、、

我刚接触Beautifulsoup，似乎遇到了一个问题。据我所知，我写的代码是正确的，但输出是空的。它不会显示任何价值。import requests soup= BeautifulSoup(url.content, "html.parser"

浏览 1提问于2017-02-10得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup返回一个奇怪的值

相关·内容

BeautifulSoup返回一个奇怪的值

BS4‘元素’到底是什么，元素是如何计算的，由哪个解析器来决定？显然很迷惑

Python机械化中的BeautifulSoup错误

美丽的汤findAll不包括所有的div

BeautifulSoup返回空值

“美丽汤”返回的值与html中的值不同。

Python模块“twill”--变量赋值期间的HTML泛洪

在mac上使用python3安装和导入beautifulsoup4

将web数据传递到“美丽汤”-空列表中

简单示例BeautifulSoup* Python*

基于BeautifulSoup的HTML性能及可读性改进

为什么我不能使用标准代码从网页中提取链接？

有人能向我解释一下为什么我的印刷品是“零”吗？

Python使用BeautifulSoup和findAll的不同结果

如果<p>的结束标记为<\\/p>，如何获取其值列表

BeautifulSoup.find_all()方法不能与命名空间标记一起使用

BeautifulSoup‘NoneType ()’返回find值

BeautifulSoup返回多个Div值

无法计算出美丽汤对象的编码

BeautifulSoup不返回任何值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐