BeautifulSoup不能从解析的html中找到所有标签吗？

html、python-3.x、web-scraping、beautifulsoup

HTML代码来自我的原始文件，第91行包含我想要查找的标记： <section class="lectsect" id="somesection"> </div> </div> </div>

浏览 13提问于2019-10-01得票数 1

1回答

BeautifulSoup --防止标记自动关闭

python、beautifulsoup

BeautifulSoup在解析以下代码时卡住了：>>> soup.prettify() '<img src="#" alt="Click Here >" />\n&

浏览 3提问于2011-06-16得票数 2

5回答

我可以改变BeautifulSoup将XML标签转换为小写的行为吗？

python、xml、beautifulsoup

我正在编写代码来解析用XML编写的配置文件，其中XML标记大小写混合，而且大小写很重要。Beautiful默认情况下会将XML标记转换为小写，我想要更改此行为。我不是第一个问这个问题的人[参见]。然而，我不理解这个问题的答案，并且在BeautifulSoup-3.1.0.1中，BeautifulSoup.py似乎没有包含任何"encodedName“或"Tag.__str__”的实例。

浏览 2提问于2009-05-21得票数 8

回答已采纳

1回答

如何从用户定义的标记中获取href标记

python、beautifulsoup、goose

可以帮我从获取所有的href标签吗我将这个url加载到goose，并将html内容加载到Beautifulsoup。检查html标签，发现所有的href标签都在'datastore‘中，这是一个自定义标签。我们怎样才能从美丽的汤中提取出hrefs呢？article = g.extract(url='https://www.cnoocltd.

浏览 1提问于2019-08-10得票数 0

1回答

Python BS4与SDMX

python、python-2.7、xml-parsing、bs4、sdmx

我想检索SDMX文件(如)中给定的数据。我尝试使用BeautifulSoup，但它似乎看不到标签。在下面的代码中from bs4 import BeautifulSoup html_source

浏览 13提问于2016-09-16得票数 1

回答已采纳

3回答

在HTML文件中查找所有呈现的图像

python、html、regex、parsing

我需要一种方法，在片段中只找到呈现的IMG标记。所以，我不能仅仅用HTML片段来查找所有的IMG标记，因为我还会得到在HTML中显示为文本的IMG标记(而不是呈现的)。有什么想法吗？谢谢，伊凡

浏览 2提问于2009-04-07得票数 0

回答已采纳

2回答

在Python中使用regex匹配两个字符串中的HTML标记

python、html、regex

我想验证源字符串中存在的HTML标记是否也存在于目标字符串中。

浏览 0提问于2010-04-20得票数 3

回答已采纳

1回答

美汤低大写标签默认？

python、beautifulsoup、lxml

我用的是LXML和漂亮汤。我有一个带有大写标记的XML文档。当我使用BeautifulSoup时，它似乎是小写的标签名称，这使我使用的find_all不直观。BS真的是这样做的，还是发生了其他事情？soup = BeautifulSoup( features= 'lxml', # 'html5lib', # 'html

浏览 2提问于2022-05-25得票数 0

1回答

使用BeautifulSoup解析HTML标记

python、html、python-2.7、python-3.x、beautifulsoup

我正在解析一个有很多超链接的网页。通过在<a>标签中找到所有的“href”，能够使用漂亮汤提取超链接。接下来，我试图获得所有这些链接的“标题”，这些链接显示为<a>标记的标记内容。对于HTML来说，我认为这种跟踪描述称为标记内容，对吗？下面是一个例子。“哪一种教室环境适合你？”需要提取。感谢你的帮助。a href="https://www.nyt

浏览 3提问于2017-10-12得票数 1

回答已采纳

1回答

如何使用BeautifulSoup查看闭合标签的总数？

python、beautifulsoup

下面的代码检查是否有一个以上的打开html标签， <html> </html>""" soup = BeautifulSoup(invalid, 'html.

浏览 0提问于2014-03-02得票数 1

2回答

BeautifulSoup:从html获取css类

python、html、css、beautifulsoup

有没有办法使用BeautifulSoup从HTML文件中获取CSS类？text-align': 'justify'}, 'p.c1': {'text-align': 'center'}尽管像这样的代码可以

浏览 0提问于2012-07-16得票数 8

回答已采纳

2回答

如何在漂亮的汤中获得嵌套元素

python、beautifulsoup

我正在努力解决在td中获取一些href所需的语法问题。tr和td元素没有任何class或id。< tr >< td ><a >... 谢谢

浏览 0提问于2009-06-29得票数 25

回答已采纳

2回答

如何用BeautifulSoup解析HTML标签中的HTML标签内容？

python、html、parsing、beautifulsoup

在web上发现的html的唯一情况下，存在在父html标签内具有多个html标签的HTML文档。我想解析html标记的内容。谁能给我指出这样做的方向？soup = BeautifulSoup(html, "lxml") 仅提供父ht

浏览 0提问于2017-06-05得票数 0

1回答

BeautifulSoup解析表并过滤第二行

python、html、parsing、beautifulsoup

我关注了，并希望过滤br之后的所有内容。flightAirport first">Palma de Mallorca<br><span class="second_row">nach Berlin Tegel</span></td>我尝试过的：从字符串中去掉'nach Berlin‘，得到一个缺少字符的字

浏览 70提问于2018-06-03得票数 -2

1回答

BS4:区分大小写的搜索

python、beautifulsoup、case-sensitive

有可能只找到那些大写格式的标签吗？我有一个html页面。有标记<a href=..>和标记<A href=...>。我只想得到<A href=..>格式的标签。当我尝试all = index.findAll('A')时，它什么也不返回。如果我尝试all = index.findAll('a')，我也会得到所有标签'a‘和'A’。谢谢你<e

浏览 5提问于2014-08-03得票数 0

回答已采纳

1回答

使用Python和Mechanize的随机形式的FIlling

python、forms、python-2.7、mechanize、mechanize-python

我很确定我已经通过了通常的用户名密码表单的第一个页面，但第二个登录页面要求您在帐户创建过程中选择的安全问题的答案中的特定字符。例如，如果你最喜欢的宠物叫加菲猫，它要求输入第二个、第四个和第五个字符，你必须填写3个输入a，f，i，并张贴表格。我不确定让机械化搜索它每次登录时想要的字符的最好方法是什么。frmentermemorableinformation1:strEnterMemorableInformation_memInfo1">

浏览 0提问于2013-06-30得票数 1

回答已采纳

3回答

HTML标记之间的Selenium

python、selenium、screen-scraping、beautifulsoup

将Javascript创建的页面中的所有超文本标记语言传递给BeautifulSoup的最佳方法是什么？我目前使用的是：from selenium.common.exceptions import NoSuchElementExceptionfrom selenium.webdriver.common.keys import Keys from BeautifulSoup import Beaut

浏览 1提问于2012-10-13得票数 2

5回答

使用BeautifulSoup解析文档，而不解析<code>标记的内容

python、html、django、beautifulsoup、pygments

我想允许评论作者使用一些标签(如<strong>，a等)，但禁用所有其他标签。I like this article, but the third code example <em>could have been simpler</em>: #include <stdio.h&

浏览 0提问于2010-10-24得票数 10

1回答

AttributeError：'str‘对象在使用BeautifulSoup时没有属性’子代‘错误

python、python-3.x、beautifulsoup

@ayivima在下面有一个很好的答案，但我要补充的是，网站本身最终没有被BeautifulSoup正确地刮掉，因为它有大量的Javascript。。所以我对Python的使用完全陌生，我只是想打印一个网页的标题。我使用的代码主要来自google：import requests url = "https://www150.pid=3

浏览 0提问于2019-06-24得票数 2

13回答

美汤与按ID抽取div及其内容

python、beautifulsoup

soup.find("tagName", { "id" : "articlebody" }) 为什么不返回<div id="articlebody"> ... </div>标签和中间的东西呢？(编辑：我发现BeautifulSoup没有正确解析我的页面，这可能意味着我试图解析的页面格式不正确。)

浏览 65提问于2010-01-26得票数 188

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup --防止标记自动关闭

我可以改变BeautifulSoup将XML标签转换为小写的行为吗？

如何从用户定义的标记中获取href标记

Python BS4与SDMX

在HTML文件中查找所有呈现的图像

在Python中使用regex匹配两个字符串中的HTML标记

美汤低大写标签默认？

使用BeautifulSoup解析HTML标记

如何使用BeautifulSoup查看闭合标签的总数？

BeautifulSoup:从html获取css类

如何在漂亮的汤中获得嵌套元素

如何用BeautifulSoup解析HTML标签中的HTML标签内容？

BeautifulSoup解析表并过滤第二行

BS4:区分大小写的搜索

使用Python和Mechanize的随机形式的FIlling

HTML标记之间的Selenium

使用BeautifulSoup解析文档，而不解析<code>标记的内容

AttributeError：'str‘对象在使用BeautifulSoup时没有属性’子代‘错误

美汤与按ID抽取div及其内容

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐