BeautifulSoup:如何忽略嵌套元素_使用BeautifulSoup忽略列表中的某些元素_用BeautifulSoup解析电影脚本-如何忽略文本中嵌套的标签？ - 腾讯云开发者社区

python、beautifulsoup

我不想提取span元素内部的值。 US$12.24 这是我使用的代码，它提取span元素中的12.12美元和12.24

浏览 14提问于2021-10-12得票数 0

回答已采纳

1回答

BeautifulSoup，不要修复html

beautifulsoup、lxml

</html><html> <&

浏览 14提问于2020-07-25得票数 0

1回答

选择一个特定的列，忽略BeautifulSoup中的其余部分(避免嵌套表)

python、html、web-scraping、beautifulsoup、html-parsing

问题是，这个表有时包含第三列中的嵌套表。<\table> <\td> <\tbody>主要的问题是，我不知道如何简单地忽略三分之一的td，所以我不会读取主表中的嵌套表我试过使用这个代码：from bs4 import BeautifulSoup soup = <em

浏览 3提问于2022-08-26得票数 1

回答已采纳

2回答

BeautifulSoup -如何调用嵌套元素

python

我只需要一点帮助，在我的python脚本中找到一个元素“美丽的汤”。有谁知道我怎样才能找到这个元素吗？看看下面的答案，我试着复制它们，但是我没有使用静态HTML，而是调用了网站url。代码：import pandas as pd data = requests.get('https://www.screwfix.com/p/no-nonsense-sanitary-silicone-whi

浏览 1提问于2021-05-26得票数 0

回答已采纳

3回答

BeautifulSoup嵌套标签

python、xml、nested、beautifulsoup

我试图用Beautifulsoup解析一个XML，但在尝试使用findall()的"“属性时遇到了麻烦。<?xml version="1.0"?<book>false</book> </catalog>from BeautifulSoup

浏览 0提问于2011-01-05得票数 6

回答已采纳

1回答

BeautifulSoup导航忽略指定路径

python、beautifulsoup

看起来，我的BeautifulSoup解析器似乎忽略了我请求的元素的路径，并返回在路径中找到的第一个标记，该标记在路径中带有最后一个元素的名称，而不考虑到那个位置的路径。<id>789</id> </firstCategory>Python代码： from bs4 import BeautifulSoupna

浏览 0提问于2016-11-02得票数 1

回答已采纳

2回答

如何针对特定的维基百科表元素进行bs4抓取？

python、python-3.x、web-scraping、beautifulsoup

到目前为止，我的代码如下：soup = BeautifulSoup(website_url,'lxml')from bs4 import BeautifulSoup我试图针对这个表元素，

浏览 3提问于2020-01-27得票数 2

回答已采纳

2回答

使用Python的美丽汤模块从网站获取href链接

python、web-scraping、beautifulsoup

如果需要，我只需要导入请求并从bs4导入BeautifulSoup：page = requests.get(rsoLink) beautifulPage = BeautifulSoup(page.content, 'html.parser当我查看页面的HTML结构时，"a“标记似乎嵌套在页面结构的深处

浏览 8提问于2022-06-13得票数 2

回答已采纳

3回答

无法获取开始标记和结束标记之间的文本

python、beautifulsoup

soup = BeautifulSoup("'hello'<a>'my link'</a>", 'html.parser')None 输出是否正常

浏览 2提问于2017-04-05得票数 0

2回答

BeautifulSoup忽略表中的嵌套表

python、html、web-scraping、beautifulsoup、html-parsing

使用BeautifulSoup来解析网页(不幸的是，这主要是用表编写的)。我使用BeautifulSoup在父表上调用一个find_all，由于嵌套表中的嵌套标记，它将返回每一个其他行的重复项。

浏览 2提问于2015-01-21得票数 3

回答已采纳

1回答

Python迭代问题和答案。

python、xml、xml-parsing、beautifulsoup、elementtree

我想在div上迭代，然后把所有的元素作为问题提出来，但是我不知道如何处理答案，因为它们有时包含在子<div>中，有时不包括在子<div>中。 <html>

浏览 0提问于2013-09-25得票数 3

回答已采纳

1回答

BeautifulSoup不同解析器

python-3.x、beautifulsoup

我偶然发现了一种奇怪的行为，在使用html.parser时，它忽略了特定位置的所有标记。看看这段代码html = """<head></head></html> soup = Bea

浏览 0提问于2019-04-27得票数 5

2回答

无法使用漂亮的汤选择特定的html元素

python、web-scraping、beautifulsoup

我正在尝试找到一个嵌套在all_totals id中的tbody元素(我检查过了，它肯定就在那里)。import requestsdata = requests.get(url) html = BeautifulSoup(data.te

浏览 22提问于2019-08-16得票数 0

回答已采纳

1回答

用` `解析未关闭的BeautifulSoup标记

python、html、beautifulsoup

BeautifulSoup有关闭连续 标记的逻辑，但这并不完全符合我的要求。例如,>>> bs = BeautifulSoup('one two three four') HTML将呈现为BeautifulSoup的标签关闭逻辑意味着当我请求所有的 元素时，我会得到嵌套的标记

浏览 1提问于2012-11-20得票数 5

1回答

Python2.7-使用ajax在网页上搜索特定URL

python、python-2.7、beautifulsoup

我必须检索一个嵌套在网页中的URL。我试过以下代码，但它找不到主链接的URL (指向PDF)。import urllib2 conn = urllib2.urlopen(u

浏览 0提问于2016-10-24得票数 2

回答已采纳

1回答

使用BeautifulSoup/Python从HTML-body获取嵌套div-元素

python、html、web-scraping、beautifulsoup、nested

但是，每当我试图打印主体时，我都不会得到嵌套的div-元素。这是我目前的代码：import urllib # UrlLib page = urllib.request.urlopen(url).read() soup = bs.BeautifulSoupbody-eleme

浏览 1提问于2020-11-01得票数 1

回答已采纳

2回答

使用Go解析xml，忽略嵌套元素？

go、xml-parsing

我已经设法让它提取出所有的<li>元素，但是如果元素包含一个链接<a>，那么链接的内容就会被忽略。我想忽略嵌套的<a>并将其内容显示为纯文本，但我不知道如何实现。list_item }有没有什么方法可以忽略嵌套</em

浏览 0提问于2015-03-29得票数 0

1回答

如何不包含soup.select()中的特定元素？

python-3.x、beautifulsoup

我使用soup.select('.c-w a')来选择元素。在c-w中，有一个c-s，我不想把它包括在这个选择中。from bs4 import BeautifulSoup <div class="c-w"> <a href="sound://english-french/sound/M000001099.mp3"

浏览 2提问于2020-08-10得票数 1

回答已采纳

4回答

排除带有漂亮汤的标签

python、beautifulsoup

我正在使用data.get_text()，但我不知道如何过滤掉0.45美元，有什么办法吗？

浏览 0提问于2018-02-20得票数 0

2回答

Python美丽的汤参数

python、beautifulsoup

我有这段代码，它使用BeautifulSoup从页面获取一些文本body = soup.find('div' , {'id':'body'})我想让它成为一个可重用的函数，它接受一些htmltext和标签来匹配它，如下所示 soup= BeautifulSoup(html) bodyparse(htmlpage, ('div' , {&#

浏览 0提问于2010-04-03得票数 8

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云