用BeautifulSoup从HTML中提取几个“下一个兄弟”

、、

我有一个HTML文件集合，它们共享以下结构： <h1>ITEM NAME</h1><br /><span class="standardLabel">Frequency: <&#x

浏览 14提问于2020-07-05得票数 1

1回答

Python迭代问题和答案。

、、、、

我用xml存储了调查响应，不幸的是，xml并不是统一构建的。见下面的xml。我想在div上迭代，然后把所有的<b>元素作为问题提出来，但是我不知道如何处理答案，因为它们有时包含在子<div>中，有时不包括在子<div>中。我在考虑用元素树的对话或者漂亮的汤。但是如果我做了一个BeautifulSoup，BeautifulSoup会返回所有div，包括内部div。tree.itertext()可以工作，但如果可能的话，我不希望有太多的嵌套循环。<

浏览 0提问于2013-09-25得票数 3

回答已采纳

1回答

美丽汤数据提取

、、

有一个本地.html，从中提取点数据，用BeautifulSoup解析，但不知道如何提取div中的日期，解析数组如下所示：fl_html = open('followers.html', "r&

浏览 2提问于2022-11-21得票数 1

回答已采纳

2回答

美汤:提取两个标签之间的所有内容

、、

我正在使用BeautifulSoup从HTML文件中提取数据。我想获取两个标签之间的所有信息。这意味着如果我有一个像这样的HTML部分： <h1></h1><div>This is in a div</div> <h1></h1> 然后，如果我想要第一个h1和第二个h1之间的所有信息，输出将如下所示： Text &

浏览 25提问于2020-09-15得票数 2

回答已采纳

0回答

当没有下一个同级项时，我如何定位文本？

、

我正在尝试用BeautifulSoup抓取动态生成的页面，有时我会得到松散的文本，有些则不会。我如何提取下面的松散文本，我试图使用下一个兄弟，但文本没有包含在任何标签中。

浏览 7提问于2018-07-06得票数 0

回答已采纳

2回答

python:美丽的汤提取信息

、

我使用漂亮的汤解析HTML，如下所示：<h3 style="cear: both;"></p><p style="margin-bottom: 0;"> <span class="amount"&

浏览 6提问于2022-10-28得票数 1

1回答

如何使用选择器找到特定的文本？

、、、、

我在python中编写了一个脚本来查找td标记中的文本，这是第一个td标记的next sibling，它使用BeautifulSoup和css选择器相结合。如果我运行这个脚本，我会发现它很有用。DOWN DR<br>SUMMERVILLE SC 29483 </td>"""from bs4 import BeautifulS

浏览 3提问于2017-11-03得票数 0

回答已采纳

1回答

如何在美丽汤中找到<div><span>文本</span></div>的文本？

、、、、

这是HTML：<li class="EditableListItem NavListItem FollowersNavItem NavItem not_removableprofile/Dileep-Sankhla/followers">Followers <span class="list_count">92</span></a></li&g

浏览 1提问于2016-10-27得票数 1

回答已采纳

1回答

如何在div元素中获取段落标记中的所有文本

、、

我现在的问题是，实际的文章被分成几个p标记，这些标签反过来又在div标记中。header/h2><p>text</p></div>article = requests.get(url) soup = BeautifulSoup(article.content, 'html.parser'

浏览 2提问于2022-06-18得票数 0

1回答

如何在BeautifulSoup中删除以前的同级

、、

我试图从<hr />标记的顶部和</h2>标记下的下一个兄弟删除前一个兄弟，问题是我得到了这个错误AttributeError: 'NavigableString' object has no attribute'decompose'<h1>Heading text</h1> <p style="text-align: justify;&q

浏览 22提问于2019-10-28得票数 1

回答已采纳

1回答

使用bs4查找具有文本的html标记(h2)

、、、

对于html代码的这一部分：<h2><span class="sectioncount">3.342.2323</span><td>History/symptoms</td><td/></tr></table></

浏览 1提问于2016-05-29得票数 1

回答已采纳

1回答

从特定块中获取文本，但不包括某些嵌套标记

、、、、

我一直在尝试制作一个Python脚本，它实际上从特定的元素块中提取文本，但必须排除嵌套的兄弟元素中的一些文本。这是我正在尝试抓取的HTML部分： <div class="article_body"> Stack Overflow"https://example_site2.com" target="_blan

浏览 23提问于2019-02-20得票数 0

回答已采纳

5回答

Python中的图像抓取程序无法正常运行

、

import urllib2 page = urllib2.urlopen(url) page = page.read() #Gives HTML

浏览 0提问于2012-10-17得票数 5

4回答

如何使用BeautifulSoup获取两个指定标签之间的所有文本？

、、

html = """...我希望在第一次出现a标签之前获得从开始标签

浏览 13提问于2012-08-04得票数 6

回答已采纳

2回答

在BeautifulSoup4，Python3中，如何停止在已找到的标记中递归？

、、

我的html文档看起来如下：<body> outer font我想要提取‘字体’标签之间的所有文本。预期产出：inner font我试过的是： BeautifulSoup=htmlText用于I in soup.body.find_all

浏览 5提问于2015-05-22得票数 1

回答已采纳

1回答

将新闻写入CSV-文件(Python3，BeautifulSoup)

、、、

from bs4 import BeautifulSoupr = requests.get(website) div = soup.find("div", {"class": "schlagzeilen-content

浏览 0提问于2017-02-01得票数 1

回答已采纳

1回答

如何使用Beautifulsoup4

、、

我需要从html文件中获取一些值，但是我有几个问题在Beautiful soup quick start tutorial中没有得到回答。我想要做的是提取一个用户在我的网站上给出的数字，然后在sql查询中使用这个数字，所以我可能不需要漂亮的汤来做到这一点，但我不知道有其他任何方法可以做到这一点。1/我需要执行html文件来提取值吗?2/我需要把所有的html代码放在html变量中吗？因为在快速入门

浏览 42提问于2021-11-23得票数 0

回答已采纳

1回答

NoneObeject失败-破坏的HTML？

、、、

我在python中的解析脚本出现了问题。我已经在另一个页面(雅虎-金融)试过了，而且效果很好。然而，在晨星上，它不起作用。我在表变量的终端"NoneObject“中得到了错误。一个简单的csv导出直接从晨星不是一个解决方案，因为我想使用脚本的其他网站，谁没有这个功能。import requestsfrom bs4 import BeautifulSoup url = 'http://financi

浏览 3提问于2015-12-16得票数 1

回答已采纳

1回答

用beautifulSoup从HTML中提取文本

、、

我试图用漂亮的soup 4解析html，但无法获得数据。Location : example street, London, UK</div>soup = BeautifulSoup(html, "html.parser") a_show = soup.find('b').get_text()

浏览 0提问于2018-09-12得票数 0

回答已采纳

1回答

用BeautifulSoup从HTML中提取JSON

、、、

在过去的几个小时里，我已经尝试了所有的东西，但是我无法从下面的HTML中提取出一个特定的东西。我想拿"sessionCartId“，但我不知道.这就是我到目前为止尝试过的： sessioncartid = BeautifulSoup(response.text, "html.parser").findAll("script", {"type":

浏览 9提问于2022-08-14得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python迭代问题和答案。

美丽汤数据提取

美汤:提取两个标签之间的所有内容

当没有下一个同级项时，我如何定位文本？

python:美丽的汤提取信息

如何使用选择器找到特定的文本？

如何在美丽汤中找到<div><span>文本</span></div>的文本？

如何在div元素中获取段落标记中的所有文本

如何在BeautifulSoup中删除以前的同级

使用bs4查找具有文本的html标记(h2)

从特定块中获取文本，但不包括某些嵌套标记

Python中的图像抓取程序无法正常运行

如何使用BeautifulSoup获取两个指定标签之间的所有文本？

在BeautifulSoup4，Python3中，如何停止在已找到的标记中递归？

将新闻写入CSV-文件(Python3，BeautifulSoup)

如何使用Beautifulsoup4

NoneObeject失败-破坏的HTML？

用beautifulSoup从HTML中提取文本

用BeautifulSoup从HTML中提取JSON

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐