腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
用
BeautifulSoup
从
HTML
中
提取
几个
“
下一个
兄弟
”
、
、
我有一个
HTML
文件集合,它们共享以下结构: <h1>ITEM NAME</h1><br /><span class="standardLabel">Frequency: <
浏览 14
提问于2020-07-05
得票数 1
1
回答
Python迭代问题和答案。
、
、
、
、
我
用
xml存储了调查响应,不幸的是,xml并不是统一构建的。见下面的xml。我想在div上迭代,然后把所有的<b>元素作为问题提出来,但是我不知道如何处理答案,因为它们有时包含在子<div>
中
,有时不包括在子<div>
中
。 我在考虑
用
元素树的对话或者漂亮的汤。但是如果我做了一个
BeautifulSoup
,
BeautifulSoup
会返回所有div,包括内部div。tree.itertext()可以工作,但如果可能的话,我不希望有太多的嵌套循环。<
浏览 0
提问于2013-09-25
得票数 3
回答已采纳
1
回答
美丽汤数据
提取
、
、
有一个本地.
html
,从中
提取
点数据,
用
BeautifulSoup
解析,但不知道如何
提取
div
中
的日期,解析数组如下所示:fl_
html
= open('followers.
html
', "r&
浏览 2
提问于2022-11-21
得票数 1
回答已采纳
2
回答
美汤:
提取
两个标签之间的所有内容
、
、
我正在使用
BeautifulSoup
从
HTML
文件中
提取
数据。我想获取两个标签之间的所有信息。这意味着如果我有一个像这样的
HTML
部分: <h1></h1><div>This is in a div</div> <h1></h1> 然后,如果我想要第一个h1和第二个h1之间的所有信息,输出将如下所示: Text &
浏览 25
提问于2020-09-15
得票数 2
回答已采纳
0
回答
当没有
下一个
同级项时,我如何定位文本?
、
我正在尝试用
BeautifulSoup
抓取动态生成的页面,有时我会得到松散的文本,有些则不会。 我如何
提取
下面的松散文本,我试图使用
下一个
兄弟
,但文本没有包含在任何标签
中
。
浏览 7
提问于2018-07-06
得票数 0
回答已采纳
2
回答
python:美丽的汤
提取
信息
、
我使用漂亮的汤解析
HTML
,如下所示:<h3 style="cear: both;"></p><p style="margin-bottom: 0;"> <span class="amount"&
浏览 6
提问于2022-10-28
得票数 1
1
回答
如何使用选择器找到特定的文本?
、
、
、
、
我在python
中
编写了一个脚本来查找td标记
中
的文本,这是第一个td标记的next sibling,它使用
BeautifulSoup
和css选择器相结合。如果我运行这个脚本,我会发现它很有用。DOWN DR<br>SUMMERVILLE SC 29483 </td>"""from bs4 import
BeautifulS
浏览 3
提问于2017-11-03
得票数 0
回答已采纳
1
回答
如何在美丽汤中找到<div><span>文本</span></div>的文本?
、
、
、
、
这是
HTML
:<li class="EditableListItem NavListItem FollowersNavItem NavItem not_removableprofile/Dileep-Sankhla/followers">Followers <span class="list_count">92</span></a></li&g
浏览 1
提问于2016-10-27
得票数 1
回答已采纳
1
回答
如何在div元素
中
获取段落标记
中
的所有文本
、
、
我现在的问题是,实际的文章被分成
几个
p标记,这些标签反过来又在div标记
中
。header/h2><p>text</p></div>article = requests.get(url) soup =
BeautifulSoup
(article.content, '
html
.parser'
浏览 2
提问于2022-06-18
得票数 0
1
回答
如何在
BeautifulSoup
中
删除以前的同级
、
、
我试图
从
<hr />标记的顶部和</h2>标记下的
下一个
兄弟
删除前一个
兄弟
,问题是我得到了这个错误AttributeError: 'NavigableString' object has no attribute'decompose'<h1>Heading text</h1> <p style="text-align: justify;&q
浏览 22
提问于2019-10-28
得票数 1
回答已采纳
1
回答
使用bs4查找具有文本的
html
标记(h2)
、
、
、
对于
html
代码的这一部分:<h2><span class="sectioncount">3.342.2323</span><td>History/symptoms</td><td/></tr></table></
浏览 1
提问于2016-05-29
得票数 1
回答已采纳
1
回答
从
特定块
中
获取文本,但不包括某些嵌套标记
、
、
、
、
我一直在尝试制作一个Python脚本,它实际上
从
特定的元素块中
提取
文本,但必须排除嵌套的
兄弟
元素
中
的一些文本。这是我正在尝试抓取的
HTML
部分: <div class="article_body"> Stack Overflow"https://example_site2.com" target="_blan
浏览 23
提问于2019-02-20
得票数 0
回答已采纳
5
回答
Python
中
的图像抓取程序无法正常运行
、
import urllib2 page = urllib2.urlopen(url) page = page.read() #Gives
HTML
浏览 0
提问于2012-10-17
得票数 5
4
回答
如何使用
BeautifulSoup
获取两个指定标签之间的所有文本?
、
、
html
= """...我希望在第一次出现a标签之前获得
从
开始标签
浏览 13
提问于2012-08-04
得票数 6
回答已采纳
2
回答
在
BeautifulSoup
4,Python3
中
,如何停止在已找到的标记
中
递归?
、
、
我的
html
文档看起来如下:<body> outer font我想要
提取
‘字体’标签之间的所有文本。预期产出:inner font我试过的是:
BeautifulSoup
=htmlText用于I in soup.body.find_all
浏览 5
提问于2015-05-22
得票数 1
回答已采纳
1
回答
将新闻写入CSV-文件(Python3,
BeautifulSoup
)
、
、
、
from bs4 import
BeautifulSoup
r = requests.get(website) div = soup.find("div", {"class": "schlagzeilen-content
浏览 0
提问于2017-02-01
得票数 1
回答已采纳
1
回答
如何使用
Beautifulsoup
4
、
、
我需要从
html
文件
中
获取一些值,但是我有
几个
问题在Beautiful soup quick start tutorial
中
没有得到回答。我想要做的是
提取
一个用户在我的网站上给出的数字,然后在sql查询中使用这个数字,所以我可能不需要漂亮的汤来做到这一点,但我不知道有其他任何方法可以做到这一点。1/我需要执行
html
文件来
提取
值吗?2/我需要把所有的
html
代码放在
html
变量
中
吗?因为在快速入门
浏览 42
提问于2021-11-23
得票数 0
回答已采纳
1
回答
NoneObeject失败-破坏的
HTML
?
、
、
、
我在python
中
的解析脚本出现了问题。我已经在另一个页面(雅虎-金融)试过了,而且效果很好。然而,在晨星上,它不起作用。我在表变量的终端"NoneObject“
中
得到了错误。一个简单的csv导出直接
从
晨星不是一个解决方案,因为我想使用脚本的其他网站,谁没有这个功能。import requestsfrom bs4 import
BeautifulSoup
url = 'http://financi
浏览 3
提问于2015-12-16
得票数 1
回答已采纳
1
回答
用
beautifulSoup
从
HTML
中
提取
文本
、
、
我试图
用
漂亮的soup 4解析
html
,但无法获得数据。Location : example street, London, UK</div>soup =
BeautifulSoup
(
html
, "
html
.parser") a_show = soup.find('b').get_text()
浏览 0
提问于2018-09-12
得票数 0
回答已采纳
1
回答
用
BeautifulSoup
从
HTML
中
提取
JSON
、
、
、
在过去的
几个
小时里,我已经尝试了所有的东西,但是我无法从下面的
HTML
中
提取
出一个特定的东西。我想拿"sessionCartId“,但我不知道.这就是我到目前为止尝试过的: sessioncartid =
BeautifulSoup
(response.text, "
html
.parser").findAll("script", {"type":
浏览 9
提问于2022-08-14
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
怎么从pdf里提取图片?怎么用pdf转换器提取pdf中图片?
享学课堂浅谈Python3中BeautifulSoup的使用方法
Python 爬虫(五)
初识BeautifulSoup
BeautifulSoup常用解析库-爬虫干货系列5
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券