腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
BeautifulSoup
:
查找
<
p
>
标签
中
两个
<
h2
>
标签
之间
的
所有
内容
python
、
python-3.x
、
web-scraping
、
beautifulsoup
>Geometry</span></
p
> <
h2
><a name="_64
浏览 55
提问于2020-04-16
得票数 0
回答已采纳
1
回答
XPath查询以
查找
整个HTML中
所有
未标记
的
文本
xml
、
xpath
、
css-selectors
给定以下HTML,是否有一个XPath查询将提取
两个
<
h2
>标记
之间
的
所有
标记文本和未标记文本?(我使用
的
是RStudio
中
的
RStudio包。)</
p
></
浏览 2
提问于2016-02-04
得票数 2
回答已采纳
2
回答
使用bs4 python
查找
带有某些子
标签
的
标签
python
、
html
、
beautifulsoup
我有一个以下格式
的
html。<div class="consider"> <
p
>Text1</
p
></div> <
h2
>Hello</
h2
> </
浏览 10
提问于2018-07-25
得票数 0
1
回答
找到并替换成美丽
的
汤
python
、
html
、
beautifulsoup
我有一个类似这样
的
HTML: <body> <
p
>blah</
p
> <
p
>blah</
p
> <
h2
>hea
浏览 0
提问于2017-07-29
得票数 0
回答已采纳
2
回答
CSS缩进除标头以外
的
所有
内容
。
html
、
css
、
css-selectors
、
indentation
我有一个由应用程序生成
的
html文档。我想缩进这个文档
中
的
所有
内容
,除了
h2
头。我一直在玩css :不是选择器,但我无法让它按照我想要
的
方式工作。下面是我想出
的
css和我一直用于测试
的
jsfiddle: margin-left: 20px正如您在jsfiddle中看到
的
,
p
和div被适当地缩进,但它们
之间
的</e
浏览 7
提问于2015-11-05
得票数 2
回答已采纳
1
回答
抓取
h2
标签
的
Wolfram Alpha
html
、
web-scraping
、
beautifulsoup
我目前正在尝试登录,并找到包含文本“市场数据”
的
h2
标签
。 我使用
BeautifulSoup
通过
查找
所有
h2
标签
并检查h2.text
中
的
“市场数据”来完成此操作。然而,问题是这个url文本
的
soup版本不包含任何
h2
标签
。这与我点击“检查元素”并在Chrome中找到h2s时形成了鲜明对比。为什么我做汤
的
时候看不到h2s (url.text)?那么
浏览 11
提问于2017-03-13
得票数 1
回答已采纳
3
回答
SoupStrainer可以有
两个
参数吗?
python
、
python-3.x
、
beautifulsoup
我在stackoverflow或Google上找不到这样
的
问题,所以我还是会把它贴出来,以帮助任何偶然发现它的人。我想使用
BeautifulSoup
中
的
SoupStrainer来解析
两个
标记,而不是html文档
中
的
一个。我知道我能做到:这将获得&
浏览 4
提问于2014-12-31
得票数 4
2
回答
BeautifulSoup
-如何获取
两个
不同
标签
之间
的
所有
文本?
python
、
beautifulsoup
我想获取
两个
标签
之间
的
所有
文本:我是这样开始
的
:req = urllib.request.Reques
浏览 3
提问于2017-07-27
得票数 7
2
回答
使用
BeautifulSoup
进行网页抓取
python
、
web-scraping
、
beautifulsoup
、
scrape
我想从这个链接
中
删除国家名称和国家首都:from bs4 import
BeautifulSoup
soup =
Beautif
浏览 1
提问于2015-11-20
得票数 0
2
回答
解析HTML以检索术语
python
、
python-3.x
、
html-parsing
所以,现在我有了一堆被爬行
的
URL。我需要创建一个使用向量空间
的
索引,或者至少一个HTML中
所有
术语
的
列表。如何解析该网页
中
的
所有
术语?我有点不明白,我应该在特定
的
标签
之间
获取文本,或者其他
的
东西,或者我应该使用哪个库?我完全迷路了。下面是我需要对HTML所做
的
事情: 您可以在线使用html解析器,但原则上,您可以使用html正文中
的
文本.或
浏览 0
提问于2018-12-08
得票数 1
回答已采纳
4
回答
当存在相同
的
标记时,如何使用
BeautifulSoup
提取文本,这是没有用
的
python
、
web-scraping
、
beautifulsoup
我正在做一些网络抓取,我需要在<
p
>段落
之间
的
文本。_SX40_SY40_SS40_.jpg" height=${avatar.image.size} width=${avatar.image.size}></a><img width="102" height="12" alt="3
浏览 3
提问于2016-04-20
得票数 1
回答已采纳
1
回答
如何使用python和美汤将html页面拆分成多个页面
python
、
html
、
beautifulsoup
我有一个简单
的
html文件,如下所示。实际上,我是从一个wiki页面中提取出来
的
,去掉了一些html属性,然后转换成了这个简单
的
html页面。<html> <h1>draw electronics schematics</h1> <
p
>-- ..some text -->
浏览 0
提问于2013-01-22
得票数 6
回答已采纳
1
回答
BeautifulSoup
:在定义
的
h2
标记
之间
拉
p
标记
beautifulsoup
、
html-parsing
、
python-3.5
我试图用“新基金”和“新基金”
的
名称从'
h2
‘
标签
下
的
'
p
’
标签
中提取
所有
的文本。“
p
”
标签
的
数量对于每个页面都不一致,所以我在想一些while循环,而我尝试过
的
内容
没有起作用。每个文件
的
格式 tag通常是公司名称
中
的
“strong”,然后列出文本和其他“强”
标签
,以确定谁出资/投
浏览 5
提问于2017-07-20
得票数 2
回答已采纳
1
回答
用Mojolicious用户代理解析HTML
perl
、
mojolicious
我有类似下面这样
的
html <strong>SOMETHING</strong> INTERESTING (maybe</
p
> <
p
class="class2"> <a href="http
浏览 1
提问于2012-12-11
得票数 3
回答已采纳
2
回答
使用
beautifulSoup
和print访问属性
python
、
beautifulsoup
我想刮一个站点来
查找
h2
标签
的
所有
标题属性使用这段代码,我将访问整个
h2</em
浏览 2
提问于2018-03-30
得票数 0
回答已采纳
5
回答
BeautifulSoup
:不管有多少封闭
的
标签
,只要放在
标签
里面就行了
python
、
beautifulsoup
我正在尝试使用
BeautifulSoup
从网页
中
的
<
p
>元素
中
抓取
所有
的内部html。有内部标记,但我不关心,我只想得到内部文本。例如,对于:<
p
><i>Blue</i></
p
>&l
浏览 1
提问于2010-06-02
得票数 49
回答已采纳
1
回答
使用
BeautifulSoup
从网页
中
刮取选定
的
标题和内部文本?
python
、
web-scraping
、
beautifulsoup
源-一个博客帖子URL
H2
;{
H2
tag inner tex}; {
p
tag(s) inner text}
H2
;{
H2
tag inner tex}; {
p
tag(s) inner text} H3;{
H2</em
浏览 9
提问于2022-10-28
得票数 0
回答已采纳
1
回答
美丽
的
汤是在任意位置插入随机
标签
python
、
html
、
beautifulsoup
示例如下: >>> from bs4 import
BeautifulSoup
as BS >>> soup = BS('<
p
><a class="glossary-anchor" name="AB_testing"></a><
h2
class="hide-from-toc" data-text=" A/B testing" id="ab-tes
浏览 10
提问于2021-03-18
得票数 0
2
回答
用
BeautifulSoup
将一个HTML文档切割/切片成块?
python
、
html
、
beautifulsoup
、
html-parsing
</
p
><
p
>Html I do not want...</
p
>soup =
BeautifulSoup
(html) soupset = soup.find_a
浏览 7
提问于2016-03-23
得票数 2
回答已采纳
1
回答
从嵌套
的
HTML中提取文本
内容
,同时排除一些特定
的
标记;
python
、
css
、
xpath
、
beautifulsoup
、
scrapy
我正在尝试从具有嵌套
内容
的
HTML标记中提取文本
内容
。我从另一个相关
的
问题中拿出了这个例子,这个问题可以看到。>>> from parsel import Selector <
p
> Senator <a href="/people/</
p
>'''
浏览 3
提问于2019-11-17
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
Python爬虫之BeautifulSoup详解
BeautifulSoup常用解析库-爬虫干货系列5
Python爬取:Python教程并制作成pdf
【一起学爬虫】BeautifulSoup库详解
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券