腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
:
如何
忽略
嵌套
元素
python
、
beautifulsoup
我不想提取span
元素
内部的值。 <p class="price"> <span class="rrp">US$12.24</span> </p> 这是我使用的代码,它提取span
元素
中的12.12美元和12.24
浏览 14
提问于2021-10-12
得票数 0
回答已采纳
1
回答
BeautifulSoup
,不要修复html
beautifulsoup
、
lxml
<p> </p> </html><html> <p> <&
浏览 14
提问于2020-07-25
得票数 0
1
回答
选择一个特定的列,
忽略
BeautifulSoup
中的其余部分(避免
嵌套
表)
python
、
html
、
web-scraping
、
beautifulsoup
、
html-parsing
问题是,这个表有时包含第三列中的
嵌套
表。<\table> <\td> <\tbody>主要的问题是,我不知道
如何
简单地
忽略
三分之一的td,所以我不会读取主表中的
嵌套
表我试过使用这个代码:from bs4 import
BeautifulSoup
soup = <em
浏览 3
提问于2022-08-26
得票数 1
回答已采纳
2
回答
BeautifulSoup
-
如何
调用
嵌套
元素
python
我只需要一点帮助,在我的python脚本中找到一个
元素
“美丽的汤”。有谁知道我怎样才能找到这个
元素
吗?看看下面的答案,我试着复制它们,但是我没有使用静态HTML,而是调用了网站url。代码:import pandas as pd data = requests.get('https://www.screwfix.com/p/no-nonsense-sanitary-silicone-whi
浏览 1
提问于2021-05-26
得票数 0
回答已采纳
3
回答
BeautifulSoup
嵌套
标签
python
、
xml
、
nested
、
beautifulsoup
我试图用
Beautifulsoup
解析一个XML,但在尝试使用findall()的"“属性时遇到了麻烦。<?xml version="1.0"?<book>false</book> </catalog>from
BeautifulSoup
浏览 0
提问于2011-01-05
得票数 6
回答已采纳
1
回答
BeautifulSoup
导航
忽略
指定路径
python
、
beautifulsoup
看起来,我的
BeautifulSoup
解析器似乎
忽略
了我请求的
元素
的路径,并返回在路径中找到的第一个标记,该标记在路径中带有最后一个
元素
的名称,而不考虑到那个位置的路径。<id>789</id> </firstCategory>Python代码: from bs4 import
BeautifulSoup
na
浏览 0
提问于2016-11-02
得票数 1
回答已采纳
2
回答
如何
针对特定的维基百科表
元素
进行bs4抓取?
python
、
python-3.x
、
web-scraping
、
beautifulsoup
到目前为止,我的代码如下:soup =
BeautifulSoup
(website_url,'lxml')from bs4 import
BeautifulSoup
我试图针对这个表
元素
,
浏览 3
提问于2020-01-27
得票数 2
回答已采纳
2
回答
使用Python的美丽汤模块从网站获取href链接
python
、
web-scraping
、
beautifulsoup
如果需要,我只需要导入请求并从bs4导入
BeautifulSoup
:page = requests.get(rsoLink) beautifulPage =
BeautifulSoup
(page.content, 'html.parser当我查看页面的HTML结构时,"a“标记似乎
嵌套
在页面结构的深处
浏览 8
提问于2022-06-13
得票数 2
回答已采纳
3
回答
无法获取开始标记和结束标记之间的文本
python
、
beautifulsoup
soup =
BeautifulSoup
("<p>'hello'<a>'my link'</a></p>", 'html.parser')None 输出是否正常
浏览 2
提问于2017-04-05
得票数 0
2
回答
BeautifulSoup
忽略
表中的
嵌套
表
python
、
html
、
web-scraping
、
beautifulsoup
、
html-parsing
使用
BeautifulSoup
来解析网页(不幸的是,这主要是用表编写的)。我使用
BeautifulSoup
在父表上调用一个find_all,由于
嵌套
表中的
嵌套
标记,它将返回每一个其他行的重复项。
浏览 2
提问于2015-01-21
得票数 3
回答已采纳
1
回答
Python迭代问题和答案。
python
、
xml
、
xml-parsing
、
beautifulsoup
、
elementtree
我想在div上迭代,然后把所有的<b>
元素
作为问题提出来,但是我不知道
如何
处理答案,因为它们有时包含在子<div>中,有时不包括在子<div>中。 <html>
浏览 0
提问于2013-09-25
得票数 3
回答已采纳
1
回答
BeautifulSoup
不同解析器
python-3.x
、
beautifulsoup
我偶然发现了一种奇怪的行为,在使用html.parser时,它
忽略
了特定位置的所有标记。看看这段代码html = """<head></head><!--[if lte IE 8]> <![endif]--></html> soup =
Bea
浏览 0
提问于2019-04-27
得票数 5
2
回答
无法使用漂亮的汤选择特定的html
元素
python
、
web-scraping
、
beautifulsoup
我正在尝试找到一个
嵌套
在all_totals id中的tbody
元素
(我检查过了,它肯定就在那里)。import requestsdata = requests.get(url) html =
BeautifulSoup
(data.te
浏览 22
提问于2019-08-16
得票数 0
回答已采纳
1
回答
用`<br>`解析未关闭的
BeautifulSoup
标记
python
、
html
、
beautifulsoup
BeautifulSoup
有关闭连续<br>标记的逻辑,但这并不完全符合我的要求。例如,>>> bs =
BeautifulSoup
('one<br>two<br>three<br>four') HTML将呈现为
BeautifulSoup
的标签关闭逻辑意味着当我请求所有的<br>
元素
时,我会得到
嵌套
的标记
浏览 1
提问于2012-11-20
得票数 5
1
回答
Python2.7-使用ajax在网页上搜索特定URL
python
、
python-2.7
、
beautifulsoup
我必须检索一个
嵌套
在网页中的URL。我试过以下代码,但它找不到主链接的URL (指向PDF)。import urllib2 conn = urllib2.urlopen(u
浏览 0
提问于2016-10-24
得票数 2
回答已采纳
1
回答
使用
BeautifulSoup
/Python从HTML-body获取
嵌套
div-
元素
python
、
html
、
web-scraping
、
beautifulsoup
、
nested
但是,每当我试图打印主体时,我都不会得到
嵌套
的div-
元素
。这是我目前的代码:import urllib # UrlLib page = urllib.request.urlopen(url).read() soup = bs.
BeautifulSoup
body-eleme
浏览 1
提问于2020-11-01
得票数 1
回答已采纳
2
回答
使用Go解析xml,
忽略
嵌套
元素
?
go
、
xml-parsing
我已经设法让它提取出所有的<li>
元素
,但是如果
元素
包含一个链接<a>,那么链接的内容就会被
忽略
。我想
忽略
嵌套
的<a>并将其内容显示为纯文本,但我不知道
如何
实现。list_item }有没有什么方法可以
忽略
嵌套</em
浏览 0
提问于2015-03-29
得票数 0
1
回答
如何
不包含soup.select()中的特定
元素
?
python-3.x
、
beautifulsoup
我使用soup.select('.c-w a')来选择
元素
。在c-w中,有一个c-s,我不想把它包括在这个选择中。from bs4 import
BeautifulSoup
<div class="c-w"> <a href="sound://english-french/sound/M000001099.mp3"
浏览 2
提问于2020-08-10
得票数 1
回答已采纳
4
回答
排除带有漂亮汤的标签
python
、
beautifulsoup
我正在使用data.get_text(),但我不知道
如何
过滤掉0.45美元,有什么办法吗?
浏览 0
提问于2018-02-20
得票数 0
2
回答
Python美丽的汤参数
python
、
beautifulsoup
我有这段代码,它使用
BeautifulSoup
从页面获取一些文本body = soup.find('div' , {'id':'body'})我想让它成为一个可重用的函数,它接受一些htmltext和标签来匹配它,如下所示 soup=
BeautifulSoup
(html) bodyparse(htmlpage, ('div' , {
浏览 0
提问于2010-04-03
得票数 8
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【一起学爬虫】BeautifulSoup库详解
送上一碗鸡汤——BeautifulSoup网页解析
享学课堂浅谈Python3中BeautifulSoup的使用方法
——BeautifulSoup
Python爬虫从入门到出门(二)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券