腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Python
和
BeautifulSoup
定位
某些
html
标记
、
我想用
Python
和
BeautifulSoup
从div class = "wxColumn wxColumn-seven dotw_0"中提取信息,直到div class = "wxColumn wxColumn-sevendotw_6",但我不知道
如何
找到这些div。下面是我写的代码 import requests page = requests.get("https://
浏览 27
提问于2020-06-28
得票数 1
1
回答
python
的
HTML
解析器,可以跟踪标签在
HTML
文档中的位置
、
、
我正在
使用
python
解析
HTML
页面。我需要
定位
某些
标签,并以字节为单位测量它们之间的距离。我
使用
了
BeautifulSoup
,但它无法获取found标签的位置。有没有能做到这一点的
python
库?谢谢
浏览 13
提问于2020-10-22
得票数 0
3
回答
从
HTML
中读取头内容
、
、
我需要在
python
的小脚本。需要读取web文件中的自定义块。# -*- coding: utf-8 -*-response= urllib2.urlopen(req)print the_page # Here is all page source with
html</
浏览 1
提问于2010-12-20
得票数 2
回答已采纳
1
回答
使用
Python
3.0中的Beautiful获取特定链接的最有效方法是什么?
、
、
我目前正在学习古瑟尔的
Python
专业知识。我遇到了
使用
BeautifulSoup
从网页中提取特定链接的问题。虽然我可以用列表来编程,但我想知道是否有更简单的方法可以不
使用
列表或字典来实现呢?
html
= urllib.request.urlopen(url, context=ctx).read() soup =
BeautifulSoup
(
html
, '
html
.parser')'a‘
标记
<em
浏览 3
提问于2017-09-01
得票数 0
回答已采纳
1
回答
如何
动态地找到所选元素的最近的特定父级?
、
、
、
我希望解析许多
html
页面,并
使用
beautifulsoup
html
.parser
和
python
删除包含文本"Message“的div。div没有名称或id,因此指向它是不可能的。这是因为在这个
html
页面中,div
标记
和文本"Message“之间有5个
标记
(p,i,b,span,a),第6个
标记
是div。下面的代码适用于1
html
页面。soup =
Beautifu
浏览 8
提问于2022-11-30
得票数 2
回答已采纳
1
回答
美汤在源文件中找到标签的位置?
、
、
我正在
使用
BeautifulSoup
从
HTML
文件中提取信息。我希望能够捕获信息的位置,即在
HTML
文件中的标签,BS标签对象的偏移量。 有没有办法做到这一点?我目前
使用
的是lxml解析器,因为它是默认的。
浏览 22
提问于2018-03-03
得票数 0
回答已采纳
5
回答
如何
修复错误的嵌套/未闭合的
HTML
标记
?
、
、
、
我需要清理由用户提交的
HTML
通过关闭任何与正确的嵌套顺序打开的标签。我一直在寻找一种算法或
Python
代码来做这件事,但除了PHP等的一些半生不熟的实现外,我什么也没找到。
浏览 7
提问于2008-11-16
得票数 21
回答已采纳
2
回答
在
BeautifulSoup
中
使用
过滤器时获取内部
标记
文本
我有:<div id="price">$199.00</div>我怎么才能得到$199.00的文本。
使用
不起作用,因为我从整个文档中获得了所有的innet文本。
浏览 1
提问于2013-11-27
得票数 0
3
回答
相同的CSS,不同的结果在浏览器
和
bs4 .select()方法
、
、
、
tbody:nth-of-type(1)>tr:nth-of-type(1)>td:nth-of-type(5)>table:nth-of-type(1)>tbody:nth-of-type(1)'import requestsimport lxml url = 'https://web.archive.orglike Gecko) Chrome/53.0.2785
浏览 0
提问于2018-12-14
得票数 1
7
回答
BeautifulSoup
解析的问题
、
我正在尝试用
BeautifulSoup
解析一个
html
页面,但是看起来
BeautifulSoup
根本不喜欢这个
html
或者那个页面。"--
HTML
------------------------------------------"print "--
BeautifulSoup
---------------------------------" print
BeautifulSoup
浏览 1
提问于2009-03-02
得票数 5
回答已采纳
3
回答
漂亮的汤和bs4有什么区别?
、
、
、
、
我是
python
的新手,我试着解析一些XML文件,以便添加一些新
标记
并存储新的XML文件。
python
-bs4 - error-tolerant
HTML
parser for
浏览 2
提问于2015-03-27
得票数 25
回答已采纳
2
回答
如何
导航到
BeautifulSoup
对象中的特定
标记
?
、
、
链接到我正在
使用
的url:new_url = r"https://www.sec.gov/Archives/edgar/data/789019/000106299321002323/0001062993-21-002323.txt" response = requests.get(n
浏览 5
提问于2021-04-28
得票数 0
回答已采纳
2
回答
Python
3 web抓取选项
、
我是
Python
的新手,所以很抱歉这是一个新手问题。我想知道这个论坛上有没有人有
使用
python
3进行网络抓取的好选择。谢谢,威尔
浏览 1
提问于2011-08-11
得票数 5
1
回答
如何
根据<p> <div>或<br>
标记
的存在来拆分
html
页面
、
、
、
因此,第一个<p>
标记
将包含从<
html
>到相关<p>
标记
的所有数据/
标记
。我看过类似于lxml项目中的etree的东西,但它看起来并不重要。我看到的与“普通”
html
解析的不同之处在于所选标签的数量。我想要选择多个标签和它们的数据,并将它们分开保存,而“普通”
html
解析工具提供了只选择一个单独的标签/标签的能力(
使用
xpath等)并
使用
它。(我对web编程也是个新手)。我已经想出了一种方法,我
浏览 1
提问于2013-07-30
得票数 1
4
回答
BeautifulSoup
和
lxml.
html
-首选哪个?
、
、
我正在从事一个项目,将涉及解析
HTML
。有什么理由更喜欢其中之一吗?我以前
使用
过lxml for XML,我觉得我会更习惯
使用
它,但是
BeautifulSoup
似乎很常见。 我知道我应该
使用
对我有效的那个,但我在寻找两者的个人经验。
浏览 1
提问于2011-02-11
得票数 38
回答已采纳
2
回答
使用
Python
和
BeautifulSoup
解析表
、
、
、
我正在尝试
使用
Python
和
BeautifulSoup
访问
某些
td标签中的内容。我可以获得满足条件的第一个td
标记
(
使用
find),也可以获取所有的td
标记
(
使用
findAll)。现在,我可以只
使用
findAll,获取所有内容,并从中获取我想要的内容,但这似乎效率很低(即使我对搜索进行了限制)。有没有办法转到满足我想要的条件的某个td标签?比如说第三个,还是第十个?__ import unicode_literals
浏览 0
提问于2011-06-21
得票数 1
回答已采纳
3
回答
用标签替换字符串中的单词
、
让我们考虑以下
HTML
片段: <p>'''from bs4 import
BeautifulSoup
soup =
BeautifulSoup
(
html
, '
浏览 0
提问于2019-04-04
得票数 2
回答已采纳
2
回答
使用
find时
BeautifulSoup
挂起
、
、
、
、
></
html
>这是我的代码:soup =
BeautifulSoup
(data, '
html
5lib')当我运行它时,bs4仍然在循环中并且不返回任何东西,可能是因为在
某些
HTML
数据中不存在
标记
a。data是一个多行的变量
html
strin
浏览 0
提问于2016-03-18
得票数 3
1
回答
调整Craigslist刮板
Python
、
、
、
我正在尝试修改我在网上找到的
python
2.7Craigslist刮板,使其与
python
3.6一起工作。from bs4 import
BeautifulSoup
URL = 'http
浏览 11
提问于2017-06-22
得票数 0
1
回答
漂亮的汤在标签中找到标签
、
我保证:)这是在
Python
2.7.3下的BS4
和
lxml解析器中实现的。我有这样的经历: self.chaptername = self.soup.find_all('center h3 b') 在我的
html
中我有 <center><h3><b>Chapter 34</b我是否应该能够查找<center><h3><b>嵌套结构,或者我
使用
BS4是错误的? 谢谢你,艾德
浏览 15
提问于2021-08-01
得票数 1
点击加载更多
相关
资讯
如何使用Python和BeautifulSoup爬取网站
Python爬虫入门--使用requests和BeautifulSoup库
使用Python和OpenCV检测和标记湖面轮廓
如何使用HTML标记语言编程一个文字表格出来
python2.7爬虫字符及BeautifulSoup使用过程中的节点定位问题
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券