腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
和
XML
解析
、
、
、
我有一个TEI-
XML
文件,我只想捕获<p>
和
<said>标记的内容。 因此,给定以下输入: <?
xml
version="1.0" encoding="UTF-8"?我已经尝试过以下代码: Import
BeautifulSoup
content = [] # Read the
XML
filewith open("speakers&
浏览 9
提问于2021-11-01
得票数 0
1
回答
BeautifulSoup
抑制lxml
解析
错误?
、
、
我使用
BeautifulSoup
使用lxml
解析
和
导航
XML
文件。from bs4 import
BeautifulSoup
soup =
BeautifulSoup
("<foo><bar>trololo<", "
xml
")
浏览 7
提问于2016-09-16
得票数 2
回答已采纳
1
回答
从
xml
获取标记名
、
、
</pwACL> Batch Number我想要获取标签名称
和
标签之间的数据。
浏览 1
提问于2017-06-04
得票数 0
1
回答
如何在python中从odt
xml
文件中检索数据?
我正在成功地检索python中的odt
xml
文件,但是我不知道如何提取
xml
文件数据?下面是我提取odt
xml
文件的代码 print "input.odt & output.
xml
"sys.argv[1]) listoffiles = myfile.in
浏览 6
提问于2013-03-26
得票数 1
2
回答
美丽的Soup find_all()返回奇怪的标签而不是结果
、
、
我正在使用Beautiful从
XML
文件中获取一些信息,如下所示:<link>example.com/rss</link>这是我目前正试图读取的整个
XML
文件,用于测试目的。编辑:包括用于
解析
的代码:
浏览 5
提问于2014-10-05
得票数 2
回答已采纳
1
回答
意外重命名文件中的字段
、
、
、
、
我使用Python 4/lxml
解析
xml
格式的RSS提要(特别是)。我发现,在从接收页面数据的请求到从文本读取页面数据的BS4转换过程中,链接字段的名称正在被更改。,BS4无法正确
解析
该...</saleends><link/>https://foo.itch.io/bar<description>...。我的代码是可用的,第237行。为了便于测试,我可以提供一个精简的项目版本,无需登录
和
日志记录。用简化的代码编辑: impo
浏览 2
提问于2020-11-03
得票数 0
回答已采纳
1
回答
Python
BeautifulSoup
给出了不同的结果
、
、
、
、
我正在尝试使用
xml
解析
一个
BeautifulSoup
文件。考虑一个sampleinpt
xml
文件如下:<DOCNO>1</DOCNO>from bs4 import
BeautifulSoup
z = open("filen
浏览 0
提问于2015-06-06
得票数 1
回答已采纳
2
回答
如何在
xml
文件python中查找父元素
、
我正在寻找与python中的
XML
相关的问题的解决方案。我有一个
xml
文件 -<Array name="Pre-defined Error Field"> <Index>4099</Index
浏览 2
提问于2014-04-16
得票数 0
2
回答
如何导航到
BeautifulSoup
对象中的特定标记?
、
、
edgar/data/789019/000106299321002323/0001062993-21-002323.txt"soup =
BeautifulSoup
如果nonDerivativeTable有值
和
标记,而不仅仅是标记,test = soup.nonDerivativeTable.nonderivativetransaction会起作用吗?
浏览 5
提问于2021-04-28
得票数 0
回答已采纳
5
回答
我可以改变
BeautifulSoup
将
XML
标签转换为小写的行为吗?
、
、
我正在编写代码来
解析
用
XML
编写的配置文件,其中
XML
标记大小写混合,而且大小写很重要。Beautiful默认情况下会将
XML
标记转换为小写,我想要更改此行为。 我不是第一个问这个问题的人[参见]。然而,我不理解这个问题的答案,并且在
BeautifulSoup
-3.1.0.1中,
BeautifulSoup
.py似乎没有包含任何"encodedName“或"Tag.__str__”的实例。
浏览 2
提问于2009-05-21
得票数 8
回答已采纳
1
回答
覆盖
xml
根目录,但保留标题注释
、
、
、
我设置了一个脚本来使用Python中的lxml库中的parse来读取
xml
文件,并提供了一些逻辑来删除指定的属性。我想重写
xml
元素,但保留标题注释。 Example.
xml
<?
xml
version="1.0" encoding="utf-8"?> <!文件,这样Example.
xml
看起来就像这样: <?
xml
version="1.0" encoding="utf-8"?>
浏览 11
提问于2021-10-29
得票数 0
1
回答
带有find_all标记名的
BeautifulSoup
4
、
我试图用
BeautifulSoup
4.4.0刮一个camelCase中有标记名的
xml
文件,而find_all似乎找不到它们。示例代码:<hello></hello>soup =
BeautifulSoup
(
xml
, "lxml") for x in sou
浏览 0
提问于2015-07-21
得票数 7
回答已采纳
4
回答
如何使用
BeautifulSoup
访问带名称空间的
XML
元素?
、
、
、
、
我有一个
XML
文档,如下所示:<web:Web><web:Offset>0</web:Offset></
xml
> 我的问题是如何在python中使用像
BeautifulSoup
这样的库来访问它们?
浏览 0
提问于2010-06-17
得票数 12
回答已采纳
1
回答
如何使用漂亮的SOUP4呈现内联元素
、
下面是用来实现它的函数 def transform_img_to_confluence(soup): return
BeautifulSoup
os.path.basename(path) img.replace_with(image_tag) soup =
BeautifulSoup
(带有开始
和
结束标记的ri:attachment ) <ac
浏览 17
提问于2021-11-03
得票数 0
回答已采纳
1
回答
Python BS4与SDMX
、
、
、
、
我尝试使用
BeautifulSoup
,但它似乎看不到标签。在下面的代码中from bs4 import
BeautifulSoup
html_source = urllib2.urlopen(url).read() soup =
Beauti
浏览 13
提问于2016-09-16
得票数 1
回答已采纳
1
回答
为什么漂亮汤没有正确
解析
元素名为"area"?
、
、
、
我正在编写一个使用beautiful soup
解析
xml
文档的python脚本。有些文档包含名为"area“的元素。由于某些原因,我无法正确地
解析
这些元素。它们总是作为空的<area/>元素出现。/usr/bin/python3.5<?
xml
version = '1.0
浏览 4
提问于2017-11-23
得票数 2
回答已采纳
2
回答
当
xml
标记名包含大写字母时,
BeautifulSoup
引发AttributeError。
、
、
、
我正在尝试获取标记Name的所有
XML
属性。获取此错误:当我执行以下代码时:<Product Code="1" HighPic="http://upload.wikimedia.org/wikipedia/
浏览 3
提问于2014-02-04
得票数 1
回答已采纳
1
回答
BeautifulSoup
缺少标签的部分
、
、
、
我正在使用
BeautifulSoup
处理
XML
,但出于某种原因,它跳过了部分param标记。我试图更改
解析
器(html.parser / html5lib / lxml),但它们都有相同的输出。import requests soup =
BeautifulSoup
(source, "lxml")param_name") print(p
浏览 2
提问于2021-12-27
得票数 0
1
回答
BS4:区分大小写的搜索
、
、
>
和
标记<A href=...>。我只想得到<A href=..>格式的标签。谢谢你的建议。
浏览 5
提问于2014-08-03
得票数 0
回答已采纳
2
回答
为什么
BeautifulSoup
要重新格式化我的
XML
?
、
、
、
XML
。然而,
BeautifulSoup
“认为”我有标记<b>,在它之后(关闭之后)我有另一个标记<b>。因此,标签不被认为是嵌套在一起的。为什么会这样呢?添加了
xml
= u'<aaa><bbb>In Body<bbb>Second level</bbb></bbb></aaa>' soup =
BeautifulSoup</em
浏览 1
提问于2015-02-22
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python对XML和HTML的解析
Python爬虫之BeautifulSoup解析之路
Python3 XML 数据解析|Python XML Parsing
在java中解析xml
BeautifulSoup常用解析库-爬虫干货系列5
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券