BeautifulSoup和XML解析

、、、

我有一个TEI-XML文件，我只想捕获<p>和<said>标记的内容。因此，给定以下输入： <?xml version="1.0" encoding="UTF-8"?我已经尝试过以下代码： Import BeautifulSoupcontent = [] # Read the XML filewith open("speakers&

浏览 9提问于2021-11-01得票数 0

1回答

BeautifulSoup抑制lxml解析错误？

、、

我使用BeautifulSoup使用lxml解析和导航XML文件。from bs4 import BeautifulSoup soup = BeautifulSoup("<foo><bar>trololo<", "xml")

浏览 7提问于2016-09-16得票数 2

回答已采纳

1回答

从xml获取标记名

、、

</pwACL> Batch Number我想要获取标签名称和标签之间的数据。

浏览 1提问于2017-06-04得票数 0

1回答

如何在python中从odt xml文件中检索数据？

我正在成功地检索python中的odt xml文件，但是我不知道如何提取xml文件数据？下面是我提取odt xml文件的代码 print "input.odt & output.xml"sys.argv[1]) listoffiles = myfile.in

浏览 6提问于2013-03-26得票数 1

2回答

美丽的Soup find_all()返回奇怪的标签而不是结果

、、

我正在使用Beautiful从XML文件中获取一些信息，如下所示：<link>example.com/rss</link>这是我目前正试图读取的整个XML文件，用于测试目的。编辑:包括用于解析的代码：

浏览 5提问于2014-10-05得票数 2

回答已采纳

1回答

我使用Python 4/lxml解析xml格式的RSS提要(特别是)。我发现，在从接收页面数据的请求到从文本读取页面数据的BS4转换过程中，链接字段的名称正在被更改。，BS4无法正确解析该...</saleends><link/>https://foo.itch.io/bar<description>...。我的代码是可用的，第237行。为了便于测试，我可以提供一个精简的项目版本，无需登录和日志记录。用简化的代码编辑： impo

浏览 2提问于2020-11-03得票数 0

回答已采纳

1回答

Python BeautifulSoup给出了不同的结果

、、、、

我正在尝试使用xml解析一个BeautifulSoup文件。考虑一个sampleinpt xml文件如下：<DOCNO>1</DOCNO>from bs4 import BeautifulSoup z = open("filen

浏览 0提问于2015-06-06得票数 1

回答已采纳

2回答

如何在xml文件python中查找父元素

、

我正在寻找与python中的XML相关的问题的解决方案。我有一个xml文件 -<Array name="Pre-defined Error Field"> <Index>4099</Index

浏览 2提问于2014-04-16得票数 0

2回答

如何导航到BeautifulSoup对象中的特定标记？

、、

edgar/data/789019/000106299321002323/0001062993-21-002323.txt"soup = BeautifulSoup如果nonDerivativeTable有值和标记，而不仅仅是标记，test = soup.nonDerivativeTable.nonderivativetransaction会起作用吗？

浏览 5提问于2021-04-28得票数 0

回答已采纳

5回答

我可以改变BeautifulSoup将XML标签转换为小写的行为吗？

、、

我正在编写代码来解析用XML编写的配置文件，其中XML标记大小写混合，而且大小写很重要。Beautiful默认情况下会将XML标记转换为小写，我想要更改此行为。我不是第一个问这个问题的人[参见]。然而，我不理解这个问题的答案，并且在BeautifulSoup-3.1.0.1中，BeautifulSoup.py似乎没有包含任何"encodedName“或"Tag.__str__”的实例。

浏览 2提问于2009-05-21得票数 8

回答已采纳

1回答

覆盖xml根目录，但保留标题注释

、、、

我设置了一个脚本来使用Python中的lxml库中的parse来读取xml文件，并提供了一些逻辑来删除指定的属性。我想重写xml元素，但保留标题注释。 Example.xml <?xml version="1.0" encoding="utf-8"?> <!文件，这样Example.xml看起来就像这样： <?xml version="1.0" encoding="utf-8"?>

浏览 11提问于2021-10-29得票数 0

1回答

带有find_all标记名的BeautifulSoup 4

、

我试图用BeautifulSoup 4.4.0刮一个camelCase中有标记名的xml文件，而find_all似乎找不到它们。示例代码：<hello></hello>soup = BeautifulSoup(xml, "lxml") for x in sou

浏览 0提问于2015-07-21得票数 7

回答已采纳

4回答

如何使用BeautifulSoup访问带名称空间的XML元素？

、、、、

我有一个XML文档，如下所示：<web:Web><web:Offset>0</web:Offset></xml> 我的问题是如何在python中使用像BeautifulSoup这样的库来访问它们？

浏览 0提问于2010-06-17得票数 12

回答已采纳

1回答

如何使用漂亮的SOUP4呈现内联元素

、

下面是用来实现它的函数 def transform_img_to_confluence(soup): return BeautifulSoupos.path.basename(path) img.replace_with(image_tag) soup = BeautifulSoup(带有开始和结束标记的ri:attachment ) <ac

浏览 17提问于2021-11-03得票数 0

回答已采纳

1回答

Python BS4与SDMX

、、、、

我尝试使用BeautifulSoup，但它似乎看不到标签。在下面的代码中from bs4 import BeautifulSoup html_source = urllib2.urlopen(url).read() soup = Beauti

浏览 13提问于2016-09-16得票数 1

回答已采纳

1回答

为什么漂亮汤没有正确解析元素名为"area"？

、、、

我正在编写一个使用beautiful soup解析xml文档的python脚本。有些文档包含名为"area“的元素。由于某些原因，我无法正确地解析这些元素。它们总是作为空的<area/>元素出现。/usr/bin/python3.5<?xml version = '1.0&#

浏览 4提问于2017-11-23得票数 2

回答已采纳

2回答

当xml标记名包含大写字母时，BeautifulSoup引发AttributeError。

、、、

我正在尝试获取标记Name的所有XML属性。获取此错误：当我执行以下代码时：<Product Code="1" HighPic="http://upload.wikimedia.org/wikipedia/

浏览 3提问于2014-02-04得票数 1

回答已采纳

1回答

BeautifulSoup缺少标签的部分

、、、

我正在使用BeautifulSoup处理XML，但出于某种原因，它跳过了部分param标记。我试图更改解析器(html.parser / html5lib / lxml)，但它们都有相同的输出。import requests soup = BeautifulSoup(source, "lxml")param_name") print(p

浏览 2提问于2021-12-27得票数 0

1回答

BS4:区分大小写的搜索

、、

>和标记<A href=...>。我只想得到<A href=..>格式的标签。谢谢你的建议。

浏览 5提问于2014-08-03得票数 0

回答已采纳

2回答

为什么BeautifulSoup要重新格式化我的XML？

、、、

XML。然而，BeautifulSoup“认为”我有标记<b>，在它之后(关闭之后)我有另一个标记<b>。因此，标签不被认为是嵌套在一起的。为什么会这样呢？添加了xml = u'<aaa><bbb>In Body<bbb>Second level</bbb></bbb></aaa>' soup =BeautifulSoup</em

浏览 1提问于2015-02-22得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

BeautifulSoup抑制lxml解析错误？

从xml获取标记名

如何在python中从odt xml文件中检索数据？

美丽的Soup find_all()返回奇怪的标签而不是结果

意外重命名文件中的字段

Python BeautifulSoup给出了不同的结果

如何在xml文件python中查找父元素

如何导航到BeautifulSoup对象中的特定标记？

我可以改变BeautifulSoup将XML标签转换为小写的行为吗？

覆盖xml根目录，但保留标题注释

带有find_all标记名的BeautifulSoup 4

如何使用BeautifulSoup访问带名称空间的XML元素？

如何使用漂亮的SOUP4呈现内联元素

Python BS4与SDMX

为什么漂亮汤没有正确解析元素名为"area"？

当xml标记名包含大写字母时，BeautifulSoup引发AttributeError。

BeautifulSoup缺少标签的部分

BS4:区分大小写的搜索

为什么BeautifulSoup要重新格式化我的XML？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐