BeautifulSOUP和OpenStreetMap XML中的嵌套标记和属性_使用BeautifulSoup填充(和标识)空的xml标记_递归显示嵌套的XML和属性PHP - 腾讯云开发者社区

python、xml、beautifulsoup、nodes、openstreetmap

请帮助写有意义的代码的任务:我需要计算所有的标签“的方式”在XML OpenStreet映射文件中，在每个"nd“标签的数量，并输入标签”路“的id，其中包括最大数量的标签"nd”。(我只认为使用词汇表会很有用)这是代码： from urllib.request import urlopen, urlretrieve from bs4 import BeautifulSoupresp = urlopen(

浏览 22提问于2020-07-29得票数 1

回答已采纳

3回答

使用XSLT过滤非引用成员节点

xml、xslt

OpenStreetMap xml文档(除其他外)由一组“节点”元素和一组“方式”元素组成。这里有一个例子： <?xml version="1.0" enco

浏览 3提问于2012-05-23得票数 2

回答已采纳

2回答

为什么BeautifulSoup要重新格式化我的XML？

python、xml、parsing、beautifulsoup

我所做的工作如下：html = u'<body>In BodySecond level</body>' soup =最初，我有一个标签，它包含一些文本(In Body)，然后它包含另一个标记。然而，BeautifulSoup“认为”我有标记，在它之

浏览 1提问于2015-02-22得票数 2

回答已采纳

2回答

如何导航到BeautifulSoup对象中的特定标记？

python、xml、beautifulsoup

链接到我正在使用的url：response = requests.get(new_url)所有顶级标记(没有父标记的标记)似乎都是可访问

浏览 5提问于2021-04-28得票数 0

回答已采纳

1回答

从xml获取标记名

python、xml、beautifulsoup

我有这样一个结构的文件：The gateway only supports upto 10 rules.</pwACL> Batch Number我想要获取标签名称和标签之间的数据。我尝试使用BeatifulSoup HTMLParser库，但它会自动将标记名转换为小写。我发现有一种可能性可以使用html5lib创建树与美丽的汤树构建器如下： parser = html5lib.HT

浏览 1提问于2017-06-04得票数 0

1回答

解析XML时删除HTML标记的优美汤

python、html、xml、beautifulsoup

我在XML文档中嵌套了一些HTML，嵌套在其他更深层次的嵌套标记之间，这些标记仍然包含HTML、BODY和HEAD标记，但是Beautifulsoup正在删除/更改它们。有没有办法防止BS破坏这些标签的顺序？html1 = """ <?xml version="1.0&q

浏览 2提问于2014-04-02得票数 0

回答已采纳

2回答

当xml标记名包含大写字母时，BeautifulSoup引发AttributeError。

python、xml、google-app-engine、beautifulsoup

我正在尝试获取标记Name的所有XML属性。获取此错误：当我执行以下代码时：<Product Code="1" HighPic="http://upload.wikime

浏览 3提问于2014-02-04得票数 1

回答已采纳

2回答

漂亮的Soup解析XML文件

python、beautifulsoup

我正在使用Beautiful编写一个简单的Python来解析我需要的xml文件中的数据。它的工作方式，我需要它，但我有一个要求你们，因为我已经尝试谷歌这个，但似乎找不到我在寻找什么。XML字符串示例： <ProductAttribute MaintenanceType="C" AttributeID="Attachment Type" PADBAttribute="N" RecordNumber当我写<e

浏览 0提问于2018-05-01得票数 2

1回答

美汤低大写标签默认？

python、beautifulsoup、lxml

我用的是LXML和漂亮汤。我有一个带有大写标记的XML文档。当我使用BeautifulSoup时，它似乎是小写的标签名称，这使我使用的find_all不直观。BS真的是这样做的，还是发生了其他事情？soup = BeautifulSoup( features= 'lxml', # 'html5lib', # 'html.par

浏览 2提问于2022-05-25得票数 0

1回答

Python:访问xml文件中的嵌套子元素

python、xml、celementtree

我有一个xml文件的结构如下： </placeName>和python代码来解析它：parse_file =当我想迭代这个元素时 <placeName xml:id="ene.3&q

浏览 1提问于2019-03-21得票数 0

1回答

使用BeautifulSoup抓取标记和XML文件的属性

python、pandas、beautifulsoup

拜托，我需要一些Python的帮助。我有可折叠的结果XML。print(bloc_elements) <a>data_a</a><c>data_c</c></Bloc>List into CSV file : a b c

浏览 5提问于2021-01-09得票数 0

1回答

解析嵌套在XML文件中的超文本标记语言(使用BeautifulSoup)

python、html、xml、parsing、beautifulsoup

我正在尝试解析description字段中包含超文本标记语言的XML文件中的一些数据。>从bs4导入BeautifulSoupdescContent = soup.find_all我不确定哪里出错了；当我枚举descContent中的条目时，它显示了我正在寻

浏览 3提问于2018-05-20得票数 1

1回答

Python: BeautifulSoup在读取时会自动更改文本？

python、xml、xml-parsing、beautifulsoup

我正在使用BeautifulSoup对XML文件进行更改，但我注意到，如果我读取该文件，将其放入构造函数，然后在不对其进行任何更改的情况下将其吐出，BeautifulSoup已经对代码进行了一些更改。例如，标记和属性名称都是小写的，标签中属性的顺序也会改变。实际上，我知道这不应该是一个问题，但是必须读取XML文件的程序非常挑剔，不会接受这些更改。我发现我可以在不

浏览 3提问于2014-07-19得票数 2

回答已采纳

3回答

如何使用BeautifulSoup删除嵌套标记中的内容？

python、html、nested、beautifulsoup

如何使用BeautifulSoup删除嵌套标记中的内容？这些帖子显示了反向检索嵌套标记中的内容：和>>> from bs4 import BeautifulSoup as bs>>> bs(html)

浏览 0提问于2014-02-13得票数 3

回答已采纳

2回答

使用Python中的BeautifulSoup识别和替换XML的元素

python、xml-parsing、beautifulsoup

我试图使用BeautifulSoup4来查找和替换XML中的特定元素。更具体地说，我希望找到“file_name”的所有实例(在下面的文件名为“Cyp26A1_atRA_minus_tet_plus.txt”的示例中)，并将其替换为该文档的完整路径--该路径保存在“file_name_replacement_dir”变量中。因此，上面的XML片段重复了44次，只是在"File“行中

浏览 1提问于2015-06-26得票数 2

回答已采纳

1回答

修复格式错误的xml时出现内存错误

python、beautifulsoup、lxml、elementtree、large-files

我有一些格式错误的非常大的XML --它缺少顶级标记，并且有重复的属性。为了解决这个问题，我在格式错误的XML的一个子集上测试了以下解决方案，它可以很好地添加标记并使用BeautifulSoup自动删除重复的属性。import sysimport xml.etree.

浏览 0提问于2020-02-20得票数 0

1回答

解析XML并使用XML元素重写文件名

python、xml、web-scraping、automation

我正在尝试解析XML并重命名原始XML，使用它的一个子元素，特别是作为要覆盖的XML的文件名的前缀。在下面的示例XML中，我希望提取" to“元素，并将其名称"Tove”插入到新编写的XML文件名中。如果原始文件名为"reminder.xml"，是否可以解析名称"Tove“并将其插入到新编写的名为

浏览 11提问于2020-04-22得票数 1

回答已采纳

1回答

python中的漂亮汤xml格式设置

python、xml、beautifulsoup

我有一个xml数据集标记，格式如下：我认为，当他们创建数据集时，他们没有按必须设置id属性的格式：但是，当在python中通过Beautiful库时，如下所示： s

浏览 1提问于2017-03-30得票数 1

回答已采纳

3回答

从HTML字符串中删除所有div标签

python、regex

我正在试着去掉所有的div。111 所需输出：我试过了，但不起作用： release_conten

浏览 3提问于2013-04-04得票数 2

回答已采纳

1回答

BeautifulSoup从文本<TYPE>中删除

python、parsing、beautifulsoup

我需要从标记<TYPE>EX和</TEXT>以及<TYPE>XML和</TEXT>之间的文本中删除所有部分。我正在考虑使用regex如下：和 re.sub(r"(?is)<TYPE>XML[^>]*>(.*?)如何使用Bea

浏览 1提问于2014-11-20得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云