使用ElementTree解析同名XML子标签_使用python ElementTree: ParseError: mismatched标签解析XML_在swift中解析同名的XML子标签 - 腾讯云开发者社区

、、、

我正在解析一个XML文件，该文件太大，无法完全加载到内存中，所以我使用一个xml.etree.ElementTree.iterparse来解析它。我遇到的问题是，有时候，当我从迭代器中检索一个元素时，我会发现ElementTree提交了我的XML文件中的一些信息。这是预期的行为吗？一个例子 ... <car> <engine> <part name="pump"\> <part name="ECU"\> </engine> </car> .

浏览 3提问于2021-01-28得票数 0

回答已采纳

1回答

使用Python调试xml ElementTrees

、、

我有一个XML字符串 xml_str = '<Foo><Bar>burp</Bar></Foo>' 我正在用xml etree解析它 import xml.etree.ElementTree as ET root_element = ET.fromstring(xml_str) 这将创建一个Element对象(Root_element)，其中包含标签、尾部、文本和属性值。我可以在调试时看到所有的代码。但是，我在调试时看不到任何子元素。我知道孩子在那里，因为我可以在for循环中访问它们。 for child in root_elem

浏览 0提问于2019-10-17得票数 1

1回答

xml.etree.ElementTree.ParseError:由于脚本中的"<“符号，格式不正确(无效令牌)

、、

我试图解析网页，以保存一些数据在excel或csv文件中。 import urllib.request import xml.etree.ElementTree as ET url = "http://rusdrama.com/afisha" response = urllib.request.urlopen(url) content = response.read() root = ET.fromstring(content) 当使用error字符串方法ElementTree解析页面时，我得到了以下错误： Traceback (most recent call last):

浏览 0提问于2016-11-16得票数 2

回答已采纳

1回答

对象在解析xml时没有属性“text”。

、、

我使用ElementTree解析一个简单的xml字符串： <string xmlns="http://schemas.microsoft.com/2003/10/Serialization/">maison</string> 这就是根源。我只想把标签的内容转换成json。“翻译”是xml文本。 tree = ET.ElementTree(translation) root = tree.getroot() return root.text 它看起来很简单，但却抛出了“Object无属性'text‘”错误。我做错了

浏览 2提问于2014-10-21得票数 0

回答已采纳

2回答

在Python中使用元素树进行XML解析

、、

我正在使用Python和ElementTree来解析XML文件。我希望能够制作一个包含所有CD信息的字典列表。稍后我可以使用这个列表来收集信息，比如显示来自美国的CD的标题。下面的代码正在运行，但如果YEAR标记不是CD的最后一个标记，则很容易被破坏。我如何重写这段代码，使标签可以按任意顺序排列？ from xml.etree.ElementTree import ElementTree f = open("cd_catalog.xml") tree = ElementTree() tree.parse(f) catalog = [] cd = {} for node in

浏览 2提问于2012-08-13得票数 0

回答已采纳

4回答

Python:在尽可能保存布局的同时使用ElementTree更新XML文件

、

我有一个文档，它使用了一个XML命名空间，我想为此增加一个/group/house/dogs：(文件名为houses.xml) <?xml version="1.0"?> <group xmlns="http://dogs.house.local"> <house> <id>2821</id> <dogs>2</dogs> </house> </group> 我使用下面代码的当前结果是：(创建

浏览 7提问于2012-03-06得票数 15

回答已采纳

2回答

Clojure等同于Python的lxml库吗？

、、、

我正在寻找与Python的lxml库等效的Clojure/Java。我过去曾大量使用它来解析各种html (作为BeautifulSoup的替代品)，而且能够使用同样的elementtree api for xml也很棒--真的是一个值得信赖的朋友！有人能推荐一个类似的Java/Clojure库吗？关于lxml lxml是一个基于libxml2的xml和html处理库。它可以很好地处理损坏的html页面，因此非常适合屏幕抓取任务。它还实现了xpath，因此ElementTree /html结构被表示为一个树对象，完全支持xpath和CSS选择器等。它也有一些非常方便的实用功能，比如

浏览 2提问于2009-10-14得票数 10

回答已采纳

1回答

Python: xml.etree.ElementTree.tostring错误

、

我使用xml.etree.ElementTree.tostring()将etree元素转换为字符串。但有时我会有问题： xpath = "..." htmlparser = etree.HTMLParser() tree = etree.parse(response, htmlparser) result = tree.xpath(xpath) xml.etree.ElementTree.tostring(result[0], encoding='utf-8') 错误是： File "../abc.py", line 165, in abc

浏览 10提问于2013-04-23得票数 2

回答已采纳

3回答

在python中解析XML文件

、、

import requests import xml.etree.ElementTree as ET def abc(area_code, office_code): args = area_code + office_code url = (described bellow) r = requests.get(url=url) tree=ET.ElementTree() parsed_data=tree.parse(r.content) return parsed_data abc(&#

浏览 1提问于2017-07-08得票数 0

1回答

编辑XML\HTML时取消转义"&amp“

、、、

我有一个函数，它接受一个名为label的参数。然后，此标签用于替换使用ElementTree的元素"assignedNode“的内容。该函数遍历目录中的所有xml文件，并将"label“参数写入元素内容。我的"label“参数包含和"&”符号，但当ET将其写入xml文件时，它显示为"&“。有没有人可以教我如何取消转义这个字符并强制它写"&“符号？下面是我的代码： def apply_label(label): clone_path = os.getcwd() for root, dirs, files in os

浏览 0提问于2015-11-03得票数 0

1回答

将xml打印到控制台(xml.etree.ElementTree)

、、

我需要将xml打印到控制台，这是我从响应中收到的： import xml.etree.ElementTree as ET xml = req.text result = ET.ElementTree(ET.fromstring(xml)) rough_string = ET.tostring(result, "utf-8") reparsed = minidom.parseString(rough_string) print reparsed.toprettyxml(indent="\t") 错误： AttributeError: '

浏览 2提问于2014-08-21得票数 3

回答已采纳

1回答

使用Python解析器在另一个ElementTree中导入

、、

是否可以使用Python ElementTree.parse加载一个xml文件，然后再导入另一个xml文件？例如:我有一个包含以下内容的文件test.xml： <TestXml> <!DOCTYPE doc [ <!ENTITY otherFile SYSTEM "test_1.xml"> ]> </TestXml> 我还有test_1.xml，它包含： <test>it works!</test> 我想在我的python脚本中加载test.xml： from xml.et

浏览 1提问于2014-11-26得票数 1

2回答

Urllib与elementtree结合在一起

、、、

在使用标准Python库中的ElementTree模块解析简单的超文本标记语言时，我遇到了一些问题。这是我的源代码： from urllib.request import urlopen from xml.etree.ElementTree import ElementTree import sys def main(): site = urlopen("http://1gabba.in/genre/hardstyle") try: html = site.read().decode('utf-8') xml

浏览 1提问于2012-03-13得票数 1

回答已采纳

2回答

python的ElementTree找不到子标记

、、、、

我试图用XML从Python文件中用ElementTree访问一个元素，但是它找不到。 XML代码： <item> <id>12345678</id> <subs> <sub category="A"> <name>Name 1 text</name> <file>File 1 text</file> </sub>

浏览 5提问于2020-04-30得票数 0

1回答

如何在xml.etree.ElementTree解析的其他属性上使用“列表”对象

、

请告诉我怎么做？我想接收所有孩子"alarmTime“的文本和标签。但是，我得到了一个错误。如何分配属性‘列表’？或者告诉我如何避免这个错误。我的代码是： import xml.etree.ElementTree as ET tree = ET.parse('sample.xml') root = tree.getroot() for elem in root.iter(tag ='alarmTime'): data = elem.getchildren() print(data.text) 错误是： AttributeEr

浏览 1提问于2018-02-15得票数 0

回答已采纳

1回答

向嵌套字典中的内部列表追加新值

我正在解析一个XML文件，我需要填充一个嵌套的字典，其中内部字典的键指向一个列表对象。每次迭代时，我都需要向内部列表追加一个新值。示例XML <entry name = 'Europe'> <entry name = 'Spain'> <from>'Madrid'</from> <from>'Barcelona'</from> <entry name = 'Nederland'> <from&

浏览 0提问于2020-03-20得票数 0

1回答

找不到XML标记

从CDATA提取XML之后，我无法在提取的XML中找到标记。如果我转换为string，然后返回到一个ElementTree，我可以找到我正在寻找的标记(取消注释标记为“un注释ME”的行)。寻找一种更好/更正确的方法。 import xml.etree.ElementTree as ElementTree XML = '''<?xml version="1.0" encoding="UTF-8"?> <Catalog> <Data><![CDATA[ &l

浏览 7提问于2022-02-09得票数 0

回答已采纳

1回答

线程之间的对象共享会产生NoneType

、、

背景：我正在开发一个web爬虫，它生成7个线程，每个线程用于查询XML文件的唯一URL。当每个查询接收到响应时，它会将该响应转换为XML树，如下所示： conn = http.client.HTTPSConnection(host = uHost, port = uPort) conn.request('GET', url = '/some/url/file.xml') resp = conn.getresponse() tree = xml.etree.ElementTree.parse(resp) 当每个线程启动时，都会给它一个queue.Queue()作

浏览 4提问于2017-10-20得票数 0

2回答

Python解析html错误标记错误

、、

30 <li class="start_1"> 31 <input type="checkbox" name="word_ids[]" value="34" class="list_check"> 32 </li> 这是我想解析的html文件的一部分。但当我申请 uh = open('1.htm','r') data = uh.read() print data tree = ET.froms

浏览 2提问于2016-09-25得票数 0

1回答

在python中获取xml标记中的所有嵌套子元素。

、、、

我有一个具有以下内容的xml.etree.ElementTree对象。 <html> <body> <c> <winforms> <type-conversion> <opacity> </opacity> </type-conversion> </winforms> </c> </body> </html> <html> <body> <css>

浏览 1提问于2016-02-20得票数 0

回答已采纳

1回答

无法使用ElementTree删除元素/节点

、、、、

我和ElementTree有个问题，我不太明白。我已经阅读了他们的所有文件，以及我可以在这个论坛上找到的所有信息。我有几个元素/节点正在尝试使用ElementTree删除。下面的代码没有任何错误，但是当我查看我编写的更改的输出文件时，我希望删除的元素/节点仍然存在。我有一份像这样的文件： <data> <config> <script filename="test1.txt"></script> <documentation filename="test2.txt"></scr

浏览 0提问于2015-03-26得票数 0

回答已采纳

5回答

在python中通过xml.etree.ElementTree生成的xml文件中插入换行

、

我已经在python中使用xml.etree.ElementTree创建了一个xml文件。然后我使用 tree.write(filename, "UTF-8") 若要将文档写出到文件，请执行以下操作。但是当我使用文本编辑器打开filename时，标签之间没有换行符。一切都是一条很长的线如何以“漂亮的打印”格式写出文档，以便在所有xml标记之间有新的行(希望还有缩进等)？

浏览 2提问于2010-06-23得票数 54

回答已采纳

1回答

使用ElementTree访问xml文件中的元素和标记

、、、、

非常感谢您的阅读。我为这样一个初学者的问题道歉，因为我确信这是一个简单的答案。任何指导都是非常感谢的。我有一个用ElementTree解析的xml文件，它的元素如下所示： data.xml: <?xml version="1.0" encoding="utf-8"?><listings><listing id="26496000" dateFirstListed="2012-10-13" dateLastListed="2013-10-06" market="SALE"

浏览 0提问于2017-04-21得票数 3

回答已采纳

2回答

用xml.etree.ElementTree解析XML1.1控制字符

、、、

在Python中，我正在解析包含控制字符的XML： import xml.etree.ElementTree as ET tree = ET.fromstring('<?xml version="1.1" encoding="UTF-8"?><field>foo  bar</field>') print(tree.text) XML 1.1允许使用控制字符，但解析失败。是不是我遗漏了什么，或者xml.etree.ElementTree不支持这样的控制字符？

浏览 4提问于2020-04-15得票数 1

1回答

带有命名空间的python process xml字符串

、、

我有以下带有名称空间的XML。 <ns:loginResponse xmlns:ns="http://sumo.fsg.gre.ac.uk"> <ns:return xmlns:ax21="http://sumo.fsg.gre.ac.uk/xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"xsi:type="ax21:Authorisation_LoginResults"> <ax21:key>key&

浏览 29提问于2019-09-25得票数 1

回答已采纳

1回答

如何删除特定标签

、

我有以下XML文件： <book> <bookname child="test"> <text> Works </text> <text> Doesn't work </text> </bookname> </book> 这只是一个区块，有多个<bookname>标签。我需要遍历整个文档并删除特定的<text>标记。我该怎么做？我的方法是首先创建一个ElementTree，然后使用ElementTree.getroot()获取一个Elem

浏览 0提问于2010-06-24得票数 1

回答已采纳

1回答

解析包含和使用Python的HTML页面

、、

我试图使用urllib2和ElementTree在python中解析HTML页面，并且我在解析该HTML时遇到了困难。在引用的字符串中包含"&“，但ElementTree为包含&的行抛出parseError。剧本： import urllib2 url = 'http://eciresults.nic.in/ConstituencywiseU011.htm' req = urllib2.Request(url, headers={'Content-type': 'text/xml'}) r = urllib2.urlo

浏览 6提问于2014-05-17得票数 3

回答已采纳

2回答

如何解析包含HTML实体的XML？

、、

我有一个脚本，它将XML作为字符串，并尝试使用xml解析它。下面是我正在使用的代码的示例 from xml.etree.ElementTree import fromstring my_xml = """ <documents> <record>Hello< &O >World</record> </documents> """ xml = fromstring(my_xml) 当我运行代码时，我会得到一个ParseError Traceba

浏览 4提问于2016-01-29得票数 1

回答已采纳

1回答

ElementTree.parse内存不足

、、

下面的简单Python脚本用作导出后测试，以验证导出的XML是否有效。 from xml.etree import ElementTree try: ElementTree.parse(args[0]) except ElementTree.ParseError as e: raise Exception('%s does not contain valid XML.' % args[0]) 但是，脚本运行完的VM在最近的导出文件中似乎耗尽了内存，该文件的大小约为88 is。但是，在我的本地工作站上对同一个文件运行相同的脚本将在大约30秒内解析该文件，而不会

浏览 8提问于2013-09-02得票数 0

回答已采纳

2回答

使用Python和ElementTree对XML文档进行排序

、、、、

我正在尝试重新组织一些xml文件，这些文件包含完整路由的几个部分，结构如下： <trk> <name>GPSRoute.XML</name> <trkseg> <trkpt lat="37.077882" lon="-112.242785"> <ele>1688.00</ele> <time>2020-04-18T01:56:39.80Z</time> <

浏览 92提问于2020-04-24得票数 0

1回答

OSError：[Errno 36]文件名太长：

、

我需要将网页转换为XML (使用Python )。如果我将URL的内容写入一个文件，那么我可以很好地读取和解析它，但是如果我试图直接从网页读取，则在我的终端中会出现以下错误：文件"./AnimeXML.py"，第22行，在xml = "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/xml/etree/ElementTree.py"，(xmlData)文件ElementTree.parse第1187行，在解析tree.parse(源，解析器)文件"/Library/Fra

浏览 1提问于2015-04-27得票数 9

回答已采纳

1回答

如何将有效的YANG实例数据放入格式良好的XML文档中？

、

我很难组合两件事: YANG数据建模和现成的XML工具。具体来说，当杨模块有了传单到另一个模块时，我无法避免有两个顶级标签。作为一个简化的示例，请考虑这两个阳模型和一些有效的实例数据： a.yang： module a { namespace "aspace"; prefix a; typedef baz-ref { type leafref { path "/a:foo/a:bar/a:baz"; } } container foo { container bar { leaf baz

浏览 5提问于2020-11-03得票数 0

1回答

无法使用xml.etree.ElementTree解析html

、、

我正在尝试解析google.com的xml，但是我得到了一个‘格式不正确’的错误。为什么会这样呢？谢谢 ➜ testing cat code.py from urllib.request import urlopen; from xml.etree.ElementTree import fromstring fromstring(urlopen('https://www.google.com').read().replace(b'<!doctype html>',b'<!DOCTYPE html>')) ➜ test

浏览 66提问于2020-06-10得票数 1

回答已采纳

2回答

XML在根上迭代以通过标记打印元素

、、、、

我有这样一个XML文件：我想迭代一遍，每次标签是<temperature>时，打印出温度。在xml.etree.ElementTree或lxml或其他库中是否有我可以使用的函数？这是我目前的努力，但这只是打印了所有的元素

浏览 5提问于2022-02-25得票数 0

2回答

在python中提取xml标记之间的文本

、

下面有xml字符串，并试图在标记域、receive_time、串行和seqno之间为每个条目标记打印文本。 xml=""" <response status="success" code="19"><result><msg><line>query job enqueued with jobid 19032</line></msg><job>19032</job></result></response> 19032 <

浏览 0提问于2017-11-26得票数 5

回答已采纳

1回答

如何使用lxml解析包含前缀但不包含名称空间声明的XML？

、、、

我有一堆XML文件，它们使用前缀，但没有相应的名称空间声明。像这样的东西： <tal:block tal:condition="foo"> ... </tal:block> 或者： <div i18n:domain="my-app"> ... 我知道这些前缀是从哪里来的，我尝试了以下方法，但没有成功： from lxml import etree as ElementTree ElementTree.register_namespace("i18n", "http://namespaces.zope

浏览 0提问于2012-05-01得票数 6

回答已采纳

1回答

如何在python 3.6.5中通过变量创建子元素

、、、

我的代码是： import xml.etree.ElementTree as ET from lxml import etree var1 = '<name>This is my text</name>' page = etree.Element('first') doc = etree.ElementTree(page) second = etree.SubElement(page, 'second') second.text = var1 doc.write('a.xml', xml_declarati

浏览 0提问于2018-11-16得票数 1

1回答

如何用ElementTree正确解析utf-8xml？

、、、、

我需要帮助来理解为什么用xml.etree.ElementTree解析我的xml文件*会产生以下错误。 *我的测试xml文件包含阿拉伯字符。任务：打开和解析utf8_file.xml文件。我的第一次尝试： import xml.etree.ElementTree as etree with codecs.open('utf8_file.xml', 'r', encoding='utf-8') as utf8_file: xml_tree = etree.parse(utf8_file) 结果1: UnicodeEncodeError:

浏览 5提问于2014-02-11得票数 16

回答已采纳

1回答

使用带有标记的ElementTree从XML检索文本时遇到问题

、、

现在，我有一些使用Biopython和NCBI的"Entrez“API从Pubmed获取XML字符串的代码。我正试图用ElementTree解析XML，以获得页面上的文本。尽管我的BeautifulSoup代码在从站点本身刮取lxml数据时正是这样做的，但我切换到NCBI，因为刮板显然是不允许的。但是现在使用NCBI的XML，我发现ElementTree非常不直观，真的需要一些帮助才能让它正常工作。当然，我也看过其他文章，但大多数帖子都涉及名称空间，在我的例子中，我只想使用XML标记来获取信息。即使是ElementTree文档也不深入(据我所知)。有人能帮我找出在特定标记中而不是在特定

浏览 2提问于2016-05-31得票数 1

2回答

如何解析xml以查找python中以下节点的文本值？

、

假设我有一个示例配置XML文件，如下所示： <?xml version="1.0"?> <note> <to>Tove</to> <infoaboutauthor> <nestedprofile> <aboutme> <gco:CharacterString>I am a 10th grader who likes to play ball.</gco:CharacterString>

浏览 0提问于2012-08-16得票数 0

回答已采纳

1回答

尝试使用python解析xml时出错: xml.etree.ElementTree.ParseError:语法错误:第1行，

、、

在python中，简单地尝试解析XML： import xml.etree.ElementTree as ET data = 'info.xml' tree = ET.fromstring(data) 但是得到了错误： Traceback (most recent call last): File "C:\mesh\try1.py", line 3, in <module> tree = ET.fromstring(data) File "C:\Python27\lib\xml\etree\ElementTree.py", line

浏览 2提问于2016-10-05得票数 1

回答已采纳

1回答

Python3 xml，如何找到这个非命名空间xml元素？

、、

当以下文本加载到ElementTree元素时，如果没有分配给它的命名空间，则查找方法将无法找到其中的一个元素。 import xml.etree.ElementTree as ElementTree xml_text = """ <ns0:Envelope xmlns:ns0="http://schemas.xmlsoap.org/soap/envelope/"><ns0:Body><ns0:Fault><faultcode>a:ActionNotSupported</faultcode>&l

浏览 0提问于2018-12-19得票数 2

回答已采纳

1回答

iShares SP500etf的Excel文件有什么问题？

、、、

我正在尝试解析，它如下所示： <?xml version="1.0"?> <ss:Workbook xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"> <ss:Styles> <ss:Style ss:ID="Default"> <ss:Alignment ss:Horizontal="Left"/> </ss:Style> ... 它似乎是一个旧的XLS类型文件，但它是一个XML文件，但是xml.

浏览 8提问于2021-01-26得票数 1

回答已采纳

1回答

解析荷兰语NDW xml

、、、

我正在尝试解析来自荷兰NDW的XML文件，其中包含许多荷兰高速公路上每分钟的交通速度。我使用这个示例文件：我试图用Python在变量中解析traveltime数据，但我遇到了困难。 from xml.etree import ElementTree import urllib2 url = "http://weburloffile.nl/ndw/Reistijden.xml" response = urllib2.urlopen(url) namespaces = { 'soap': 'http://schemas.xmlsoap.org/so

浏览 11提问于2018-01-16得票数 0

1回答

在python中访问非树形结构的xml数据

、、

我有几个要用python解析的xml文件。我知道python中的ElementTree包，但是我的xml文件不是以树状结构存储的。下面是一个例子 <tag1 attribute1="at1" attribute2="at2">My files are text that I annotated with a tool to create these xml files.</tag1> Some parts of the text are enclosed in an xml tag, whereas others are not. &

浏览 2提问于2017-04-14得票数 0

2回答

Python2.7.16- ImportError:没有名为etree.ElementTree的模块

、、、、

我正在制作一个脚本来执行创建和写入数据到XML文件。错误为no module no module name 我指的是这个堆栈溢出链接。我指的是这个教程，。我仍然不明白解决方案是什么。我试着替换掉 “从元素树导入ElementTree” 至 “从xml.etree导入ElementTree” 它仍然不起作用。 #!/usr/bin/python import xml.etree.ElementTree as xml root = xml.Element("FOLDER") child = xml.Element("File") root.append(chil

浏览 0提问于2019-06-17得票数 1

2回答

如何通过python从一个xml中提取节为多个xml

、、

source.xml <root xxx> <test> <ppp> <ppp> xxx </ppp> <ppp> yyy </ppp> ... ... </ppp> </test> 在ppp中有很多我想将它提取到单个文件中： 1.x

浏览 2提问于2016-12-12得票数 1

回答已采纳

2回答

如何在Python中解析大型文本文件？

、

我正在尝试解析一个大的文本文件。文本文件实际上不是XML文件。如下所示的标签： <tag1> <tagsomedata> text1 </tagsomedata> <text> text some pattern1 </text> </tag1> <tag1> <tagsomedata> text2 </tagsomedata> <text> text some pattern2 </text> </tag1> 以此类推.. 我需要以下形式的输出： t

浏览 1提问于2015-03-25得票数 0

1回答

使用urlib时生成etree错误

、、、

我试图用将一个HTML表解析为python (2.7)。当我尝试使用字符串的前两种方法之一时(如示例中所示)，它的工作原理非常完美。但是，当我试图在etree.xml页面上使用urlib时，我会得到一个错误。我检查了每一个解决方案，我传递的变量也是str。关于下列代码： from lxml import etree import urllib yearurl="http://www.boxofficemojo.com/yearly/chart/?yr=2014&p=.htm" s=urllib.urlopen(yearurl).read() print type (s)

浏览 2提问于2015-12-05得票数 0

回答已采纳

1回答

UTF-8源文件中的ElementTree XML解析

、、、

我有这个带有utf-8编码的XML文件。 <?xml version="1.0" encoding="UTF-8"?> <Items> <Item> <Cikkszam>00008</Cikkszam> <EAN/> <Megjegyzes>BISK</Megjegyzes> <Leiras1>Bisk Ontario, Dakota szappantartóhoz</Leiras1> <Leiras2>műanyag

浏览 2提问于2016-09-08得票数 0