使用Python从XML字符串中提取数据_使用Python 3从xml中提取数据_如何使用Python从XML中提取数据 - 腾讯云开发者社区

使用Python从XML字符串中提取数据

基础概念

XML（Extensible Markup Language）是一种标记语言，用于存储和传输数据。它使用标签来定义数据的结构，类似于HTML，但更加灵活和强大。Python提供了多种库来解析和处理XML数据，其中最常用的是xml.etree.ElementTree。

类型

DOM解析：将整个XML文档加载到内存中，形成一个树形结构，适合小型XML文件。
SAX解析：逐行读取XML文档，适合处理大型XML文件，因为它不需要将整个文档加载到内存中。
ElementTree：Python标准库中的一个轻量级XML解析库，结合了DOM和SAX的优点。

应用场景

配置文件：许多应用程序使用XML作为配置文件格式。
数据交换：在不同系统之间传输结构化数据时，XML常被用作中间格式。
文档存储：一些文档管理系统使用XML来存储文档的结构和内容。

示例代码

以下是一个使用xml.etree.ElementTree从XML字符串中提取数据的示例：

import xml.etree.ElementTree as ET

# 示例XML字符串
xml_string = """
<bookstore>
    <book>
        <title>Python Programming</title>
        <author>John Doe</author>
        <year>2020</year>
    </book>
    <book>
        <title>Learning XML</title>
        <author>Jane Smith</author>
        <year>2018</year>
    </book>
</bookstore>
"""

# 解析XML字符串
root = ET.fromstring(xml_string)

# 提取数据
for book in root.findall('book'):
    title = book.find('title').text
    author = book.find('author').text
    year = book.find('year').text
    print(f"Title: {title}, Author: {author}, Year: {year}")