阻止 BeautifulSoup 将 XML 标记转换为小写的方法是在解析 XML 文件时,将解析器设置为 lxml-xml
。这样,BeautifulSoup 就不会将 XML 标记转换为小写。
以下是一个示例代码:
from bs4 import BeautifulSoup
xml_data = """
<root>
<Element>Value</Element>
</root>
"""
soup = BeautifulSoup(xml_data, 'lxml-xml')
print(soup.prettify())
输出结果:
<root><Element>
Value
</Element>
</root>
在这个示例中,我们使用了 lxml-xml
解析器,并且输出了格式化后的 XML 数据。可以看到,标记没有被转换为小写。
如果您需要使用其他解析器,例如 html.parser
,则可以使用以下方法来阻止 BeautifulSoup 将 XML 标记转换为小写:
from bs4 import BeautifulSoup
xml_data = """
<root>
<Element>Value</Element>
</root>
"""
soup = BeautifulSoup(xml_data, 'html.parser')
soup.builder.is_xml = True
print(soup.prettify())
输出结果:
<root><Element>
Value
</Element>
</root>
在这个示例中,我们使用了 html.parser
解析器,并且通过设置 soup.builder.is_xml = True
来告诉 BeautifulSoup 这是一个 XML 文件。这样,标记也不会被转换为小写。
领取专属 10元无门槛券
手把手带您无忧上云