我有一个XML文件,其中包含转义的HTML字符和转义的XML字符,如下所示: <question description="How can I unescape only HTML characterssuch as: Ã and 0,but not special characters such as &"> 如何取消所有HTML字符的转义,并保留以下XML
我正在尝试使用LXML来处理XML文件中的字符串。问题是输出文件无法转义某些特殊字符(例如"\n“和”‘")。默认情况下,xml.sax.saxutils.escape只转义&、<和>,但它确实提供了一个entities参数来另外转义其他字符串。lxml是否在entities参数中为转义提供了同样的灵活性?对于XML: from xml.sax.saxutil
当我发送XML数据时,我将整个字符串包装成一个CDATA-标记(因为我需要在soap消息中发送诸如<和>之类的字符)。但是,如果字符串非常短(例如,小型XML实例),则转义单个字符(例如,< are <)。这不是我想要的,因为这使得处理数据变得非常困难。此外,如果我的字符串包含像&这样的字符,因为我存储了转义文本,这个字符串就会被杀死,成为&。
如何强