首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >替换文件中未定义的字符

替换文件中未定义的字符
EN

Stack Overflow用户
提问于 2022-10-05 18:35:35
回答 1查看 47关注 0票数 0
代码语言:javascript
运行
复制
          <ScreenOptions>
            <ScreenOption Visible="true" Locked="false" PrintCode="" DataType="Boolean" Description="Sill Support &lt;br&gt; (Champagne or Mill Finish sill support is always provided when jamb depth &gt; 8-5/8�)" ValueDescription="No" Sequence="1">
              <ComponentAttributeId>622</ComponentAttributeId>
            </ScreenOption>
          </ScreenOptions>

嗨,如何用空值替换这个字符�?

代码语言:javascript
运行
复制
open('decmpresed.txt', 'r') as file :
  filedata = file.read()
print(filedata)
# Replace the target string
filedata = filedata.replace('�', ' ')

# # Write the file out again
with open('decompresed.txt', 'w') as file:
   file.write(filedata)

到目前为止,这段代码还不适用于我,有什么想法吗?

EN

回答 1

Stack Overflow用户

发布于 2022-10-05 18:48:34

您看到的是Unicode替换字符U+FFFD。这意味着您的Unicode XML文件被错误地处理了。每当您看到�符号时,信息就丢失了,无法恢复。没有办法拿回旧的数据。

我的想法是:无论您从哪里获得这个XML,都让它们生成一个正确的XML文件。

您是链中的下一个不了解Unicode的人,您将消除数据已经丢失的明确指示。你在隐藏窃听器。从长远来看,我不认为那会有什么好结果。

打开文件时,可以指定编码。

代码语言:javascript
运行
复制
with open('decmpresed.txt', 'r', encoding='utf-16-le') as file:

或者不管文件编码是什么。一旦你得到正确的编码,替换就会工作。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73964879

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档