首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用python读取包含utf-8字符的json文件

使用python读取包含utf-8字符的json文件
EN

Stack Overflow用户
提问于 2021-04-26 17:31:09
回答 1查看 86关注 0票数 0

我有一个包含utf-8编码字符的大型json文件。如何读取此文件并将这些字符转换为更具可读性的版本?我有这样的东西:

代码语言:javascript
运行
复制
{
    "name": "Wroc\u00c5\u0082aw"
}

我想要的是:

代码语言:javascript
运行
复制
{
    "name": "Wrocław"
}
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-04-26 18:22:45

如果您的JSON数据包含像这样的mojibake,您可以通过将字符串转换为拉丁文-1,然后将结果解码为UTF-8来将其转换为正确的Unicode。这颠倒了产生mojibake的任何过程。(字符串来自JSON这一事实无关紧要;这适用于任何这种类型的mojibake字符串。)

代码语言:javascript
运行
复制
>>> s = "Wroc\u00c5\u0082aw"
>>> s.encode('latin-1').decode('utf-8')
'Wrocław'

在一般情况下,您必须对生成mojibake的原因进行反向工程,但这种特殊情况很容易识别和排除故障,因为尤其是拉丁-1编码是显而易见和透明的(每个字节都按其自身进行编码)。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/67264125

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档