我使用Python工具检索Twitter数据,并将这些数据以JSON格式转储到我的磁盘上。我注意到一个用双引号括起来的tweet的整个数据字符串的意外转义。此外,实际JSON格式的所有双引号都使用反斜杠进行转义。
它们看起来像这样:
"{\"created_at\":\"Fri Aug 08 11:04:40 +0000 2014\",\"id\":497699913925292032,
我该如何避免这种情况?它应该是:
{"created_at":"Fri Aug 08 11:04:40 +0000 2014“.....
我的文件输出代码如下所示:
with io.open('data'+self.timestamp+'.txt', 'a', encoding='utf-8') as f:
f.write(unicode(json.dumps(data, ensure_ascii=False)))
f.write(unicode('\n'))
在以后的处理步骤中读入JSON文件时,意外的转义会导致问题。
https://stackoverflow.com/questions/25242262
复制相似问题