前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python中json和字符编码的转换

python中json和字符编码的转换

作者头像
py3study
发布2020-01-10 16:04:01
3.9K0
发布2020-01-10 16:04:01
举报
文章被收录于专栏:python3

json是用来转换python object 和json format 的,字符编码有gb2312,gb18030/gbk,utf-8等。

在 Python 中出现的 str 都是用字符集编码的 ansi 字符串。Python 本身并不知道 str 的编码,需要由开发者指定正确的字符集 decode。

因为 Python 认为 16 位的 unicode 才是字符的唯一内码,而大家常用的字符集如 gb2312,gb18030/gbk,utf-8,以及 ascii 都是字符的二进制(字节)编码形式。把字符从 unicode 转换成二进制编码,当然是要 encode。

# 从 str 转换成 unicode

print s.decode('utf-8')

# 从 unicode 转换成 str

print u.encode('utf-8') 

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-3: ordinal not in range(128)

json.dump(objfpskipkeys=Falseensure_ascii=Truecheck_circular=Trueallow_nan=Truecls=Noneindent=None,separators=Noneencoding="utf-8"default=Nonesort_keys=False**kw)

Serialize obj as a JSON formatted stream to fp (a .write()-supporting file-like object) using this conversion table.

json.dumps(objskipkeys=Falseensure_ascii=Truecheck_circular=Trueallow_nan=Truecls=Noneindent=None,separators=Noneencoding="utf-8"default=Nonesort_keys=False**kw)

Serialize obj to a JSON formatted str using this conversion table. If ensure_ascii is false, the result may contain non-ASCII characters and the return value may be a unicode instance.

json.load(fp[, encoding[, cls[, object_hook[, parse_float[, parse_int[, parse_constant[, object_pairs_hook[,**kw]]]]]]]])

Deserialize fp (a .read()-supporting file-like object containing a JSON document) to a Python object using thisconversion table.

json.loads(s[, encoding[, cls[, object_hook[, parse_float[, parse_int[, parse_constant[, object_pairs_hook[,**kw]]]]]]]])

Deserialize s (a str or unicode instance containing a JSON document) to a Python object using this conversion table.

json有上面四种function,注意带s和不带s的区别,json.dumps是把python object转换为json format,反之,json.loads是把json str 转换为python object。

python object 有dict , list 等。

下面给出输出一个大的json字符串到文件,并以可读的格式输出。

代码语言:javascript
复制
#!/usr/bin/env python
import urllib2
import json
import sys
url = 'world.taobao.com/search/json.htm'
url = 'http://' + url
keyword = sys.argv[1]
url = url + '?q=' + keyword
print url
request = urllib2.Request(url)
response = urllib2.urlopen(request)
content = response.read()
if isinstance(content, basestring):
        print "content is string"
else:
        print "content is not string"
content = json.loads(content, encoding='gbk')
content = json.dumps(content, encoding='gbk', ensure_ascii=False, indent=4, separators=(',', ': '))
content = content.encode('utf-8')
file = keyword
f = open(file, 'w')
f.write(content)
f.close()
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/08/28 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档