前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >UnicodeEncodeError: 'gbk' codec can't encode character解决方法

UnicodeEncodeError: 'gbk' codec can't encode character解决方法

作者头像
Python进阶者
发布2021-10-09 11:18:35
3.7K0
发布2021-10-09 11:18:35
举报
文章被收录于专栏:Python爬虫与数据挖掘

大家好,我是Python进阶者。

前言

前几天有个叫【低端玩家.】的粉丝在Python交流群里问了一道关于requests库请求后,出现编码错误的问题,如下图所示。

粉丝也说了,同样代码,别人都能运行,但是他这个就不行,真是头大。

一、思路

其实问题的关键点就是在于编码和解码的问题,首先要确定网站的编码方式,剩下的就是自己电脑中的Pycharm编码设置的问题了。一般来说,苹果机默认就是utf-8编码,所以苹果机中的编码问题一般比较少,但是其他机型就不好说了,一般默认的编码是gbk,所以需要进行转编码。这也是为什么在苹果机下使用open()函数,不指定编码格式,抓取下来的网页或者数据是不会乱码的,而使用其他机型抓取的情况下,不指定编码,就会乱码的原因所在了。

二、解决方法

他目标网站的编码是utf-8,即<meta charset='utf-8'/> ,我尝试给了他解决方案,使用下方代码进行输出,以为可以一步到位,不过事与愿违。

代码语言:javascript
复制
response.text.encode('utf-8').decode('utf-8')

我看了下他的代码,是没毛病的,而且网页的编码就是utf-8,编码没问题,那么只能是Pycharm中的编码设置的问题了。

在setting里边指定编码为utf-8,就可以解决问题了,如下图所示。

这里设置好之后,然后运行代码,就可以正常跑了,不会出现报错了。

【拓展知识】

下次小伙伴们有遇到类似这种'\u7535\u5546'编码报错问题,确定在Pycharm里边确定为utf-8编码的情况下,可以使用下面的解决方式,小编屡试不爽:

代码语言:javascript
复制
text = '\u7535\u5546'
print(text.encode('utf-8').decode('utf-8'))

好了,今天的文章就分享到这里了,希望对大家的学习有帮助。

三、总结

我是Python进阶者。本文基于粉丝提问,针对编码问题,主要从两个方面进行出发,其一是网页编码,其二是Pycharm编码,顺利解决这个小bug。小编相信小伙伴们在实际敲代码的过程中,肯定还有遇到其他的编码bug,也欢迎大家在评论区谏言。

小伙伴们,快快用实践一下吧!如果在学习过程中,有遇到任何问题,欢迎加我好友,我拉你进Python学习交流群共同探讨学习。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 前几天有个叫【低端玩家.】的粉丝在Python交流群里问了一道关于requests库请求后,出现编码错误的问题,如下图所示。
  • 一、思路
  • 二、解决方法
  • 三、总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档