首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【hacker的错误集】解决response.text获取中文乱码问题

【hacker的错误集】解决response.text获取中文乱码问题

作者头像
hacker707
发布2022-11-27 09:52:59
5960
发布2022-11-27 09:52:59
举报

✅作者简介:大家好我是hacker707,大家可以叫我hacker 📃个人主页:hacker707的csdn博客 🔥系列专栏:hacker的错误集 💬推荐一款模拟面试、刷题神器👉点击跳转进入网站

在这里插入图片描述
在这里插入图片描述

hacker错误集

错误内容

直接使用以下代码获取内容

import requests

# url = '你的url地址'
url = 'http://www.piaofang.biz/'
response = requests.get(url)
print(response.text)

会出现中文是乱码的情况:

在这里插入图片描述
在这里插入图片描述

错误分析

在获取网页源代码时如果不指定页面所对应的编码格式就会出现中文是乱码的情况,这时需要找到页面所所对应的编码格式 居然:怎么找页面所对应的编码格式啊 hacker:我来教你一种最简单的方法

在你对应的页面鼠标右键点击查看源代码,在源代码中按Ctrl+F查找快捷键搜索charset即可看到页面所对应的编码格式(是gbk就设置为gbk,是utf-8就设置为utf-8

在这里插入图片描述
在这里插入图片描述

解决方案

改正后的代码如下:

import requests

# url = '你的url地址'
url = 'http://www.piaofang.biz/'
response = requests.get(url)
response.encoding = 'gbk'
print(response.text)
在这里插入图片描述
在这里插入图片描述
扩展知识(非常好用)

我们需要人为的去判断页面的编码格式,其实,我们有一个更智能的方法可以解决该问题,就是直接通过代码去获取当前页面的编码即可,代码如下:

import requests

# url = '你的url地址'
url = 'http://www.piaofang.biz/'
response = requests.get(url)
# apparent_encoding是从网页的响应内容分析编码的方式(更加intelligence智能)
response.encoding = response.apparent_encoding
print(response.text)
在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-05-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • hacker错误集
  • 错误内容
    • 错误分析
      • 解决方案
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档