【专业技术】Android webkit处理汉字编码问题

在XX项目中解决android webkit处理汉字编码问题的总结

1.问题:

服务器通过302重定向方式发送给客户端重定向地址,地址中的汉字采用原数据方式发送,没有经过任何编码。因为其中存在汉字,所以在android端经过webkit解码编码之后,最终无法正常在服务器端请求正确数据。Android中默认使用utf-8编码。

2.分析:

Android在framework中解析http信息,Request.java的函数readResponse通过AndroidHttpClientConnection.java的函数parseResponseHeader解析response的header部分。

存储数据使用的是org.apache.http.util.CharArrayBuffer中的CharArrayBuffer。使用SessionInputBuffer的readline来读取一行,进行解析。

我们主要关心的是Location部分,因为重定向主要是通过Location的值重新去请求url。Android中也是这么做的,不会去html的body中解析标记A的herf。

读取的每一行都会被传入到Headers.java中进行解析。Location地址被转换为String存储到mHeaders[IDX_LOCATION]中。

在从CharArrayBuffer变成String的时候,有个值得注意的地方,通过String的源码可以看到,如果使用char[]的方式传入给String构造参数,String中不会再次编码(encode),而使用byte[]方式传入的话,会经过编码转化以后存储到String的value中。默认编码方式是utf-8.我们这里的CharArrayBuffer里面为char[]方式,所以直接存储,不会经过编码。

Android会将得到的Location地址存储在Header的String数组中。

Request.java的函数readResponse会在最后调用LoadListener的endData结束解析。

在endData中经过一系列的消息转发之后最终走到doRedirect中,从字面意思也能看出来是重定向。从之前存储的Header中取出Location,然后调用native接口将url传送到webcore jni中调用底层进行url解析。将重新解析过的url返回到java层,最后进行http请求。

3.原因:

问题出在jni中进行解析部分。WebCoreResourceLoader的RedirectedToUrl拿到url后会构造KURL对象,KURL在构造函数中经过init,会进行相应的编码,默认编码方式为utf-8。所以汉字的元数据经过这次编码后变为utf-8编码。返回到java部分进行http请求,所以在抓包中出现的%C2%BA%C3%BA%C3%91%C3%A5%C2%B1%C3%B3是“胡彦斌”的元数据0xba, 0xfa,0xd1, 0xe5, 0xb1, 0xf3经过utf-8编码后的结果。

服务器默认的编码应该是gb2312。所以我们发送给服务器后,服务器将按照gb2312去解析,所以就会出现乱码:潞煤�氓卤贸

4.修改方法:

对整个已经经过utf-8编码的url进行utf-8解码。在KURL中有现成的解码函数,默认解码方式为utf-8.:decodeURLEscapeSequences(String)

基于android4.0

注:webkit中的网络模块为libcurl,android中使用的是自己的网络模块,framework中。

原文发布于微信公众号 - 程序员互动联盟(coder_online)

原文发表时间:2015-05-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏积累沉淀

Python快速学习第十天

11.1 打开文件 open函数用来打开文件,语法如下: open(name[, mode[, buffering]]) open函数使用一个文件名作为唯...

1966
来自专栏PPV课数据科学社区

python多线程编程(2): 线程的创建、启动、挂起和退出

如上一节,python 的threading.Thread类有一个run方法,用于定义线程的功能函数,可以在自己的线程类中覆盖该方法。而创建自己的线程实例后,通...

2186
来自专栏海天一树

小朋友学Java(12):包

包(package)是Java语言提供的一种区别类名字命名空间的机制,它是类的一种文件组织和管理方式、是一组功能相似或相关的类或接口的集合。Java packa...

2786
来自专栏程序员互动联盟

【答疑释惑第十二讲】什么是函数库?

疑惑一 java中如何引入第三方jar包? 方法一、使用Bootstrap Classloader来加载这些类 我们可以在运行时使用如下参数: -Xbootcl...

3388
来自专栏IT笔记

伪静态转发Url Rewrite 3.2.0中文操作手册

手册 由于历史原因,旧版系统采用的struts2框架。基于Action命名以及菜单规范的问题,故临时采用了额Url Rewrite相关功能实现。 本文档基本3....

2916
来自专栏Java帮帮-微信公众号-技术文章全总结

03.线程安全/同步/线程通讯

03.线程安全/同步/线程通讯 一.一个典型的Java线程安全例子 ? ? 上面例子很容易理解,有一张银行卡,里面有1000的余额,程序模拟你和你老婆同时在取款...

3417
来自专栏JAVA技术zhai

干货:Java多线程详解(内附源码)

2354
来自专栏Java编程技术

一个有关定时生产与消费的问题

按照上面的逻辑看的话,每个队列里面最多有一个元素。其实不然,因为在多线程模型中每个线程占用cpu执行的时间是按照时间片来划分的,每个线程执行完自己的时间片后会被...

721
来自专栏逸鹏说道

C# 温故而知新: 线程篇(二) 上

线程池和异步线程 目录: 1 什么是CLR线程池? 2 简单介绍下线程池各个优点的实现细节 3 线程池ThreadPool的常用方法介绍 4 简单理解下异步线程...

3159
来自专栏Java帮帮-微信公众号-技术文章全总结

03.线程安全/同步/线程通讯

03.线程安全/同步/线程通讯 一.一个典型的Java线程安全例子 ? ? 上面例子很容易理解,有一张银行卡,里面有1000的余额,程序模拟你和你老婆同时在取款...

4237

扫码关注云+社区