Android so的热升级尝试

作者:张志伟

团长:腾讯移动品质中心TMQ

一、So的热升级尝试

在Android代码中,加载so库是通过调用System.loadLibrary函数实现的。但和Android的许多特性一样,只提供了加载,而没有卸载和更换等功能。

为了研究能否实现卸载和升级等功能,首先要了解清楚JNI so加载的流程。网上有很多加载流程的解析,例如《Dalvik虚拟机JNI方法的注册过程分析》(http://blog.csdn.net/luoshengyang/article/details/8923483)这篇文章中分析出的流程:

在以上流程中,使用dlopen加载so之后,会继续调用JNI_Onload函数,通过系统提供的RegisterNatives函数完成一些列初始化,向虚拟机注册so库提供的JNI函数。

So库也可以不实现JNI_Onload函数,而是采用自动查找的方式。

Android虚拟机会在首次调用JNI函数时按照JNI规范的命名规则自动查找。通过分析Android代码,这种方法最终也会调用到上图中的dvmSetNativeFunc等函数,将函数地址保存到虚拟机中供下次调用。

二、卸载及重新加载

如果想要提供热升级的能力,首先要做的是关闭已打开的so文件。但Android虚拟机没有提供unloadLibrary这样的接口,因此需要我们自己自己实现。

根据上一节的分析,loadLibrary在native层加载文件使用的是dlopen,与之对应的系统接口是dlclose。而接下来的RegisterNatives由于没有对应的unRegister,我们暂且先放一放,看看卸载的效果再来处理。

卸载so

提供卸载能力的接口需要完成以下几项任务:

1、找到要卸载so的句柄;

2、调用JNI_OnUnload;

3、调用dlclose卸载。

如下便是我们写出的卸载函数:

其中dlclose调用了2次,因为函数内的dlopen会增加handle的引用计数。

卸载之后如果我们先尝试调用原来的JNI函数,会发生什么事呢?显而易见会出现crash。

究其原因,是由于so在加载或使用时已经在虚拟机中注册了JNI函数的地址,卸载后原地址变为非法地址,导致crash。那我们再重新加载so会发生什么呢?

重新加载so

分析代码可得知,由于so已经使用System.loadLibrary加载过,我们之前在卸载时也没有触及到JNI层,因此重复调用loadLibrary并不会重新加载so。我们可以按照dvmLoadNativeCode的流程,在native层用dlopen重新加载so。

按照之前的分析,很容易就能写出加载函数:

三、问题及解决

重新加载so后,再次调用原来的JNI函数。发现有时候会成功,但有时候也会crash。经过追踪后注意到,报错的函数地址和卸载前一样,但so加载的地址变化了。

由于dlopen加载so时,并不能保证每次都加载在同一地址上。即使能够加载到同一地址,如果升级造成so文件变化,那函数地址也是不准确的。所以要使新的so工作,那我们也必须要设法更新虚拟机已经保存的函数指针,将其指向新加载so的正确地址。

这时候就需要我们之前忽略的RegisterNatives登场了,这个函数可以用来手动注册JNI函数地址。让我们重复与第一节文字相似但含义不同的这段话:

在以上流程中,so库在使用dlopen加载后,还需要调用JNI_Onload函数,通过系统提供的RegisterNatives函数完成一些列初始化,向虚拟机注册新的JNI函数地址。

使用RegisterNatives注册后,即使so的地址发生变化,也能够更新虚拟机中记录的函数地址。

本篇小结

如果想要在运行时更新so,则新的so文件必须要实现JNI_Onload函数,并且在JNI_Onload中调用系统提供的RegisterNatives注册所有的JNI函数,不能使用自动查找JNI函数名的方式。

四、其他问题

以上方案主要解决了so的卸载,重加载和JNI函数调用问题。但除了这些问题之外,so代码的细节上还有许多要注意的地方。

CRASH

卸载so后,除了JNI函数的指针,其它指向so地址的指针也都会失效,包括指向静态变量,常量,native函数的指针等。所有引用到该so地址的指针都需要更新。

内存和资源泄漏

native代码中可能存在各种分配内存和资源的行为,使用以上方法更新so前,如果没有仔细处理这些资源,就会丢失原指针,造成内存泄漏。

1、malloc/mmap/shmem等方式分配的内存。

2、socket, pipe, mutex, thread等各种系统资源。

3、使用NewGlobalRef分配并持有Java对象,丢失指针后会造成虚拟机的Java内存泄漏。

综上所述,对于所有可能丢失,造成泄露的资源,必须在卸载so前设法保存或删除。这些工作可以在卸载时调用的JNI_OnUnload中完成。

关注微信公众号腾讯移动品质中心TMQ,获取更多测试干货!

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Android先生

Android中极简的js与java的交互库-SimpleJavaJsBridge

最近接触android中js与java交互的东西很多,当然它们之间的交互方式有几种,但是我觉得这几种交互方式都存在一定的不足,这是我决定编写SimpleJava...

923
来自专栏Golang语言社区

Goroutine背后的系统知识

Go语言从诞生到普及已经三年了,先行者大都是Web开发的背景,也有了一些普及型的书籍,可系统开发背景的人在学习这些书籍的时候,总有语焉不详的感觉,网上也有若干流...

3316
来自专栏Java帮帮-微信公众号-技术文章全总结

Web-第三十三天 MongoDB初级学习

NoSQL(NoSQL = Not Only SQL ),意即"不仅仅是SQL"。

1542
来自专栏Java帮帮-微信公众号-技术文章全总结

Python常见面试题【悟空教程】

1.MySQL 数据库总结 MySQL 可以建多少个数据库,理论上是没有限制的,每一个数据库可以有上亿的对象,但是一般基于硬件要求、效率问题一般不超过64个, ...

1182
来自专栏代码世界

Python之进程

进程 进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。在早期面向进程设计的计算机...

4487
来自专栏Golang语言社区

goroutine背后的系统知识

Go语言从诞生到普及已经三年了,先行者大都是Web开发的背景,也有了一些普及型的书籍,可系统开发背景的人在学习这些书籍的时候,总有语焉不详的感觉,网上也有若干流...

2605
来自专栏Java Edge

大道缓存1 缓存特征2 缓存介质3 缓存分类和应用场景缓存实战

用户请求从界面(浏览器/App)到网络转发、应用服务再到存储(数据库或文件系统),然后返回到界面呈现内容。

951
来自专栏和蔼的张星的图像处理专栏

1.Win10+VsCode的C/CPP编译环境搭建

我是从开始学C++的时候就一直用的是visual studio,毕竟宇宙第一IDE,写和调试都是超级方便快捷,唯一的缺点可能就是启动慢一点。 之前电脑没有换固...

4146
来自专栏零基础使用Django2.0.1打造在线教育网站

零基础使用Django2.0.1打造在线教育网站(五):简易留言簿交互实现

努力与运动兼备~有任何问题可以加我好友或者关注微信公众号,欢迎交流,我们一起进步!

3268
来自专栏java思维导图

开源项目renren-fast解读,让java不再难懂(二)

1、百度百科的解释: XSS又叫CSS (Cross Site Script) ,跨站脚本攻击。它指的是恶意攻击者往Web页面里插入恶意html代码,当用户浏览...

1974

扫码关注云+社区