Android 构建过程分析

前言

或许我们都知道Android构建会经历资源合并打包、源码编译、dex生成及打包签名等步骤,可是不是每个人对这些过程中发生的事情都了然于心呢?或许不然,于是带着好奇心开始了对Android gradle plugin的学习,现简要整理一下。

资源合并

如果项目引入了android support包,又或许依赖于其它第三方aar库,那构建前会将aar解压并与本地资源合并,这里的资源主要包括assets目录,res目录及Androidmanifest.xml。

当第三方依赖中的assets或res文件与本地文件有冲突时,会优先选用本地文件。但res/values略有不同,此目录下的strings.xml、color.xml、styles.xml等文件会被整合到一个叫values.xml的文件中去,后与各第三方依赖中的values.xml进行内容上的合并,不会像res其它子目录文件一样直接舍弃第三方冲突文件。

Androidmanifest.xml的合并相比来说则要复杂一些,除了第三方依赖中的manifest,项目还可以在不同目录下分别拥有manifest文件。构建过程中,会根据manifest中元素、属性及赋值来生成一个manifest文件,并应用于后续的打包过程。gradle为不同的manifest赋予了不同的优先级,其顺序如下:

buildType 设置 > productFlavor 设置 > src/main > dependency&library

XML元素及属性的冲突会根据以下规则进行解决:

当然也会有一些例外的:

  • uses-feature android:required与uses-library android:required默认为true,根据or规则合并;
  • 如未指定uses-sdk,minSdkVersion跟targetSdkVersion将被设置为1。而冲突时会使用高优化级的设置;
  • 若library的minSdkVersion高于src/main的设置,则会引发error,但可通过overrideLibrary解决。若未指定targetSdkVersion,则其值与minSdkVersion一致;
  • 若library的targetSdkVersion低于src/main的设置,需要添加一些额外的权限保证library能正常运行;
  • manifest元素只与子manifest元素合并;
  • intent-filter元素在合并中不会被改变,只会被添加到其父节点中去;

冲突发生时,可通过合并冲突标记进行解决,需要引入android tools命名空间,详情请参阅官方文档。另外,manifest在对文件进行合并后,还会根据build.gradle的设置覆盖相关属性。

AAPT打包

资源合并后,即进入到编译阶段,先会把项目资源中的xml编译成二进制并生成R.java及资源索引表resources.arsc,其流程如下:

由图可见,assets是不需要做任何处理的,res/raw只需分配id后与assets一起直接打包到应用程序中;基于下述原因,其它xml文件则会被编译成二进制。

  • 编译过程中,会把xml中的字符串进行收集去重,形成字符串资源池,元素中用到字符串的地方将被替换成相应的索引。另外,标签属性/値都会转换为资源id,进一步减少文件大小;
  • 二进制格式的xml把标签属性/値转换为资源id后,避免了字符串解析,从而提高了解析速度;

经过AAPT(Android Asset Packaging Tool)处理后,会输出2个文件:一个R.java,为项目各资源分配了不同的id,将和java源码一起参与到后续的编译过程,id为4字节无符号整数,最高字节表示package id,次高字节表示type id,后2字节表示资源在当前类型中出现的序号,如R.string.appname=0x7f07006b中的0x7f代表当前正在编译的资源包,0x07代表string类型,0x006b代表app_name在string类型中出现的序号;另一个为app.ap,实际上为一个压缩包,包含了assets、res、Androidmanifest.xml与resources.arsc

资源索引表resources.arsc记录了从资源id到文件路径的转换关系,当应用通过Resources类获取res文件资源时,会先从resources.arsc中拿到文件路径,然后通过AssetManager进行访问。

Application Component -> resources.arsc -> AssetManager -> apk

从上述流程中可以看到,若要进行资源的混淆,可在分析resources.arsc格式后,修改内容中文件路径的指向并对资源文件进行相应的重命名即可。

另外,AAPT还可对png图进行优化、指定文件以stored还是deflated模式添加到压缩包中等操作。

源码编译

当项目中包含aidl时,会先调用aidl工具生成java代码;renderscript亦然,需要先调用llvm-rs-cc,只是它不仅会自动生成java文件,还会产生相应的.bc文件,.bc文件将打包到apk中

至此,java代码都已准备完毕。下一步要进行的是通过javac命令将java源码编译成.class字节码,用以编译的classpath包含以下内容:

  • android.jar,具体版本由targetSdkVersion指定;
  • build.gradle中添加的第三方依赖;

编译后可对代码进行混淆处理,主要包括删除无用类、字节码优化、重命名等操作,只需在build.gradle中配置混淆规则即可

buildTypes {
    release {
        minifyEnabled true
        proguardFiles getDefaultProguardFile('proguard-android.txt')
        proguardFile 'proguard/proguard-rules.pro'
    }
}

生成dex

如果项目涉及分dex,那在调用dx命令前,需要做一些准备的工作,把编译后的class文件打包成jar包allclasses.jar,然后生成主dex中必须包含的文件列表。主要包括collect、shrink及create 3个步骤。

首先会通过Androidmanifest.xml过滤出项目中使用到的四大组件(Activity、Service、receiver、provider)、Application及Instrumentation,并写入manifest_keep.txt文件,这些都是会默认添加到主dex的,无须手动设置。除此之外,默认添加的还有继承于 BackupAgent 及 Annotation 的类。若有额外的类需要被加入到主dex中,可以新建一个文件并以proguard的语法指定,然后在build.gradle中把此文件配置到multiDexKeepProguard中去。此过程关键代码如下:

void generateKeepListFromManifest() {
    SAXParser parser = SAXParserFactory.newInstance().newSAXParser()
    Writer out = new BufferedWriter(new FileWriter(getOutputFile()))    try {
        parser.parse(getManifest(), new ManifestHandler(out))        // add a couple of rules that cannot be easily parsed from the manifest.
        out.write("""-keep public class * extends android.app.backup.BackupAgent {<init>();}
-keep public class * extends java.lang.annotation.Annotation {*;}
""")        if (proguardFile != null) {
            out.write(Files.toString(proguardFile, Charsets.UTF_8))
        }
    } finally {
        out.close()
    }
}

这个时候,会执行一个叫shrinkXxxMultiDexComponents(Xxx为build types名称)的任务。实际上是调用了proguard,只是要比常规的proguard简单一些,不执行混淆、优化跟预检几个步骤,只需要shrink即可,以allclasses.jar为输入、manifest_keep.txt为混淆配置文件,把指定内容及其引用标记起来,然后添加到componentClasses.jar中去。

public void execute(ProGuardTask proguardComponentsTask) {
    proguardComponentsTask.dontobfuscate();
    proguardComponentsTask.dontoptimize();
    proguardComponentsTask.dontpreverify();    // 方法未完,略过...}

到了CreateMainDexList,会调用dx命令,传入allclasses.jar、componentClasses.jar,分析后者依赖,把它直接引用的类也添加到主dex中,并生成新的multidex配置文件maindexlist.txt,至此,准备工作完成。

经过上一阶段编译的处理,已经生成了标准的java字节码,可在标准的java虚拟机上运行。但android使用了它特有的dalvik虚拟机,这就需要我们为它提供另一不同的格式。dx工具为此而出现,可将.classes文件转换添加到dalvik可执行文件.dex中去。当项目发展到一定规模,需要进行分dex处理时,可通过上述步骤生成的maindexlist.txt指定dex该如何拆分。

遗憾的是,以上关于分dex的内容都是理想的情况,现实却很残酷。如果项目中开启了proguard,那它会在分dex的shrink处理前完成,导致allclasses.jar是混淆处理后的代码,而manifest_keep.txt却未曾混淆,后续生成componentClasses.jar 及 maindexlist.txt 的过程也就都不再可靠了。要解决这个问题,在shrink前通过混淆输出的符号表mapping.txt对manifest_keep.txt进行修正是个不错的选择。

打包签名

此时万事俱备,只要把资源包app.ap_、可执行文件classes.dex及项目(包含第三方依赖)中的非源码文件一起添加到压缩包中去,我们的安装包(.apk文件)也就生成了。

另外,apk需要经过签名才可以发布。可通过jarsigner工具完成。

zipalign

文件对齐并非android构建的必要步骤,但对齐处理后可提高系统访问安装包资源的效率。即使执行了zipalign,也只有以stored模式添加到apk中的文件是需要对齐的。如若对图片等资源进行了极限压缩或在aapt打包时选择了deflated,那可对齐的文件也就没多少了

通过build tools中的zipalign工具以下命令可对压缩包进行对齐

zipalign -f -v 4 app.apk toapp.apk

以下命令则起到了检验压缩包有没有对齐的作用:

zipalign -c -v 4 app.apk

总结

本文主要介绍了android构建的各个主要步骤,并重点讲述了资源合并打包与dex生成的过程。最后,用一张图概括下构建的总体流程:

以上内容皆基于Android gradle plugin 1.3.0,新版本插件实现略有差异。若有错漏,望不吝赐教~

原创声明,本文系作者授权云+社区-专栏发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

12 条评论
登录 后参与评论

相关文章

来自专栏python成长之路

返回用户指定页面的web服务器

1346
来自专栏java 成神之路

jvm 性能调优工具之 jmap

36412
来自专栏葡萄城控件技术团队

实战使用Axure设计App,使用WebStorm开发(6) – 迈向后端

 系列文章 实战使用Axure设计App,使用WebStorm开发(1) – 用Axure描述需求 实战使用Axure设计App,使用WebStorm开发(2...

1768
来自专栏云计算与大数据

Linux命令-top

top 命令是 Linux 下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,类似于Windows的任务管理器。

713
来自专栏皮振伟的专栏

[linux][network]bond技术分析

前言: 云计算场景下,经常会使用到bond技术的主备模式。这里分析一下bond技术的原理。 原理: 简单回忆一下IPV4协议栈,以用户发送一个HTTP请求为...

28811
来自专栏天天P图攻城狮

Android减包 - 使用APK Analyzer分析你的APK

本文是对 Analyze Your Build with APK Analyzer 的翻译。 Android Studio 2.2包含了APK Analyzer...

2116
来自专栏程序猿

Burp Suite教程: 第七节 如何使用Burp Spider

存在于Burp Target中的站点信息,我们可以直接传送到Burp Spider中进行站点信息的爬取。这一章我们重点来学习Burp Spide...

2649
来自专栏月牙寂

swarm源码分析(2)---manage流程与store

第一时间获取文章,可以关注本人公众号 月牙寂道长 yueyajidaozhang

3628
来自专栏python3

Django简介

Web服务器开发领域里著名的MVC模式,所谓MVC就是把Web应用分为模型(M),控制器(C)和视图(V)三层,他们之间以一种插件式的、松耦合的方式连接在一起,...

772
来自专栏企鹅号快讯

前端开发人员如何搭建数据库

问题:我怎么才能收到你们公众号平台的推送文章呢? ? 最近有人问我,前端开发人员要存储用户数据,最简单的方法是什么。现在仅关于这部分,我来说明下怎么做。 搭建数...

21710

扫码关注云+社区