Android上学习ARM指令集系列第一篇

打算为入门ARM指令集写点初级文章,没什么远大理想,写到哪里算哪里,权当娱乐罢了。工作中经常碰到crash的问题,如果是debug版本,那还好, 调试信息多。万一Release给QA甚至客户之后,再发现crash之类的问题,要不熟悉ARM指令、看不懂现场那就麻烦了。

环境准备:现在的学习环境可真是方便啊,几乎人手一台android手机,而绝大多数手机都是ARM家族的,所以只需要给手机或者平板电脑安装一个 BusyBox,然后拷贝一个ARM 的gdb,再安装一个GCC就可以了。

好了,让我们开始启动学习之旅吧!

首先在平板电脑或者手机上,编辑一个最简单的函数,包含变量分配及初始化:test1.c

#include <stdio.h>

void main()

{

int d = 4;

}

然后编译:arm-linux-gnueabihf-gcc test.c -o test1

然后看看汇编代码:arm-linux-gnueabihf-objdump -D test1;每一句的含义我已经给出详细注释。

首先对输出的文件格式说明,对于如下的输出,左边是程序地址(各种函数地址等等),第二列是指令码的十六进制表示也俗称机器码,剩下的就是给人类看的指令助记符号,举例举例:

835c: b480 push {r7}

这里,835c是main函数的地址,b480是机器码表示的指令,push {r7}就是给我们人类看的了。下面看test1的输出:

0000835c <main>:

程序用到了r7寄存器,所以需要保护以免破坏之前的数据 1 835c: b480 push {r7}

堆栈向下增长栈用的不多,只需要12个字节就够用了: int d需要4个,多出来的8个没有使用 2 835e: b083 sub sp, #12

因为r0-r7是通用寄存器,可以使劲用,堆栈寄存器sp只有没办法的时候才使用。只好用r7 = sp + 0这种笨办法 3 8360: af00 add r7, sp, #0

参与int d = 4这条语句的是r3,这是通用寄存器,spec定义大家都可以用,不需要保护 4 8362: f04f 0304 mov.w r3, #4

把4存储到sp+4所指定的栈里,c语言描述:*(sp + 4) = 4;留给大家思考:为何不顶着sp放置--即*(sp+0)=4? 5 8366: 607b str r3, [r7, #4]

还记得第二条:sub sp, #12吗?此句和下一句是为从堆栈里恢复原来的r7--pop {r7},做准备; 6 8368: f107 070c add.w r7, r7, #12

r7已经是原来的sp了 7 836c: 46bd mov sp, r7

弹出sp指向的内存数据给r7,c语言:r7 = *sp; 8 836e: bc80 pop {r7}

没有调用子函数,即没有使用lr寄存器,所以不需要push lr。跳转到lr地址--进入main函数的下一条地址 9 8370: 4770 bx lr 10 8372: bf00 nop

我们再编辑一个稍微增加一个变量:test2.c

#include <stdio.h>

void main()

{

int d = 4;

char b = 2;

}

0000835c <main>: 1 835c: b480 push {r7} 2 835e: b083 sub sp, #12 3 8360: af00 add r7, sp, #0

4 8362: f04f 0304 mov.w r3, #4

把4存储到sp+0所指定的栈里,c语言描述:*(sp + 0) = 4,注意与上一个例子的区别,这里是顶着stack存放,为什么?

5 8366: 603b str r3, [r7, #0]

6 8368: f04f 0302 mov.w r3, #2

为何要这么任性的存放变量b?

7 836c: 71fb strb r3, [r7, #7] 8 836e: f107 070c add.w r7, r7, #12 9 8372: 46bd mov sp, r7 10 8374: bc80 pop {r7} 11 8376: 4770 bx lr

栈里的数据是这样的,b和d中间隔着好几条街呢:)

原文发布于微信公众号 - 程序员互动联盟(coder_online)

原文发表时间:2015-03-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏LeoXu的博客

Flex笔记_验证用户输入

872
来自专栏信安之路

pydictor 爆破字典生成指南

pydictor 是一个使用 python 语言开发,遵循 GPLv3 协议的开源命令行工具,主要用来帮助安全研究人员生成称心如意的暴力破解字典。

860
来自专栏木子昭的博客

〈详解〉Python3调用C程序

胶水语言 python为什么要调用c c与python对比 python不擅长"大量运算"任务; python程序优势在于:编写简单,适合"I...

2666
来自专栏奔跑的蛙牛技术博客

javaBean 简单理解JavaBean简单及使用

PO:persistant object持久对象,可以看成是与数据库中的表相映射的java对象。最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用P...

784
来自专栏jeremy的技术点滴

使用fail2ban进行DDOS防护

4115
来自专栏向治洪

Android ClassLoader详解

我们知道不管是插件化还是组件化,都是基于系统的ClassLoader来设计的。只不过Android平台上虚拟机运行的是Dex字节码,一种对class文件优化的产...

24810
来自专栏安恒网络空间安全讲武堂

bugkuctf_web_writeup(部分)--下

bugkuctf平台10个较简单的web题目writeup,适合新手入门,可以找来试试http://ctf.bugku.com/bbs 。 本地包含 题目描述:...

4183
来自专栏林冠宏的技术文章

全面总结: Golang 调用 C/C++,例子式教程

Golang 调用 C/C++ 的教程网上很多,就我目前所看到的,个人见解就是比较乱,坑也很多。希望本文能在一定程度上,做到更通俗明了。

882
来自专栏林冠宏的技术文章

全面总结: Golang 调用 C/C++,例子式教程

作者:林冠宏 / 指尖下的幽灵 掘金:https://juejin.im/user/587f0dfe128fe100570ce2d8 博客:htt...

5475
来自专栏程序员互动联盟

【专业技术】在C/C++程序中打印当前函数调用栈

前几天帮同事跟踪的一个程序莫名退出,没有core dump(当然ulimit是打开的)的问题。我们知道,正常情况下,如果程序因为某种异常条件退出的话,应该会产生...

2684

扫码关注云+社区