专栏首页炉边夜话你的变量究竟存储在什么地方?

你的变量究竟存储在什么地方?

 你的变量究竟存储在什么地方?

作者:杨小华

我相信大家都有过这样的经历,在面试过程中,考官通常会给你一道题目,然后问你某个变量存储在什么地方,在内存中是如何存储的等等一系列问题。不仅仅是在面试中,学校里面的考试也会碰到同样的问题。

如果你还不知道答案,请接着往下看。接下来,我们将在Linux操作系统上,以GCC编译器为例来讲解变量的存储。

在计算机系统中,目标文件通常有三种形式:

1. 可重定位的目标文件:包含二进制代码和数据,与其他可重定位目标文件合并起来,创建一个可执行目标文件。

2. 可执行的目标文件:包含二进制代码和数据,其形式可以被直接拷贝到存储器中并执行

3. 共享目标文件:一种特殊的可重定位目标文件,即我们通常所说的动(静)态链接库

一个典型的可重定位目标文件如下图所示:

高地址

节头部表

.strtab

.line

.debug

.rel.data

.rel.text

.symtab

.bss

.data (3)

.rodata

.text (1)

ELF头

                                                                        0

图 1典型的ELF可重定位目标文件(数字代表索引)

夹在ELF头和节头部表之间的都是节(section),各个节的意思如下:

含义

.text

已编译程序的机器代码

.rodata

只读数据,如pintf和switch语句中的字符串和常量值

.data

已初始化的全局变量

.bss

未初始化的全局变量

.symtab

符号表,存放在程序中被定义和引用的函数和全局变量的信息

.rel.text

当链接器吧这个目标文件和其他文件结合时,.text节中的信息需修改

.rel.data

被模块定义和引用的任何全局变量的信息

.debug

一个调试符号表。

.line

原始C程序的行号和.text节中机器指令之间的映射

.strtab

一个字符串表,其内容包含.systab和.debug节中的符号表

对于static类型的变量,gcc编译器在.data和.bss中为每个定义分配空间,并在.symtab节中创建一个有唯一名字的本地链接器符号。对于malloc而来的变量存储在堆(heap)中,局部变量都存储在栈(stack)中。

下面我们以实际的例子来分析变量的存储:

#include<stdio.h> #include<string.h> #include<stdlib.h>   int z = 9; int a; static int b =10; static int c; void swap(int* x,int* y) { int temp; temp=*x; *x=*y; *y=temp; }     int main() { int x=4,y=5; swap(&x,&y); printf(“x=%d,y=%d,z=%d,w=%d/n”,x,y,z,b); return 0; }

根据以上题目和理论知识,我们可以推断出:

变量

存储区域

a

.bss

b

.data

c

.bss

x

stack

y

stack

temp

stack

z

.data

swap

.text

main

.text

x=……

.rodata

我们将从汇编代码和符号表中来分析以上答案是否正确。我们首先来看该程序的汇编代码:

.file "var.c" .globl z        .data     #数据段        .align 4        .type       z, @object        .size z, 4 z:        .long       9        .align 4        .type       b, @object        .size b, 4 b:        .long       10        .text     #代码段 .globl swap        .type       swap, @function swap:        pushl       %ebp        movl       %esp, %ebp        subl $4, %esp        movl       8(%ebp), %eax        movl       (%eax), %eax        movl       %eax, -4(%ebp)        movl       8(%ebp), %edx        movl       12(%ebp), %eax        movl       (%eax), %eax        movl       %eax, (%edx)        movl       12(%ebp), %edx        movl       -4(%ebp), %eax        movl       %eax, (%edx)        leave        ret        .size swap, .-swap        .section   .rodata     #只读段 .LC0:        .string     "x=%d,y=%d,z=%d,w=%d/n"        .text           #代码段 .globl main        .type       main, @function main:        pushl       %ebp        movl       %esp, %ebp        subl $40, %esp        andl $-16, %esp        movl       $0, %eax        subl %eax, %esp        movl       $4, -4(%ebp)        movl       $5, -8(%ebp)        leal   -8(%ebp), %eax        movl       %eax, 4(%esp)        leal   -4(%ebp), %eax        movl       %eax, (%esp)        call swap        movl       b, %eax        movl       %eax, 16(%esp)        movl       z, %eax        movl       %eax, 12(%esp)        movl       -8(%ebp), %eax        movl       %eax, 8(%esp)        movl       -4(%ebp), %eax        movl       %eax, 4(%esp)        movl       $.LC0, (%esp)        call printf        movl       $0, %eax        leave        ret        .size main, .-main        .comm    a,4,4        .local       c        .comm    c,4,4        .section   .note.GNU-stack,"",@progbits        .ident      "GCC: (GNU) 3.3.5 (Debian 1:3.3.5-13)"

通过以上汇编代码可以发现,z和b在.data段,main和swap在.text段,a和c在.bss段,x,y,temp在stack中,printf函数所打印的字符串在.rodata中。

下面我们在通过符号表来解释变量的存储。

每个可重定位目标文件都有一个符号表,它包含该文件所定义和引用的符号的信息。在链接器的上下文中,有三种不同的符号:

1. 由该文件定义并能被其他模块引用的全局符号。即非静态的C函数和非静态的全局变量,如程序中的a,z,swap。

2. 由其他模块定义并被该文件引用的全局符号。用extern关键字所定义的变量和函数。

3. 只被该文件定义和引用的本地符号。用static关键字定义的函数和变量。如程序中的b和c。

该程序所对应的符号表如图所示:

图 2符号表

首先,我们解释上图中各字段的含义:

字段名

含义

Num

序号

Value

符号地址。 可重定位目标文件:距定义目标文件的节的起始位置的偏移 可执行目标文件:一个绝对运行的地址

Size

目标的大小

Type

要么是数据,要么是函数,或各个节的表目

Bind

符号是全局的还是本地的

Vis

目前还没有查到资料,待以后改正

Ndx

通过索引来表示每个节 ABS:不该被重定位的符号 UND:代表未定义的符号(在其他地方定义) COM:未初始化的数据目标

Name

指向符号的名字

对于变量b和z,Ndx索引为3,我们观察图1,不难发现索引3对应的是.data段。变量c对应的索引为4(.bss段),变量a对应的索引是COM,最终当该程序被链接时,它将做为一个.bss目标分配。我们从反汇编代码中,对于变量a和c都是.comm(反汇编代码中以“.”开头的行,是指导汇编器和链接器运行的命令):

……        .comm    a,4,4        .local       c        .comm    c,4,4        ……

注意:a所对应的Bind为GLOBAL,即为全局变量,虽然变量c也在.bss段中,但Bind却是LOCAL,则为本地变量。.data段中的变量b和c也是类似的情况。swap和main都在索引1所对应的.text段中。由于printf是在库中所定义的,所以索引为UND。

符号表中不包含对应于本地非静态程序变量中的任何符号。这些符号是在栈中被管理的,所以符号表中没有出现x,y,temp符号。

相信大家读完这篇文章以后,再也用不着对类似的题目胆战心惊了。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 构造函数浅析

    构造函数浅析<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" ...

    ternturing
  • 拥抱变化—— 可扩展性杂谈

                                                                                    ...

    ternturing
  • 很幽默的讲解六种Socket I/O模型

    信息来源:幻影论坛     作  者: flyinwuhan (制怒·三思而后行)

    ternturing
  • 通过汇编一个简单的C程序,分析汇编代码理解计算机工作原理

      首先从main函数开始分析,18行将ebp推入栈中,19行中将esp的值赋给ebp(左边值赋给右边),20行开辟4个字节(32位)的栈空间给后面的局部变量7...

    De4dCr0w
  • 理解协程的实现

    glibc提高的功能类似早期setjmp和longjmp。本质上是保存当前的执行上下文到一个变量中,然后去做其他事情。在某个时机再切换回来。从上面函数的名字中,...

    theanarkh
  • 新科图灵奖得主、体系结构宗师David Patterson亲述开挂的人生

    【导读】ACM刚刚公布了2018年的图灵奖得主,计算机体系结构大师John Hennessy和David Patterson两人共同获得此殊荣。ACM的颁奖词这...

    新智元
  • ElementUI获取子组件验证结果

    ​ 尽管有 prop 和事件,但是有时仍然需要在 JavaScript 中直接访问子组件。为此可以使用 ref 为子组件指定一个引用 ID。ref 被用来给...

    奋飛
  • 博弈论进阶之Every-SG

    Every-SG 给定一张无向图,上面有一些棋子,两个顶尖聪明的人在做游戏,每人每次必须将可以移动的棋子进行移动,不能移动的人输 博弈分析 题目中的要求实...

    attack
  • 云原生 - Istio可观察性之监控(四)

    如前所述,业务微服务化后,每个单独的微服务可能会有很多副本,多个版本,这么多微服务之间的相互调用、管理和治理非常复杂,Istio统一封装了这块内容在代理层,最终...

    justmine
  • 使用Thinkpad的时候,禁用touchpad的方法

    在使用Thinkpad呆touchpad的时候,使用红点的时候手不小心会碰到touchpad,很烦,所以可以先禁用,效果很好

    用户3765803

扫码关注云+社区

领取腾讯云代金券