道哥的第 031 篇原创
这几天在把一个嵌入式项目的代码,移植到另一个平台,发现很多地方用的都是 C89 标准。
1999 年,C语言的标准化委员会发布了 C99 标准,引入了许多特性,包括可变长度的数组、灵活的数组成员(用在结构体)、对IEEE754浮点数的改进、指定成员的初始化器、内联函数、支持不定参数个数的宏定义,在数据类型上还增加了 long long int 以及复数类型。
于是最近找了一本比较新的 C 语言书籍翻了一下,发现很多比较偏僻的语法,很少被使用到,包括 C99 标准中的一些内容,所以我想把这部分内容整理一下,也是让自己对这一门古老的语言重新梳理一下。
先不解释概念,我们先来看一个代码示例:
// 一个结构体,成员变量 data 是指针
typedef struct _Data1_ {
int num;
char *data;
} Data1;
void demo6_not_good()
{
// 打印结构体的内存大小
int size = sizeof(Data1);
printf("size = %d \n", size);
// 分配一个结构体指针
Data1 *ams = (Data1 *)malloc(size);
ams->num = 1;
// 为结构体中的 data 指针分配空间
ams->data = (char *)malloc(1024);
strcpy(ams->data, "hello");
printf("ams->data = %s \n", ams->data);
// 打印结构体指针、成员变量的地址
printf("ams = 0x%x \n", ams);
printf("ams->num = 0x%x \n", &ams->num);
printf("ams->data = 0x%x \n", ams->data);
// 释放空间
free(ams->data);
free(ams);
}
在我的电脑上,打印结果如下:
可以看到:该结构体一共有 8 个字节(int 型占 4 个字节,指针型占 4 个字节)。
结构体中的 data
成员是一个指针变量,需要单独为它申请一块空间才可以使用。而且在结构体使用之后,需要先释放 data
,然后释放结构体指针 ams
,顺序不能错。这样使用起来,是不是有点麻烦?
于是,C99 标准就定义了一个语法:flexible array member(柔性数组),直接上代码(下面的代码如果编译时遇到警告,请检查下编译器对这个语法的支持):
// 一个结构体,成员变量是未指明大小的数组
typedef struct _Data2_ {
int num;
char data[];
} Data2;
void demo6_good()
{
// 打印结构体的大小
int size = sizeof(Data2);
printf("size = %d \n", size);
// 为结构体指针分配空间
Data2 *ams = (Data2 *)malloc(size + 1024);
strcpy(ams->data, "hello");
printf("ams->data = %s \n", ams->data);
// 打印结构体指针、成员变量的地址
printf("ams = 0x%x \n", ams);
printf("ams->num = 0x%x \n", &ams->num);
printf("ams->data = 0x%x \n", ams->data);
// 释放空间
free(ams);
}
打印结果如下:
与第一个例子中有下面几个不同点:
是不是用起来简单多了?!这就是柔性数组的好处。
从语法上来说,柔性数组就是指结构体中最后一个元素个数未知的数组,也可以理解为长度为 0,那么就可以让这个结构体称为可变长的。
前面说过,数组名就代表一个地址,是一个不变的地址常量。在结构体中,数组名仅仅是一个符号而已,只代表一个偏移量,不会占用具体的空间。
另外,柔性数组可以是任意类型。这里示例大家多多体会,在很多通讯类的处理场景中,常常见到这种用法。
宏定义的参数个数可以是不确定的,就像调用 printf 打印函数一样,在定义的时候,可以使用三个点(...)来表示可变参数,也可以在三个点的前面加上可变参数的名称。
如果使用三个点(...)来接收可变参数,那么在使用的时候就需要使用 VA_ARGS 来表示可变参数,如下:
#define debug1(...) printf(__VA_ARGS__)
debug1("this is debug1: %d \n", 1);
如果在三个点(...)的前面加上了一个参数名,那么在使用时就一定要使用这个参数名,而不能使用 VA_ARGS 来表示可变参数,如下:
#define debug2(args...) printf(args)
debug2("this is debug2: %d \n", 2);
但是,如果可变参数个数为零时,处理可能就会出问题!
看一下这个宏:
#define debug3(format, ...) printf(format, __VA_ARGS__)
debug3("this is debug4: %d \n", 4);
编译、执行都没有问题。但是如果这样来使用宏:
debug3("hello \n");
编译的时候,会出现错误: error: expected expression before ‘)’ token
。为什么呢?
看一下宏扩展之后的代码(__VA_ARGS__
为空):
printf("hello \n",);
看出问题了吧?在格式化字符串的后面多了一个逗号!为了解决问题,预处理器给我们提供了一个方法:通过 ## 符号把这个多余的逗号给自动删掉。
于是宏定义改成下面这样就没有问题了。
#define debug3(format, ...) printf(format, ##__VA_ARGS__)
类似的,如果自己定义了可变参数的名字,也在前面加上 ##,如下:
#define debug4(format, args...) printf(format, ##args)
这篇文章仅仅是开篇,后续我会继续搜集资料,最终目标是想把 C 语言中的语法和使用,汇总成一个小册子,希望自己能坚持下去!