文章目录
- 预处理
- #define
- 新版本特性
- 旧版本特性
- #define除了定义明示常量的其他用途
- #define的组成
- #define本身:预处理指令
- 宏
- 替换列表或替换体
- 宏展开
- 参考资料
预处理
在预处理之前,编译器必须对该程序进行一些翻译处理。首先,编译器
把源代码中出现的字符映射到源字符集。该过程处理多字节字符和三字符序
列——字符扩展让C更加国际化。
第二,编译器定位每个反斜杠后面跟着换行符的实例,并删除它们。也
就是说,把下面两个物理行(physical line):
printf("That's wond\
erful!\n");
转换成一个逻辑行(logical line):
printf("That's wonderful\n!");
注意,在这种场景中,“换行符”的意思是通过按下Enter键在源代码文件
中换行所生成的字符,而不是指符号表征\n。
由于预处理表达式的长度必须是一个逻辑行,所以这一步为预处理器做
好了准备工作。一个逻辑行可以是多个物理行。
第三,编译器把文本划分成预处理记号序列、空白序列和注释序列(记
号是由空格、制表符或换行符分隔的项)。
这里要注意的是,编译器将用一个空格字符替换每一条注释。因此,下面的代码:
int/* 这看起来并不像一个空格*/fox;
将变成:
int fox;
而且,实现可以用一个空格替换所有的空白字符序列(不包括换行符)。最后,程序已经准备好进入预处理阶段,预处理器查找一行中以#号开始的预处理指令。
#define
新版本特性
#define预处理器指令和其他预处理器指令一样,以#号作为一行的开
始。ANSI和后来的标准都允许#号前面有空格或制表符,而且还允许在#和
指令的其余部分之间有空格。
旧版本特性
但是旧版本的C要求指令从一行最左边开始,而且#和指令其余部分之间不能有空格。指令可以出现在源文件的任何地方,其定义从指令出现的地方到该文件末尾有效。
#define除了定义明示常量的其他用途
我们大量使用#define指令来定义明示常量(manifest constant)(也叫做符号常量),但是该指令还有许多其他用途。
以下程序演示了#define指令的一些用法和属性。
预处理器指令从#开始运行,到后面的第1个换行符为止。也就是说,指令的长度仅限于一行。然而,前面提到过,在预处理开始前,编译器会把多行物理行处理为一行逻辑行。
/* preproc.c -- 简单的预处理示例 */
#include <stdio.h>
#define TWO 2 /* 可以使用注释 */
#define OW "Consistency is the last refuge of the unimagina\
tive.- Oscar Wilde" /* 反斜杠把该定义延续到下一行 */
#define FOUR TWO*TWO
#define PX printf("X is %d.\n", x)
#define FMT "X is %d.\n"
int main(void)
{int x = TWO;PX;x = FOUR;printf(FMT, x);printf("%s\n", OW);printf("TWO: OW\n");return 0;
}
输出:
运行该程序示例后,输出如下:
X is 2.
X is 4.
Consistency is the last refuge of the unimaginative.- Oscar Wilde
TWO: OW
下面分析具体的过程。下面的语句:
int x = TWO;
变成了:
int x = 2;
2代替了TWO。而语句:
PX;
变成了:
printf("X is %d.\n", x);
这里同样进行了替换。这是一个新用法,到目前为止我们只是用宏来表
示明示常量。从该例中可以看出,宏可以表示任何字符串,甚至可以表示整
个 C 表达式。但是要注意,虽然 PX 是一个字符串常量,它只打印一个名为
x的变量。
下一行也是一个新用法。读者可能认为FOUR被替换成4,但是实际的
过程是:
x = FOUR;
变成了:
x = TWO*TWO;
即是:
x = 2*2;
宏展开到此处为止。由于编译器在编译期对所有的常量表达式(只包含
常量的表达式)求值,所以预处理器不会进行实际的乘法运算,这一过程在
编译时进行。预处理器不做计算,不对表达式求值,它只进行替换。
#define的组成
每行#define(逻辑行)都由3部分组成。
#define本身:预处理指令
第1部分是#define指令本身。
宏
第2部分是选定的缩写,也称为宏。有些宏代表值(如本例),这些宏被称为
类对象宏(object-like macro)。C 语言还有类函数宏(function-like
macro),稍后讨论。宏的名称中不允许有空格,而且必须遵循C变量的命
名规则:只能使用字符、数字和下划线(_)字符,而且首字符不能是数
字。
替换列表或替换体
第3部分(指令行的其余部分)称为替换列表或替换体(见图)。
宏展开
一旦预处理器在程序中找到宏的示实例后,就会用替换体代替该宏(也有例外,稍后解释)。从宏变成最终替换文本的过程称为宏展开(macro expansion)。
注意,可以在#define行使用标准C注释。如前所述,每条注释都会被一个空格代替。
参考资料
《C Primer Plus》