来了解一下GCC编译器编译C可执行脚本的过程

码中飞翔 2019-06-26

GCC简介
Linux系统下的gcc(GNU C Compiler)是GNU推出的功能强大、性能优越的多平台编译器,是GNU的代表作品之一。gcc是可以在多种硬体平台上编译出可执行程序的超级编译器,其执行效率与一般的编译器相比平均效率要高20%~30%。gcc编译器能将C、C++语言源程序、汇程式化序和目标程序编译、连接成可执行文件,如果没有给出可执行文件的名字,gcc将生成一个名为a.out的文件。
在Linux系统中,可执行文件没有统一的后缀,系统从文件的属性来区分可执行文件和不可执行文件。而gcc则通过后缀来区别输入文件的类别,下面我们来介绍gcc所遵循的部分约定规则。

.c为后缀的文件,C语言源代码文件;
.a为后缀的文件,是由目标文件构成的档案库文件;
.C,.cc或.cxx 为后缀的文件,是C++源代码文件;
.h为后缀的文件,是程序所包含的头文件;
.i 为后缀的文件,是已经预处理过的C源代码文件;
.ii为后缀的文件,是已经预处理过的C++源代码文件;
.m为后缀的文件,是Objective-C源代码文件;
.o为后缀的文件,是编译后的目标文件;
.s为后缀的文件,是汇编语言源代码文件;

gcc的执行过程
虽然我们称gcc是C语言的编译器,但使用gcc由C语言源代码文件生成可执行文件的过程不仅仅是编译的过程,而是要经历四个相互关联的步骤∶预处理(也称预编译,Preprocessing)、编译(Compilation)、汇编(Assembly)和连接(Linking)。命令gcc首先调用cpp进行预处理,在预处理过程中,对源代码文件中的文件包含(include)、预编译语句(如宏定义define等)进行分析。接着调用cc1进行编译,这个阶段根据输入文件生成以.o为后缀的目标文件。汇编过程是针对汇编语言的步骤,调用as进行工作,一般来讲,.S为后缀的汇编语言源代码文件和汇编、.s为后缀的汇编语言文件经过预编译和汇编之后都生成以.o为后缀的目标文件。当所有的目标文件都生成之后,gcc就调用ld来完成最后的关键性工作,这个阶段就是连接。在连接阶段,所有的目标文件被安排在可执行程序中的恰当的位置,同时,该程序所调用到的库函数也从各自所在的档案库中连到合适的地方。

来了解一下GCC编译器编译C可执行脚本的过程
一、预处理(生成预编译文件 ,.i文件)

gcc –E hello.c –o hello.i   //一定.c作为后缀,让gcc识别

预处理过程主要处理那些源代码中以#开始的预编译指令,主要处理规则如下:
①将所有的#define删除,并且展开所有的宏定义;
②处理所有条件编译指令,如#if,#ifdef等;
③处理#include预编译指令,将被包含的文件插入到该预编译指令的位置。该过程递归进行,及被包含的文件可能还包含其他文件。
④删除所有的注释//和 /**/;
⑤添加行号和文件标识,如#2 “hello.c” 2,以便于编译时编译器产生调试用的行号信息及用于编译时产生编译错误或警告时能够显示行号信息;
⑥保留所有的#pragma编译器指令,因为编译器须要使用它们;

二、编译(生成预编译文件 ,.s文件)

gcc –S hello.i –o hello.s    //可以不用指定名字,默认生成一个.s文件

编译过程就是把预处理完的文件进行一系列词法分析,语法分析,语义分析及优化后生成相应的汇编代码文件。

三、汇编(生成汇编代码,.o文件)

gcc –c hello.s –o hello.o  //可以不指定,默认生成.o的文件

汇编器是将汇编代码转变成机器可以执行的命令,每一个汇编语句几乎都对应一条机器指令。

四、链接(生成可执行文件)

gcc hello.o –o hello

链接器ld将各个目标文件组装在一起,解决符号依赖,库依赖关系,并生成可执行文件。

假定我们有一个程序名为hello.c的C语言源代码文件,要生成一个可执行文件,最简单的办法就是∶

gcc hello.c -o myhello //一步即可完成

这时,预编译、编译连接一次完成,生成一个系统预设的名为myhello.out的可执行文件。

相关推荐