Chinaunix首页 | 论坛 | 博客
  • 博客访问: 124418
  • 博文数量: 43
  • 博客积分: 2511
  • 博客等级: 少校
  • 技术积分: 420
  • 用 户 组: 普通用户
  • 注册时间: 2009-08-25 12:28
文章分类

全部博文(43)

文章存档

2010年(15)

2009年(28)

我的朋友

分类: LINUX

2009-09-02 16:24:53

gcc的编译流程分为四个步骤,分别为:
· 预处理(Pre-Processing)
· 编译(Compiling)
· 汇编(Assembling)
· 链接(Linking)

下面就具体来查看一下gcc是如何完成四个步骤的。

hello.c源代码

#include
int main()
{
   printf("Hello World!\n");
   return 0;
}

(1)预处理阶段

在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用gcc的选项”-E”进行查看,该选项的作用是让gcc在预处理结束后停止编译过程。

《深入理解计算机系统》中是这么说的:
    预处理器(cpp)根据以字符#开头的命令(directives),修改原始的C程序。如hello.c中#include 指令告诉预处理器读系统头文件stdio.h的内容,并把它直接插入到程序文本中去。结果就得到另外一个C程序,通常是 以.i作为文件扩展名的。
  
注意:
        Gcc指令的一般格式为:Gcc [选项] 要编译的文件 [选项] [目标文件]
其中,目标文件可缺省,Gcc默认生成可执行的文件名为:编译文件.out

[gan@localhost gcc]# gcc –E hello.c –o hello.i
选项”-o”是指目标文件,”.i”文件为已经过预处理的C原始程序。以下列出了hello.i文件的部分内容:

typedef int (*__gconv_trans_fct) (struct __gconv_step *,
         struct __gconv_step_data *, void *,
         __const unsigned char *,
         __const unsigned char **,
         __const unsigned char *, unsigned char **,
         size_t *);



# 2 "hello.c" 2

int main()
{
printf("Hello World!\n");
return 0;
}

由此可见,gcc确实进行了预处理,它把”stdio.h”的内容插入到hello.i文件中。

(2)编译阶段

接 下来进行的是编译阶段,在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成 汇编语言。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。汇编语言是非常有用的,它为不同高级语言不同编译器提供了 通用的语言。如:C编译器和Fortran编译器产生的输出文件用的都是一样的汇编语言。

[gan@localhost gcc]# gcc –S hello.i –o hello.s
以下列出了hello.s的内容,可见Gcc已经将其转化为汇编了,感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。
     .file   "hello.c"
     .section    .rodata
     .align 4

.LC0:
     .string     "Hello World!"
     .text
.globl main
     .type main, @function
main:
     pushl %ebp
     movl %esp, %ebp
     subl $8, %esp
     andl $-16, %esp
     movl $0, %eax

     addl $15, %eax
     addl $15, %eax
     shrl $4, %eax
     sall $4, %eax
     subl %eax, %esp
     subl $12, %esp
     pushl $.LC0

     call puts
     addl $16, %esp
     movl $0, %eax
     leave
     ret
     .size   main, .-main
     .ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
     .section    .note.GNU-stack,"",@progbits


(3)汇编阶段

汇编阶段是把编译阶段生成的”.s”文件转成目标文件,读者在此可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码了。如下所示:
[gan@localhost gcc]# gcc –c hello.s –o hello.o

(4)链接阶段

在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。

读 者可以重新查看这个小程序,在这个程序中并没有定义”printf”的函数实现,且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有定 义函数的实现,那么,是在哪里实现”printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了,在没有特 别指定时,gcc会到系统默认的搜索路径”/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数”printf” 了,而这也就是链接的作用。

函数库一般分为静态库和动态库两种。静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成 的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”。动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在 程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。gcc在编译时 默认使用动态库。

完成了链接之后,gcc就可以生成可执行文件,如下所示。

[gan@localhost gcc]# gcc hello.o –o hello

运行该可执行文件,出现正确的结果如下。
[root@localhost Gcc]# ./hello
Hello World!


在采用模块化的设计思想进行软件开发时,通常整个程序是由多个 源文件组成的,相应地也就形成了多个编译单元,使用GCC能够很好地管理这些编译单元。假设有一个由foo1.c和foo2.c两个源文件组成的程序,为 了对它们进行编译,并最终生成可执行程序foo,可以使用下面这条命令:
# gcc foo1.c foo2.c -o foo
如果同时处理的文件不止一个,GCC仍然会按照预处理、编译和链接的过程依次进行。如果深究起来,上面这条命令大致相当于依次执行如下三条命令:
# gcc -c foo1.c -o foo1.o
# gcc -c foo2.c -o foo2.o
# gcc foo1.o foo2.o -o foo
在编译一个包含许多源文件的工程时,若只用一条GCC命令来完 成编译是非常浪费时间的。假设项目中有100个源文件需要编译,并且每个源文件中都包含 10000行代码,如果像上面那样仅用一条GCC命令来完成编译工作,那么GCC需要将每个源文件都重新编译一遍,然后再全部连接起来。很显然,这样浪费 的时间相当多,尤其是当用户只是修改了其中某一个文件的时候,完全没有必要将每个文件都重新编译一遍,因为很多已经生成的目标文件是不会改变的。要解决这 个问题,关键是要灵活运用GCC,同时还要借助像Make这样的工具。

阅读(731) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~