链接器和装入器的基本工作原理-zhxw123-ChinaUnix博客

:
03    0:   55                      push   %ebp
04    1:   89 e5                   mov    %esp,%ebp
05    3:   83 ec 04                sub    $0x4,%esp
06    6:   a1 00 00 00 00          mov    0x0,%eax
07    7: R_386_32     j
08    b:   50                      push   %eax
09    c:   a1 00 00 00 00          mov    0x0,%eax
10    d: R_386_32     i
11   11:   50                      push   %eax
12   12:   e8 fc ff ff ff          call   13
13   13: R_386_PC32 sum
14   17:   83 c4 08                add    $0x8,%esp
15   1a:   89 c0                   mov    %eax,%eax
16   1c:   89 45 fc                mov    %eax,0xfffffffc(%ebp)
17   1f:   c9                      leave
18   20:   c3                      ret

$ nm f.o
00000000 T sum

以sum为例，对函数sum的调用是通过call指令实现的，使用IP相对寻址方式。可以看到，在目标文件m.o中，call指令位于从零开始的相对地址 12的位置，这里存放的e8是call的操作码，而从13开始的4个字节存放着sum相对call的下一条指令add的偏移。显然，在链接之前这个偏移量是不知道的，所以将来要来修改13这里的代码。那现在这里为什么存放着0xfffffffc（注意Intel的CPU使用little endian的编址方式）呢？这大概是出于安全的考虑，因为0xfffffffc正是－4的补码表示（读者可以在gdb中使用p /x -4查看），而call指令本身占用了5个字节，因此无论如何call指令中的偏移量不可能是－4。我们再看看重定位之后call指令中的这个偏移量被修改成了什么：

$ gcc m.o f.o
$ objdump -dj .text a.out | less
Disassembly of section .text:
......
080482c4

:
......
80482d6: e8 0d 00 00 00 call 80482e8
80482db: 83 c4 08 add $0x8,%esp
......
080482e8 :
......

$ nm a.out
08049468 d _DYNAMIC
0804953c d _GLOBAL_OFFSET_TABLE_
0804844c R _IO_stdin_used
---------w _Jv_RegisterClasses
08049458 d __CTOR_END__
08049454 d __CTOR_LIST__
08049460 d __DTOR_END__
0804945c d __DTOR_LIST__
08048450 r __FRAME_END__
08049464 d __JCR_END__
08049464 d __JCR_LIST__
08049564 A __bss_start
08049550 D __data_start
08048400 t __do_global_ctors_aux
080482f0 t __do_global_dtors_aux
08049554 D __dso_handle
---------w __gmon_start__
080483fa T __i686.get_pc_thunk.bx
08049454 d __init_array_end
08049454 d __init_array_start
08048390 T __libc_csu_fini
080483a0 T __libc_csu_init
---------U __libc_start_main@@GLIBC_2.0
08049564 A _edata
08049568 A _end
0804842c T _fini
08048448 R _fp_hw
08048254 T _init
080482c0 T _start
08049564 b completed.5843
08049550 W data_start
08048320 t frame_dummy
0804955c D i
08049560 D j
08048344 T main
08049558 d p.5841
0804837c T sum

可以看到经过重定位之后，call指令中的偏移量修改成0x0000000d了，简单的计算告诉我们：
0x080482e8 - 0x80482db = 0xd。这样，经过重定位之后最终的可执行程序就生成了。

可执行程序生成后，下一步就是将其装入内存运行。Linux下的编译器（C语言）是cc1，汇编器是as，链接器是ld，但是并没有一个实际的程序对应装入器这个概念。实际上，将可执行程序装入内存运行的功能是由execve(2)这一系统调用实现的。简单来讲，程序的装入主要包含以下几个步骤：

读入可执行文件的头部信息以确定其文件格式及地址空间的大小；
以段的形式划分地址空间；
将可执行程序读入地址空间中的各个段，建立虚实地址间的映射关系；
将bbs段清零；
创建堆栈段；
建立程序参数、环境变量等程序运行过程中所需的信息；
启动运行。